萌主正坐在自己的工作室里,盯着屏幕上的空白编辑框,心中充满了期待。作为一个视频创作者,她一直在寻找能够提升创作效率的新工具。这时,她听说了一种叫做 AI 视频生成模型的新技术,能够在短时间内生成高质量的视频。这简直是个天大的好消息!
今年年初,Sora 的亮相引起了全球轰动。Sora 是一种革命性的 AI 视频生成模型,能够快速生成高质量的视频。这一消息迅速传开,许多科技公司也纷纷推出自己的 AI 视频生成产品。旧金山的 Luma 推出了 DreamMachine 视频生成模型,免费供用户试用;而 Runway 则推出了 Gen-3 Alpha 模型,宣称能生成电影级别的光影效果。
国内的科技公司也不甘落后。快手推出的可灵 Web 端可以生成长达 10 秒的视频内容,并具备首尾帧控制和相机镜头控制功能。他们的 AI 奇幻短剧《山海奇镜之劈波斩浪》就是通过 AI 完全生成的。同样,字节旗下的 AI 视频产品即梦也制作了科幻短剧《三星堆:未来启示录》,引起了广泛关注。
工具介绍:
虽然 AI 视频技术在短时间内取得了显著的进步,但实际应用中仍存在许多挑战。当前的 AI 视频产品大多处于内测阶段,用户想要使用这些工具还需要排队申请,或者需要一定的技术知识。
各大公司推出的 AI 视频产品,操作方式和功能差异不大:用户通过文字生成指令,选择画幅大小、图像清晰度、生成风格和生成时长,然后点击一键生成。虽然生成过程看似简单,但背后的技术难度却不容小觑。
AI 视频的生成质量主要取决于训练过程中使用的素材质量和计算能力。目前,国内外大多数 AI 视频工具支持生成 480p 或 720p 的视频,少数能够支持 1080p 高清视频。然而,高质量素材和算力并不总是能直接转化为高质量的视频。低分辨率素材训练的模型在生成高分辨视频时可能会出现图像崩坏或重复的情况。
生成长时间的视频内容也是一大难题。虽然从技术上可以要求 AI 不断输出视频,但目前大部分 AI 视频产品只能生成 2-3 秒的短视频,能够达到 5-10 秒的产品已经相当出色。Sora 曾宣称可以生成最长 60 秒的视频,但具体表现如何还有待验证。为了更好地理解 AI 视频生成的实际效果,我们测试了五款国内比较热门的免费 AI 视频产品:即梦、MorphStudio、PixVerse、艺映 AI 和 VegaAI。我们给它们同样的文字指令:“一个穿着红裙子的小女孩,在公园里,喂一只白色的小兔子吃胡萝卜。”
测试结果显示,这些产品在生成速度上都表现不错,仅需 2-3 分钟,但生成的视频质量却差异显著。即梦的生成时长最长,但质量不高,主角小女孩在视频后期变形。VegaAI 也有类似的问题。PixVerse 的画质较差。MorphStudio 生成的内容准确但视频仅有 2 秒。艺映 AI 的画质较好,但对文字理解不准确,生成的视频中丢失了兔子这一关键元素,且整体风格偏漫画。
AI 视频技术的进化速度并不如预期般快,主要原因在于视频生成技术的复杂性。视频生成需要在时间轴上保持一致性和连贯性,同时确保高质量的画面和内容。这对 AI 算法和模型提出了更高的要求。
目前,AI 视频生成的主要技术挑战包括准确性、一致性和丰富性。准确性要求 AI 能够准确理解并生成预期内容。一致性指的是视频中各元素在时空上的一致性和连贯性。丰富性则指 AI 能够生成合理的细节内容,即便没有明确的文字提示。
尽管目前 AI 视频技术在生成质量和应用场景上仍有诸多限制,但其潜力不容忽视。随着技术的不断进步,AI 视频生成有望在影视、广告、教育等领域实现更广泛的应用。AI 视频的未来充满了无限可能。或许有一天,我们在电影院看到的每一帧画面,都是 AI 为我们精心创作的杰作。正如一位业内专家所言:“AI 不会取代人类的创造力,但会成为人类创造力的强大助手。”