OpenAI发布Sora视频模型引发AI圈热议

2024-02-19 14:07:10作者：佚名来源：本站整理浏览：0

Sora视频模型的发布，几乎复刻了一年半之前GPT-3初登场时的AI圈盛况。毫无预兆的情况下，OpenAI在社交平台X（原推特）上发布了一条消息，首次公布了名为Sora的文本转视频模型。这个极简的介绍引起了广泛的热议和震惊，让人们重新关注起AI领域的潜力。

据介绍，Sora可以创建长达60秒的视频，包含高度详细的场景、复杂的摄像机运动以及充满活力和情感的多个角色。对于Sora的评价存在分歧，有些人百分之百认可，有些人超过百分之百认可。一位创业者认为，Sora的推出意味着通用人工智能的实现可能从10年缩短至1年，该模型展现的不仅是视频制作的能力，更是对真实世界的理解和模拟，将会带来新的突破和成果。而另一位研究科学家则将Sora称为视频生成领域的GPT-3时刻，认为它是一个“数据驱动的物理引擎”，一个可学习的模拟器或“世界模型”。马斯克则直接表示人类输了。

Sora与众不同的地方在于，它并不是编辑视频，而是在生成视频之前建模一个三维虚拟空间，然后记录这个空间的镜头。这种立体建模能展现比传统二维视频更多的信息量，从设计思路上讲，OpenAI领先于其他技术公司。在模型设计之初，OpenAI选择将图形语言转化为对应格式的图像单元"Patch"进行计算，以提高运算效率并保持模型的扩展性。在模型的前端，OpenAI借鉴了在GPT系列模型中的一些成果，将视频素材案例和对应的文字说明结合起来，通过对视频素材添加高度描述性的标题生成器和GPT的扩写功能，提高了整体视频质量。

对于OpenAI这类技术驱动型公司来说，经验和技术的积累都是加速度，团队自身对AI概念的领先理解，让OpenAI总是能站在自己的肩膀上向前推进。这种技术领先可能成为惯性，为其他竞争对手带来巨大的挑战。真正的增量仍然在于顶层设计的创新。

与其说是AI挤占了人的创新空间，不如说是AI提高了有效创新的门槛。只有通过与AI对话并超越AI创意的设计，才能在大模型时代实现有效的增量。对于OpenAI而言，他们一直在努力创造新的技术和模型，始终保持着领先的地位。

总而言之，Sora视频模型的发布引发了业界的广泛关注和热议。OpenAI以其领先的技术和创新思维，推动了AI领域的发展，并成为了众多行业的带头人。他们通过将图形语言转化为Patch单位进行计算以及使用高度描述性的标题生成器和GPT的扩写功能，为视频模型的设计和生成带来了新的思路和成果。在大模型时代，只有通过与AI对话并创造超越AI的设计，才能实现有效的增量。

上一篇：文生成视频模型Sora的深远影响

下一篇：返回列表