您的位置:首页 > 资讯 > 新闻

文生成视频模型Sora的深远影响

2024-02-19 14:03:18作者:佚名来源:本站整理浏览:0

人工智能研究公司OpenAI最近发布了一款名为"Sora"的文生成视频模型,引起了广泛关注。根据OpenAI的介绍,使用"Sora"可以通过文字指令生成长达一分钟的高清视频,视频可以包含多个角色、特定类型的运动以及精确的主题和背景细节等复杂场景。这一新技术的问世被认为可能会对广告业、电影预告片和短视频行业造成巨大的颠覆。

从OpenAI官网公布的48个视频demo来看,Sora不仅能够精确呈现细节,还可以生成具有丰富情感的角色。据OpenAI介绍,Sora能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。这款模型不仅能够理解用户的指令,还能够理解这些指令所代表的物理世界中的存在方式。

Sora之所以如此强大,是因为它依赖于大量的数据、灵活的编码、优质的标注以及Transformer+diffusion的架构。相较于之前的模型,Sora采用了全新的处理方法,不再将视频拆分为时间域和空间域,而是将整个视频一次性输入到diffusion模型中,以一次性生成出整个视频的每个细节。

AI开年丢王炸!文生视频模型Sora问世,或迎巨震? (1).png

在OpenAI的Sora之前,谷歌去年12月发布了一个名为VideoPoet的视频生成模型,可以执行文本到视频、图像到视频、视频风格化等操作。此前一夜爆红的文生视频软件Pika也引发了AI视频应用的热潮。

对于Sora的发布,360集团创始人、董事长周鸿祎表示,这意味着通用人工智能(AGI)实现的时间将从10年缩短至1年。具备文生成视频功能的视频类生成式AI能够有效降低创作者的创作门槛。

根据国海证券的研报,《AIGC/AI生成内容产业展望报告》指出,视频生成将成为近期跨模态生成领域的中高潜力场景,主流内容形式也将因不同技术而变化。英伟达高级科学家Jim Fan认为,2022年是影像之年,2023年是声波之年,2024年是视频之年。

对于Sora模型,知名企业家马斯克发表了评价,他回应一位网友的转发视频时说:“gg Pixar”,并在评论中留言,“gg humans”,展示出对这一技术的认可。

然而也有人对Sora的问世表示质疑。一些视频剪辑从业人员担心,大规模应用后可能会产生更多的垃圾内容,而创作出优秀作品的速度则可能指数级增长。另一位互联网从业人员认为,虽然Sora技术非常先进,但过早认为它会在三年后使视频拍摄完全被取代,或认为抖音和Tiktok很快会被颠覆,可能为时过早。该从业人员认为,新技术应该用来激发新的创作产能,让人与人之间产生新的连接,并尊重行业规律,在技术迭代生态的基础上进行发展,而不是将技术直接交给用户。

总的来说,OpenAI发布的文生成视频模型Sora具有巨大的潜力和颠覆性影响。它将为广告业、电影预告片和短视频行业带来前所未有的可能性。然而,对于视频创作者和整个视频行业来说,面临的挑战也是不可忽视的。如何合理应用这一技术,激发创作创新,同时避免泛滥和低质量内容的产生,将是一个需要认真思考和解决的问题。

热门新闻

更多+

精彩专题

更多+

下载排行

新游推荐

更多+

www.4399j.cc 版权所有

温馨提示:适度游戏娱乐,沉迷游戏伤身,合理安排时间,享受健康生活