日前,美国人工智能研究公司OpenAI发布了首个视频生成模型“Sora” ,该模型可以根据文本内容生成长约1分钟的视频,这也是人工智能领域一项重要的突破。
OpenAI在官网上详细介绍了Sora的功能和特点,称其能够生成包含多个角色、特定类型运动以及精确主题和背景细节的复杂场景。该模型不仅能够理解用户在文本提示中所要求的内容,更能将这些事物与现实世界中的存在方式相结合,呈现出逼真的视频效果。
此外,Sora还可以根据静态图片生成动画,并且对现有视频进行扩展,延伸画面的同时保持视觉风格的一致性。
作为展示,OpenAI发布了由Sora生成的视频,比如一名女足漫步在东京街头。在这则片段中,无论是主人公还是她身后的背景人群,动作都非常自然流畅。人物面部的细节刻画,也很细腻逼真,基本没有什么违和、突兀的感觉。
不过,OpenAI也坦承目前Sora也存在一定的弱点,它可能难以准确模拟复杂场景中的物理现象,也可能无法理解具体的因果关系。例如,一个人可能会咬一口饼干,但咬过之后,饼干上可能就没有咬痕了。
不管怎样,Sora的问世震撼了整个科技圈。一时间“Sora会砸掉谁的饭碗?”成为热议的话题,短视频和影视行业自然首当其冲。
一众大佬也是先后发声。马斯克就发文写道“gg humans”,意思是人类认输了,心服口服。Sora官号则互动道:现在开始由我们来接管。
还有网友将Sora和特斯拉FSD联系中一起,称二者之间有很多关联,马斯克也回应:“特斯拉用精确物理原理生成真实世界视频大约有一年了。这还不算什么超有趣的事情,因为所有的训练数据都来自汽车,所以它看起来就像特斯拉的视频,尽管它也是动态生成的(而不是记忆的)世界。我们的 FSD 训练计算能力不足,所以还没有使用其他视频进行训练,但当然可以。今年晚些时候,当我们有空余能力时,就会进行训练。”
360创始人周鸿祎也发文《Sora意味着实现通用人工智能可能从10年缩短至1年》。
此外,周鸿祎在直播还谈到了中美在AI领域之间的差距。他表示,国内的水平离OpenAI至少还有1年以上的差距,并且认为除了GPT5外,OpenAI还有其他的“秘密武器”没有亮出来,那么中国跟美国AI的差距不仅没有缩小,反而还在加大。
不过,周鸿祎并不看好Sora在短期可以颠覆短视频甚至影视行业。周鸿祎表示,目前Sora具备了产生优质片段的能力,但不具备讲述好一个完整故事的能力。它更可能成为传统影视业有力的生产力工具,从而去激发更多人的创造力,这也给普通人提供了更多可能性。
作者:MANU
来源:第一电动网(www.d1ev.com)