2月16日,OpenAI发布了自己的首个AI视频生成模型——Sora。
人们吹爆它“炸裂”、“史诗级”、“现实不存在了”,视觉生成领域将有一次大的技术和商业革命即将到来!
简单来说,通过文本指令,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。
先给大家看一下Sora生成的视频效果:
指令:一位时尚的女士走在亮着霓虹灯和广告牌的东京街头。她穿着黑色皮夹克、红色长裙和黑色靴子,手提一只黑色包包。她戴着太阳镜,涂着红色口红。她走路既自信又随意。街道潮湿,地面上的水能够像镜面一样反射色彩斑斓的灯光,路上有很多行人来来往往。
指令:一段3D动画,展现一种又小又圆的毛茸茸生物在一个充满活力的、被魔法环绕的森林中探险。这种生物是兔子和松鼠的混合体,拥有柔软的蓝色皮毛和一条蓬松的带有条纹的尾巴。它沿着一条闪闪发光的小溪跳跃,眼睛充满了好奇。森林里充满了魔法元素:有发光并能变换颜色的花朵,有紫色和银色叶子的树木,以及有类似萤火虫的漂浮的光点。这个生物最终停下来与一群围绕着蘑菇跳舞的小仙子玩耍。这个生物抬头敬畏地看着一棵巨大发光树木,这棵树似乎是森林的心脏。
指令:无人机视角,海浪拍打着大苏尔加雷角海滩崎岖的悬崖。汹涌澎湃的蓝色海水掀起白色的波浪,而夕阳的金色光芒照亮了岩石海岸。远处有一个带灯塔的小岛,绿色的灌木丛覆盖着悬崖的边缘。从公路到海滩的陡峭落差是一项戏剧性的壮举,悬崖的边缘突出在海面上。这张照片捕捉到了海岸的原始美景和太平洋海岸公路崎岖的景观。
指令:中国龙的中国农历新年庆祝视频。
指令:纽约市像亚特兰蒂斯一样被淹没。鱼、鲸鱼、海龟和鲨鱼在纽约的街道上游来游去。
这些视频中的主角、背景和视觉效果都达到了惊人的一致性,各种镜头随意切换,画面流畅又稳定。
如果用一句话来形容Sora带给人们的震撼,那就是:
以前不相信是真的,现在不相信是假的。
那么sora真正强到哪里呢?
1.文本到视频生成能力
Sora能够根据用户提供的文本描述生成长达60S的视频,这些视频不仅保持了视觉品质,而且完整准确还原了用户的提示语。
2.复杂场景和角色生成能力
Sora能够生成包含多个角色、特定运动类型以及主题精确、背景细节复杂的场景。它能够创造出生动的角色表情和复杂的运镜,使得生成的视频具有高度的逼真性和叙事效果。
3.语言理解能力
Sora拥有深入的语言理解能力,能够准确解释提示并生成能表达丰富情感的角色。这使得模型能够更好地理解用户的文本指令,并在生成的视频内容中忠实地反映这些指令。
4.多镜头生成能力
Sora可以在单个生成的视频中创建多个镜头,同时保持角色和视觉风格的一致性。这种能力对于制作电影预告片、动画或其他需要多视角展示的内容非常有用。
5.从静态图像生成视频能力
Sora不仅能够从文本生成视频,还能够从现有的静态图像开始,准确地动画化图像内容,或者扩展现有视频,填补视频中的缺失帧。
6.物理世界模拟能力
Sora展示了人工智能在理解真实世界场景并与之互动的能力,这是朝着实现通用人工智能(AGI)的重要一步。它能够模拟真实物理世界的运动,如物体的移动和相互作用。
对于这个王炸级技术,各路大佬纷纷为其打call。
OpenAI首席执行官,被媒体称为ChatGPT之父的Sam Altman亲自下场疯狂发推为网友生成视频。
一位戴着尖顶帽,身披绣有白色星星的蓝色长袍的巫师正在施法,他的一只手射出闪电,另一只手中拿着一本旧书。
在一间拥有电影级灯光设置的充满托斯卡纳乡村风情的厨房里,一位擅长利用社交媒体的奶奶,正在教你制作美味的自制诺奇面。
虽然Sora展现出了强大的能力,但现阶段它还不够完美。
《麻省理工科技评论(MIT Technology Review)》主笔Will Douglas Heaven写道:“Sora发布出来的视频已经是从大量的成果中挑选出的佼佼者了。”但即便是这些“经过挑选的佼佼者”也不完美。
比如,下面这个“考古工作者们挖掘出一个塑料椅”的视频片段里,这个塑料椅显然有点不遵守客观的物理规律。
下面这个玻璃杯破碎的过程也不那么“科学”。
所以,Sora还有很多需要完善的地方。但毫无疑问,目前Sora展现出来的能力已经说明了,这是一条非常有前景的道路。
Sora生成的视频有细致入微的背景,和复杂的多角度镜头,乃至多个富有情感的角色。这意味着,任何一个能够用语言清晰表达的人,都能成“导演”!
颠覆不仅仅出现在影视行业,每个普通人的生活,都或将被其重塑,变得面目全非。
将来最有人气的影星、歌手、模特、网红,可能大都是Sora视频中的虚拟人物;
如果SORA普及了,众多公司也许会纷纷向网民和客户“征稿”,导致很多广告公司倒闭;
影视、直播、媒体、广告、动漫、艺术设计等数个行业都会迎来重新洗牌的机会。
——其实,类似的情况,过去也并不少见,甚至一再发生。
但与此同时,这也意味着原本的行业壁垒被打破,众多“业外人”都有了弯道超车的机遇。
我们必须时刻准备着自我革新,去适应前所未有新环境,积极拥抱新技术,否则就难免被淘汰。