2024-02-16 10:41:30 作者:姚立伟
OpenAI最新发布的Sora模型,是一款文生视频模型。该模型完美继承了DALL·E 3的画质和指令能力,并能够根据用户输入的文本描述生成长达1分钟的高清流畅视频。与真实世界场景深度模拟并互动的能力上取得了重大突破。
在以中国龙年春节为提示词生成的视频中,人群中的舞龙动作丝滑标准,还有人举起手机拍摄,整个场景细节丰富、严谨。另一段“都市丽人”漫步东京雨后街头视频中,水渍倒影逼真,霓虹灯光影效果堪比实景。如果不是标注说明,很多人可能会误以为这是由AI生成的。
目前Sora已经能生成具有多个角色、包含特定运动的复杂场景,并不仅能理解用户在提示中提出的要求,还了解这些物体在物理世界中的存在方式。然而,Sora也存在一些局限性,如难以准确模拟复杂场景的物理原理、无法理解因果关系等。
尽管如此,在视觉艺术家、设计师和电影制作人(以及OpenAI员工)获得访问权限后,已经开始不断创作新的作品展示AI生成视频的无限创意可能。虽然有些人担心这将导致许多人失业或整个素材行业衰落,但也有人认为OpenAI的进步将加速AI的发展。无论如何,这款首个视频模型的发布引起了广泛关注,并且未来发展前景令人期待。
请查看Sora官方网站获取更多信息:https://openai.com/sora