当前位置:首页|资讯|艺术|Sora

不到一年时间,应届博士、00后、艺术生,这群人做出的Sora让科技圈炸翻了

作者:前沿科代表发布时间:2024-03-25

原标题:不到一年时间,应届博士、00后、艺术生,这群人做出的Sora让科技圈炸翻了

当OpenAI在2023年年初凭借ChatGPT引领了一场AI大模型的讨论热潮后,其在AI领域的每一步进展都备受瞩目。近期,OpenAI推出的文生视频大模型Sora再次引发了广泛的讨论。

从最初的惊艳亮相到如今部分AI领域专家对其的审慎评价,前后不过三天的时间,但Sora却牵动着业界的神经。

Sora的发布无疑为AI视频创作领域带来了新的可能性。其能够根据文本提示创建详细的视频,扩展现有视频中的叙述,甚至从静态图像生成场景。

这一技术在视频制作中展现出极高的实用性和创新性。然而,就在舆论对Sora充满期待时,部分业内人士却表现出了一定的紧张情绪。一些AI领域的专家认为,尽管Sora在视频生成方面取得了显著进展,但它并非完美无缺。

Sora的硬伤之一在于其并非基于因果逻辑进行视频生成。这意味着在生成视频时,Sora可能无法准确理解和模拟现实世界中的因果关系,导致生成的视频在某些情况下显得不够自然和合理。

例如,在那条东京街头漫步的视频里,女主角走路过程中就存在很明显的步伐错误、左右腿部变形等问题。如视频里有2个很明显的镜头,女主角跨出左脚,但下一帧则变成了右脚在前左脚在后。

再比如在一个人跑步的视频中,主角反向在跑步机上奔跑,在沙漠考古视频里,被发现的椅子是悬浮状态。

这些问题不仅是目前Sora难以解决的,也是目前AI视频生成技术普遍存在。尽管技术已经能够在一定程度上模拟人类的创造力,但在理解和表达复杂因果关系方面,AI仍然面临着巨大的挑战。

另外,Sora也并非是最早的文生视频模型。在OpenAI之前,已经有许多头部大模型研发商推出了自己的文生视频模型,如Google的Lumiere和Stability AI的SVD等。甚至还有一些创业公司如Runway已经开发出了更加专注于多媒体内容创作的文生视频模型,如Gen-1和Gen-2。

这些模型不仅具备视频生成能力,还能够满足视频帧插值、背景去除、模糊效果、运动追踪等多样化需求。

以Runway为例,其创始人来自纽约大学艺术学院,他们看到了AI在创造性方面的潜力,并决定开发一套服务于电影制作人、摄影师的工具。用一些评论者的话来说,Runway的发展轨迹更像是一个专注于影视制作的“横店影视城奋斗史”。他们先开发了一系列专业创作者辅助工具,随后参与到图像生成大模型的开发过程中,积累了丰富的AIGC技能。

这使得Runway能够利用AI技术为电影制作等领域提供高效、高质量的解决方案。目前,Gen-1和Gen-2已经对外开放使用,从官网的放的例子来看,制作效果还算不错,对于影视行业来说是性价比很高的拍摄和后期工具。

Sora的出现无疑为AI视频生成领域带来了新的活力和机遇,让人难以想象的是,这样一个大模型居然是由两位应届博士所带的年轻团队在不到一年的时间里完成的,这个团队里甚至还有00后和艺术生。

尽管Sora仍存在一些不足和需要改进的地方,但它的推出标志着生成式AI在视频创作方面取得了重要突破。随着技术的不断进步和创新,我们有理由相信,未来的AI视频生成将更加自然、真实和高效,为影视制作等领域带来革命性的变革。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1