Sora来了，现实不存在了？

作者：深爱榜发布时间：2024-03-10

Sora 人工智能

2022年末，OpenAI聊天机器人ChatGPT的面世无疑成为了引领人工智能浪潮的标志性事件，宣告了新一轮科技革命的到来。无论是聊天娱乐、教育学习，还是工作生产、医疗健康等领域，人工智能正以前所未有的速度渗透到我们生活的方方面面。

而就在2月16日，OpenAI宣布推出全新的生成式人工智能模型“Sora”。据了解，通过文本指令，Sora可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。

这意味着，继文本、图像之后，OpenAI将其先进的AI技术拓展到了视频领域。OpenAI亦表示，Sora是能够理解和模拟现实世界的模型的基础，这一能力将是实现AGI（通用人工智能）的重要里程碑。

对于OpenAI视频生成模型的出现，业内其实早有预期，但仍有人评价称“比想象中来得更快”，亦有人振奋地表示“我们真的看到新工业革命来临”。

2月16日，业内分析人士对《每日经济新闻》记者表示，Sora无疑是人工智能领域的一次重大突破，该技术不仅展示了AI在理解和创造复杂视觉内容方面的先进能力，而且对内容创作、娱乐和影视制作行业带来了前所未有的挑战和机遇。

内容创作领域开启新纪元

确保内容真实透明成重要问题

2021年初和2022年末，OpenAI分别推出了图像生成系统DALL·E和聊天机器人ChatGPT。这也使得AI逐渐成为各行各业辅助工作的工具，也正逐渐改变人们对未来工作的看法。

据介绍，Sora是基于过去对DALL·E和GPT的研究基础构建，利用DALL·E 3的重述提示词技术，为视觉模型训练数据生成高描述性的标注，因此模型能更好的遵循文本指令。

Sora能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。不仅了解用户在提示中要求的内容，还了解这些东西在物理世界中的存在方式。同时，该模型对语言有深刻的理解，使其能够准确地解释提示并生成表达生动情感的引人注目的角色。

对于Sora的面世，工信部信息通信经济专家委员会委员、数字经济专家刘兴亮称，这标志着AI技术在内容创作领域的一个新纪元。“通过简短的文本提示或一张静态图片，Sora能够生成持续一分钟左右的1080P高清视频，涵盖多个角色、不同类型的动作和背景细节等，几乎达到了电影级别的逼真场景。这种能力不仅为内容创作者提供了前所未有的工具，使他们能够以更低的成本和更快的速度将创意变为现实，而且为观众带来了更丰富和多样化的视觉体验。技术创新的这一巨大飞跃，预示着AI在未来人类生活的各个方面都将发挥更加重要的作用。”刘兴亮表示。

而Sora以文字为核心的提示，将能够形成更加符合人类观念的连续视频，该模型的出现无疑将会对人们现有工作方式进行再一次迭代，同时也会对传统行业转型提出新的挑战。

生成式AI过去已积累了不少图像、声音等素材，并通过不断学习形成了更为成熟的算法。因此，若是可以通过AI在计算机中创建视频素材，或许将对影视行业产生重大影响。

刘兴亮称，AI生成的视频可能减少了对人类演员、导演和其他创意角色的需求，从而影响到这个行业的就业。此外，随着AI技术的进步，传统的影视制作流程和商业模式也可能面临重塑。

不过，刘兴亮指出，这种转型并不意味着传统影视行业的消亡，而是需要与AI技术融合，探索新的艺术形式和表达方式。

实际上，自生成式AI出现以来，该技术一直在大肆“入侵”影视制作的全流程，由人工智能产出的内容也越来越普遍。

去年由哈里森·福特主演的《夺宝奇兵》第五部中，就利用AI技术让观众看到40年前青年时的福特；Netflix网飞也在同年推出了由AIGC参与制作的动画短片《犬与少年》。

刘兴亮同时提到，随着AI生成内容与现实之间的界限变得越来越模糊，如何确保内容的真实性和透明性成为了一个重要问题。此外，版权、隐私和数据安全等问题也需要得到妥善解决。社会必须面对这些挑战，通过制定相关政策、法律和伦理准则来确保技术的健康发展，同时保护个人和社会的利益不受侵害。

拉大产业竞争差距

AI生成视频技术或将进入爆发期

正如刘兴亮所说，AI视频技术的诞生面临着一系列的问题。而除了对现实世界的影响，作为刚刚面世的全新技术，Sora也存在不足之处。

对于Sora当前存在的弱点，OpenAI指出它可能难以准确模拟复杂场景的物理原理，并且可能无法理解因果关系。该模型还可能混淆提示的空间细节，例如混淆左右，并且可能难以精确描述随着时间推移发生的事件，例如遵循特定的相机轨迹。

Sora生成的视频中可能会出现不符合物理原理的场景，比如这个人正在反向跑步。

以此次发布的DEMO“与中国龙一起庆祝农历新年的视频”为例，Sora无法准确生成视频画面中的中文受到了网友的关注。有相关人士对此调侃道：“莫非是中文太难了？”

但是任何事件的发生都是从无到有，再从有到精的过程。据悉，Sora如今正面向部分用户开放，以评估关键领域的潜在危害或风险。同时，OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入，期望获得宝贵反馈，以推动模型进步，更好地助力创意工作者。OpenAI提前分享研究进展，旨在与OpenAI以外的人士合作并获取反馈，让公众了解即将到来的AI技术新篇章。

OpenAI表示，他们正在教AI理解和模拟运动中的物理世界，目标是训练模型来帮助人们解决需要现实世界交互的问题。

而相比于其自身缺陷，该技术的广泛前景更为外界所关注。

近两年，由于人工智能发展迅速，以至于很多企业纷纷加大了对人工智能的投入。科技创业公司研究机构PitchBook估计，2023年全球生成式AI的市场规模将达426亿美元，2026年则将达到981亿美元，未来增长动能可期。

随着生成式人工智能的市场潜力不断地被挖掘，大大小小的竞争对手开始浮出水面。

当前，参与该赛道的企业不乏亚马逊、微软、谷歌、百度、阿里等众多互联网巨头，也包括Runway等初创企业。

有行业人士指出，随着Sora的发布，OpenAI在行业的领先程度立即加大，会将大家紧追的距离再度拉开一大截。未来，解决了人物一致性问题之后，AI生成视频将大踏步前进，AI视频或进入大爆发期。

相关链接：周鸿祎：Sora意味着实现通用人工智能可能从10年缩短至1年

“Sora只是小试牛刀，它展现的不仅仅是一个视频制作的能力，而是大模型对真实世界有了理解和模拟之后，会带来新的成果和突破。”

2月16日，360创始人周鸿祎发布微博提到自己对Sora的看法，周鸿祎认为，Sora的诞生意味着AGI（通用人工智能）实现可能从10年缩短至一两年。

当地时间2月15日，OpenAI宣布，正在研发“文生视频”模型Sora，可以创建长达60秒的视频，其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色，也可以根据静态图像制作动画。

周鸿祎认为，科技竞争最终比拼的是让人才密度和深厚积累，“很多人说Sora的效果吊打Pika和Runway。这很正常，和创业者团队比，OpenAl这种有核心技术的公司实力还是非常强劲的。有人认为有了AI以后创业公司只需要做个体户就行，实际今天再次证明这种想法是非常可笑的。”

此外，AI不一定那么快颠覆所有行业，但它能激发更多人的创作力。周鸿祎表示，很多人担心Sora对影视工业的打击，在他看来，机器能生产一个好视频，但视频的主题、脚本和分镜头策划、台词的配合，都需要人的创意，至少需要人给提示词。一个视频或者电影是由无数个60秒组成的。今天Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆，但它不一定那么快击败TikTok，更可能成为TikTok的创作工具。

谈到Sora最大的优势，周鸿祎表示，以往文生视频软件都是在2D平面上对图形元素进行操作，可以把视频看成是多个真实图片的组合，并没有真正掌握这个世界的知识。但Sora产生的视频里，它能像人一样理解坦克是有巨大冲击力的，坦克能撞毁汽车，而不会出现汽车撞毁坦克这样的情况，“这次OpenAI利用它的大语言模型优势，让Sora实现了对现实世界的理解和对世界的模拟两层能力，这样产生的视频才是真实的，才能跳出2D的范围模拟真实的物理世界。”

周鸿祎提到，有了大模型技术作为基础，再加上人类知识的引导，可以创造各个领域的超级工具，例如在生物医学、蛋白质、基因研究，包括物理、化学、数学的学科研究上，大模型都会发挥作用。

“一旦人工智能接上摄像头，把所有的电影都看一遍，把YouTube上和 TikTok 的视频都看一遍，对世界的理解将远远超过文字学习，一幅图胜过千言万语，这就离AGI真的就不远了，不是10年20年的问题，可能一两年很快就可以实现。”周鸿祎感慨。

他还提到，尽管国内大模型发展水平表面看已经接近GPT-3.5，但实际上跟4.0比还有一年半的差距。OpenAl手里应该还有一些秘密武器，无论是GPT-5，还是机器自我学习自动产生内容，“奥特曼（OpenAI CEO）是个营销大师，知道怎样掌握节奏，他们手里的武器并没有全拿出来。这样看来中国跟美国的AI差距可能还在加大。”

Sora来了，现实不存在了？

相关链接：周鸿祎：Sora意味着实现通用人工智能可能从10年缩短至1年

推荐体验

相关资讯

Sora来了，现实不存在了？

从文生视频模型Sora说起：现实不存在了，还是我们不存在了？

九卦 | 解密OpenAI视频大模型Sora！“现实不存在了”？

OpenAI全新发布文生视频模型Sora，现实不存在了

Sora降临，银行不存在了？ | 观点

近期资讯

【从零开始】10. RAGChecker 提升回答准确率（番外篇）

solidity（基础特性）—学习总结

Windows使用Jetbrains Toolbox安装的IDE文件夹右键菜单没有打开项目菜单的解决方案

Android Gradle 构建指令生成规则

【保姆教程】手把手教你在Linux系统搭建早期alpha项目cysic的验证者&证明者

理解npm中的包和模块

圣诞节：记一次掘友让我感动的时刻

ROG：高性能 Go 实现

Java 线程池深入剖析：核心概念、源码解析与实战应用

一次搞懂 JS 对象转换，从此告别类型错误！

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响