## 2024年2月16日,OpenAI震撼发布了Sora:文生视频模型,开启了前所未有的时代。
这一天,标志着人类进入了“前Sora时代”和“后Sora时代”的分水岭。Sora的问世,不仅再次将AI推向风口浪尖,更是人类迈向AGI的又一重要一步。周鸿祎更是大胆预言,Sora将“让AGI实现从10年缩短到1年的跨越”。【体验中国版Sora公众号搜:索啦AI创意】
---
跟随着科技革命的步伐,总有人顺势而起,有人却被时代淘汰。某头部AI社群,趁着Sora的热度,抓住机会卖知识星球及合伙人资格,据悉上月卖了300多万,算上净利润,竟然比李一舟还赚;而一位朋友的视频工具创业公司,由于Sora的出现,投资人撤资,上周不得已终止了产品研发,裁员80%。
面对AI技术的澎湃浪潮,李开复曾多次警告:未来十年,翻译、新闻报道、保安、销售、客服等行业,将有90%的人被淘汰。如今Sora横空出世,将进一步加速这一现象,但也将为其他领域、其他人带来新的机遇。【体验中国版Sora公众号搜:索啦AI创意】
---
### 什么是Sora?
**1) Sora的强大之处**
马斯克看完Sora生成的作品,惊呼“人类,认输吧!”。Sora凭什么如此强大?
众所周知,Sora可以根据用户输入的指令,生成长达1分钟的高清视频,也能通过现有的静态图像生成视频,以及对现有视频进行扩展、填充缺失内容等。更关键的是,Sora生成的视频不仅拥有细腻的背景、进行多角度镜头切换,还能展现出多个角色丰富的情绪表现。要知道,像Runway Gen 2、Pika等Sora的竞争对手,现在还在朝着4秒内“视频片段”的连贯性“不懈努力”着,而Sora已经可以实现精致的场景布设、复杂且流畅的运镜、惟妙惟肖的人物展现……Sora一亮相,就已遥遥领先对手好几个身位。
Sora如此强大,靠的是什么呢?OpenAI在技术报告标题上,直接点明:“视频生成模型是世界模拟器”。什么是“世界模拟器”?简单来说,Sora不仅可以生成短视频,还能够学会并掌握现实世界的某些物理规律,并在此基础上进一步发展为“模拟预测该场景下一刻会发生什么”的能力。比如当物体掉到水里,Sora就会“预测”出水面会有波纹出现;当篮球砸在篮筐上,它又能预测到篮球会被反弹的场景。而这种强大的能力,对原来那些不能理解、感知现实世界运转和物理规律的文生图、文生视频竞品来说,无疑是降维打击。
**2) 文生视频,革命才刚刚开始**
SORA的出现,进一步打破了自然语言和代码之间的隔阂。其应用场景非常广泛,让人充满期待。但文生视频,也只是一个新阶段的新起点。
回顾AI发展的重要节点:
- 2016年,openAI发布chatgpt,只是能与人类进行自然对话的AI模型;
- 2020年,openAI推出GPT-3,已经能生成任意文本;
- 2021年,openAI发布DALL-E以及Codex,让文本生成图像、文本生成代码成为现实。
OpenAI不断刷新并定义人工智能边界,掀起一次次悄无声息的“革命”。比如,ChatGPT曾让无数文字工作者感到紧张,担心被AI抢了饭碗。这次Sora的问世,让视频行业集体陷入混乱。
Sora生成的视频兼具真实性和创造性,能根据文本要求的细节和风格,生成符合用户预期的现实场景,还能产生各种非现实的虚构场景,不仅可以“辅助”创造,还能“实现”创造,增加视频内容的丰富性和想象力。如此强大的能力,让相关领域的从业者感到担忧,也不足为奇。