爆火的Sora，摩拳擦掌的出海人

作者：蓝鲸财经发布时间：2024-02-23

文|霞光社麻吉

编辑|刘景丰

一年前AI智能涌现的场景又重现。

2024开年，Sora就引发了全球科技圈的集体躁动。

当地时间2月15日，OpenAI发布最新视频生成模型Sora。根据OpenAI描述，Sora可根据用户输入的简短文本指令，生成长达1分钟的高清视频，并创建具有多个角色、特定类型的运动以及准确的主题和背景细节的复杂场景。

让全球受众感到惊叹的，是Sora生成视频中极具真实感的画面呈现，甚至还带着些许电影质感。

图源：OpenAI网站截图

在OpenAI发布的一系列不同主题视频中，不论是戴墨镜女子走在东京街头的场景，或是动画人物的细节塑造，虽然这些内容完全由AI生成，但其中细节呈现出的画面真实感已经进入一个全新维度。这让不少网友感叹，现实的边界正在数字世界中变得愈发模糊。正如OpenAI 在Sora技术报告的标题中赫然写道的，“ Sora 这类视频生成模型是「世界的模拟器」”。

对中国出海企业来说，AI技术推动下内容生产力的大幅提升，也将进一步助力产业升级，并加速企业的全球化步伐。而TikTok平台上，已经开始充斥各种由AI生成的视频疯狂吸粉。

去年初，OpenAI发布的大语言模型ChatGPT掀起了一轮人工智能的热潮。ChatGPT上线后，几乎所有全球科技大厂都全速投入AI领域，发布了自己的大语言模型，影响着人们日常搜索信息、查找资料的方式发生改变。

而文生视频模型Sora的发布，更直观地呈现了AI技术正在以何种速度飞速发展。

在社交媒体X上一条Sora演示视频下方，特斯拉创始人马斯克发表评价说“gg 人类”（gg为Good Games缩写，代指“打得好，我认输”）。他还表示，由人工智能增强的人类，将会在未来几年之内创作出最杰出的作品。

360集团创始人、董事长周鸿祎则表示，Sora的诞生意味着AGI的实现将从10年缩短至1年。

“Sora把AI视频能力推到了一个新的阶段，是走向实用化的开始。视频生产成本将大幅降低，所需要的技能也将和以前完全不同。以前的技能是如何找到优质的拍摄团队，场地，以及合适的价格进行产品视频拍摄，如何协调和沟通。之后的技能是如何写prompt，如何让AI把自己的产品不失真的融入到视频里，如何让视频看起来真实清晰有质感。”Passioncy创始人郭林告诉霞光社。

就在近日，OpenAI的TikTok账号上，各种由AI生成的视频疯狂吸粉，在短短数天时间内吸粉超10万，获得超50万次点赞。网友们纷纷留言感慨，短视频创作者是否即将会被AI抢了饭碗，甚至连TikTok平台都会受到影响。

虽然Sora还未正式开放给用户使用，但已经在资本市场掀起波澜。市场预计，在最新一轮由风投公司ThriveCapital牵头的融资中，OpenAI的估值有望超过800亿美元。作为对比，去年年初OpenAI发布ChatGPT不久后的估值约为290亿美元。

而在Sora发布次日，几家美国科技公司的股价便应声跌落。据媒体报道，美国电脑软件公司Adobe股价暴跌超7%；美国图片库、图片素材、图片音乐和编辑工具供应商Shutterstock跌超5%；几周前发布了“文生视频”工具Lumiere的谷歌母公司股价下挫1.58%。一天以内，这三家公司的市值就合计蒸发了近480亿美元（折合人民币近3500亿元）。

对不少行业来说，Sora就像是一颗“重磅炸弹”，让从业者在展望未来时既兴奋又感到惶恐不安。

其中，影视业首当其冲。在传统的影视制作过程中，后期及特效制作往往需要投入大量人力、物力和时间，而Sora等AI工具将大大降低这些成本，帮助影视制作公司快速创建出高质量的视频片段，缩短制作周期。

在正举行的柏林电影节上，Sora就成为电影人热议的话题之一。

据外媒报道，洛杉矶导演戴夫·克拉克(Dave Clark)认为，创作者需要接受人工智能技术来制作尚未想象或实现的内容，而不是感到威胁。

德国视觉特效工作室Trixter的董事总经理克里斯蒂娜·卡斯珀斯-罗默(Christina Caspers-Roemer)则表示，像Sora这样的人工智能工具被证明在工作流程中更高效、更快，但即便如此，电影和电视制作将仍然以人类创作为基础。“最终我们的客户总会回到现实世界。”她说。

从ChatGPT、DALL-E3，再到Sora，AI内容创作已经从图文席卷至视频创作领域。

而实际上，Sora并不是第一个受到关注的文生视频大模型。近年，全球科技大厂几乎无一例外地重金投入人工智能领域，并计划在未来持续甚至加大投入。

在Sora正式亮相以前，大部分全球头部科技企业就已拥有自己的文生视频大模型。

去年11月，文生视频模型迎来了一波爆发。11月3日，Runway发布Gen-2更新，支持4K清晰度作品；11月16日，Meta发布文生视频大模型Emu Video；11月18日，字节跳动发布PixelDance；11月21日，Stability AI发布生成式视频模型Stable Video Diffusion……

今年1月，谷歌也发布了视频生成模型Lumiere，专门用于将文本转换为视频。

目前，Sora仍处于开发早期阶段，OpenAI表示，当前的模式仍然存在不少弱点。Sora可能难以准确模拟复杂场景的物理原理，也可能无法理解因果关系的具体实例。例如，一个人可能咬了一口饼干，但之后，饼干上可能没有咬痕。

此外，该模型还可能混淆提示的空间细节，例如混淆左和右，并且可能难以精确描述随时间发生的事件。

而细心的网友也在Sora的演示视频中发现了不少Bug。“比如在Sora生成的一个视频中，呈现的是中国农历新年舞龙的场景，虽然视频里龙身上和建筑上的文字很像是中国书法撰写的字体，但实际上并不是中国字，谁也不认识写的是什么，感觉只是AI臆想出来的中文。另一个视频里的猫，动起来的时候有三只前脚。”关注AI行业的一名读者向霞光社表示。

图源：OpenAI网站截图

但即使如此，不论在生成视频时长、实现单视频多机位、拥有精准物理规则的真实世界等技术层面，Sora均已实现“碾压式”领先其他文生视频模型，推动AI视频生成进入了一个新的时代。

Sora这样的生成式AI工具，在降低成本和提高效率方面的显著优势，为内容创作、广告娱乐等行业带来了前所未有的发展契机，也让不同类型的中国出海企业看到了机会。

此前，一些企业将ChatGPT应用于多个场景之中，实现降本增效。AMZ123的一项调查数据显示，2023年，有33%的跨境公司使用ChatGPT，另有将近15%的公司预计将投入使用。

如今Sora尚未完全开放使用，但可以想见，通过更精准的生成式人工智能，不论是制作TikTok等平台短视频，或是为自己的产品制作介绍视频和推广营销视频，都将能大大降低成本、提升效率。

“如何通过AI来生产真正能落地的视频，是大家开始摸索的东西。Sora给行业带来了颠覆性的影响，谁先用上包括Sora在内的新AI技术，谁就能吃到第一波行业红利。”Passioncy创始人郭林说，“中国公司出海肯定要充分利用好现有的AI能力。对于中小企业，尤其很多工贸一体企业来说，难度其实是非常高的。这也是我们目前希望提供帮助的一个方向。”

一名广告行业资深从业者也告诉霞光社，她认为Sora将颠覆旅游、生活方式和服务行业的内容。随着视频制作过程变得更简单，大品牌广告和小品牌广告之间的界限将逐步缩小，而“讲故事”等内容创意环节，将再次成为广告中最重要的因素。

而在游戏出海领域，Share Creators创始人兼CEO Ada Liu认为，视频生成带来的改变将是“跨时代”的。

“在游戏行业， AI可以帮助生成前期的概念图，UI icon等。计算机图形制作的流程非常长，从3D制作，到渲染、合成，每个环节都需要投入大量专业的人员。尤其在风格探索阶段，如果直接生产出视频，相当于直接跳到最后一步，节省了大量的制作时间和成本。”

但 Ada Liu同时认为，AI生成内容想要完全取代人工还存在不少距离。“可能再发展一两年，能取代2D部分的一些低端批量制作工种。但主美之类定方向的美术人员，是不会被取代的。毕竟一个产品的美术风格需要人来选择。”

Ada表示，Sora的演示视频效果令人印象深刻，但还是要关注实际上的效果，因为目前无法试用，只能等等看。而郭林也认为，目前AI工具距离产出“真正能落地”的视频，主要差距仍在于内容真实性，以及工具易用性两个方面。

根据IDC的预测，未来五年内，AIGC对于营销、软件测试等行业将带来巨大影响。到2025年，35%的企业将掌握使用生成式人工智能来开发数字产品和服务。到2026年，生成式AI将承担42%的传统营销琐碎任务，如搜索引擎优化、内容和网站优化、客户数据分析、细分、潜在客户评分以及超级个性化。到2028年，基于生成式AI的工具将能够编写80%的软件测试工作，从而减少对人工测试的需求，提高测试覆盖率、软件可用性和代码质量。

可以预见的是，即便AI生成内容仍然面临道德和滥用方面的潜在风险，但其在创造力和效率方面的无限潜力，将持续吸引全球科技巨头的加码投入和争夺。