文|霞光社 麻吉
编辑|刘景丰
一年前AI智能涌现的场景又重现。
2024开年,Sora就引发了全球科技圈的集体躁动。
当地时间2月15日,OpenAI发布最新视频生成模型Sora。根据OpenAI描述,Sora可根据用户输入的简短文本指令,生成长达1分钟的高清视频,并创建具有多个角色、特定类型的运动以及准确的主题和背景细节的复杂场景。
让全球受众感到惊叹的,是Sora生成视频中极具真实感的画面呈现,甚至还带着些许电影质感。
图源:OpenAI网站截图
在OpenAI发布的一系列不同主题视频中,不论是戴墨镜女子走在东京街头的场景,或是动画人物的细节塑造,虽然这些内容完全由AI生成,但其中细节呈现出的画面真实感已经进入一个全新维度。这让不少网友感叹,现实的边界正在数字世界中变得愈发模糊。正如OpenAI 在Sora技术报告的标题中赫然写道的,“ Sora 这类视频生成模型是「世界的模拟器」”。
对中国出海企业来说,AI技术推动下内容生产力的大幅提升,也将进一步助力产业升级,并加速企业的全球化步伐。而TikTok平台上,已经开始充斥各种由AI生成的视频疯狂吸粉。
去年初,OpenAI发布的大语言模型ChatGPT掀起了一轮人工智能的热潮。ChatGPT上线后,几乎所有全球科技大厂都全速投入AI领域,发布了自己的大语言模型,影响着人们日常搜索信息、查找资料的方式发生改变。
而文生视频模型Sora的发布,更直观地呈现了AI技术正在以何种速度飞速发展。
在社交媒体X上一条Sora演示视频下方,特斯拉创始人马斯克发表评价说“gg 人类”(gg为Good Games缩写,代指“打得好,我认输”)。他还表示,由人工智能增强的人类,将会在未来几年之内创作出最杰出的作品。
360集团创始人、董事长周鸿祎则表示,Sora的诞生意味着AGI的实现将从10年缩短至1年。
“Sora把AI视频能力推到了一个新的阶段,是走向实用化的开始。视频生产成本将大幅降低,所需要的技能也将和以前完全不同。以前的技能是如何找到优质的拍摄团队,场地,以及合适的价格进行产品视频拍摄,如何协调和沟通。之后的技能是如何写prompt,如何让AI把自己的产品不失真的融入到视频里,如何让视频看起来真实清晰有质感。”Passioncy创始人郭林告诉霞光社。
就在近日,OpenAI的TikTok账号上,各种由AI生成的视频疯狂吸粉,在短短数天时间内吸粉超10万,获得超50万次点赞。网友们纷纷留言感慨,短视频创作者是否即将会被AI抢了饭碗,甚至连TikTok平台都会受到影响。
虽然Sora还未正式开放给用户使用,但已经在资本市场掀起波澜。市场预计,在最新一轮由风投公司ThriveCapital牵头的融资中,OpenAI的估值有望超过800亿美元。作为对比,去年年初OpenAI发布ChatGPT不久后的估值约为290亿美元。
而在Sora发布次日,几家美国科技公司的股价便应声跌落。据媒体报道,美国电脑软件公司Adobe股价暴跌超7%;美国图片库、图片素材、图片音乐和编辑工具供应商Shutterstock跌超5%;几周前发布了“文生视频”工具Lumiere的谷歌母公司股价下挫1.58%。一天以内,这三家公司的市值就合计蒸发了近480亿美元(折合人民币近3500亿元)。
对不少行业来说,Sora就像是一颗“重磅炸弹”,让从业者在展望未来时既兴奋又感到惶恐不安。
其中,影视业首当其冲。在传统的影视制作过程中,后期及特效制作往往需要投入大量人力、物力和时间,而Sora等AI工具将大大降低这些成本,帮助影视制作公司快速创建出高质量的视频片段,缩短制作周期。
在正举行的柏林电影节上,Sora就成为电影人热议的话题之一。
据外媒报道,洛杉矶导演戴夫·克拉克(Dave Clark)认为,创作者需要接受人工智能技术来制作尚未想象或实现的内容,而不是感到威胁。
德国视觉特效工作室Trixter的董事总经理克里斯蒂娜·卡斯珀斯-罗默(Christina Caspers-Roemer)则表示,像Sora这样的人工智能工具被证明在工作流程中更高效、更快,但即便如此,电影和电视制作将仍然以人类创作为基础。“最终我们的客户总会回到现实世界。”她说。
从ChatGPT、DALL-E3,再到Sora,AI内容创作已经从图文席卷至视频创作领域。
而实际上,Sora并不是第一个受到关注的文生视频大模型。近年,全球科技大厂几乎无一例外地重金投入人工智能领域,并计划在未来持续甚至加大投入。
在Sora正式亮相以前,大部分全球头部科技企业就已拥有自己的文生视频大模型。
去年11月,文生视频模型迎来了一波爆发。11月3日,Runway发布Gen-2更新,支持4K清晰度作品;11月16日,Meta发布文生视频大模型Emu Video;11月18日,字节跳动发布PixelDance;11月21日,Stability AI发布生成式视频模型Stable Video Diffusion……
今年1月,谷歌也发布了视频生成模型Lumiere,专门用于将文本转换为视频。
目前,Sora仍处于开发早期阶段,OpenAI表示,当前的模式仍然存在不少弱点。Sora可能难以准确模拟复杂场景的物理原理,也可能无法理解因果关系的具体实例。例如,一个人可能咬了一口饼干,但之后,饼干上可能没有咬痕。
此外,该模型还可能混淆提示的空间细节,例如混淆左和右,并且可能难以精确描述随时间发生的事件。
而细心的网友也在Sora的演示视频中发现了不少Bug。“比如在Sora生成的一个视频中,呈现的是中国农历新年舞龙的场景,虽然视频里龙身上和建筑上的文字很像是中国书法撰写的字体,但实际上并不是中国字,谁也不认识写的是什么,感觉只是AI臆想出来的中文。另一个视频里的猫,动起来的时候有三只前脚。”关注AI行业的一名读者向霞光社表示。
图源:OpenAI网站截图
但即使如此,不论在生成视频时长、实现单视频多机位、拥有精准物理规则的真实世界等技术层面,Sora均已实现“碾压式”领先其他文生视频模型,推动AI视频生成进入了一个新的时代。
Sora这样的生成式AI工具,在降低成本和提高效率方面的显著优势,为内容创作、广告娱乐等行业带来了前所未有的发展契机,也让不同类型的中国出海企业看到了机会。
此前,一些企业将ChatGPT应用于多个场景之中,实现降本增效。AMZ123的一项调查数据显示,2023年,有33%的跨境公司使用ChatGPT,另有将近15%的公司预计将投入使用。
如今Sora尚未完全开放使用,但可以想见,通过更精准的生成式人工智能,不论是制作TikTok等平台短视频,或是为自己的产品制作介绍视频和推广营销视频,都将能大大降低成本、提升效率。
“如何通过AI来生产真正能落地的视频,是大家开始摸索的东西。Sora给行业带来了颠覆性的影响,谁先用上包括Sora在内的新AI技术,谁就能吃到第一波行业红利。”Passioncy创始人郭林说,“中国公司出海肯定要充分利用好现有的AI能力。对于中小企业,尤其很多工贸一体企业来说,难度其实是非常高的。这也是我们目前希望提供帮助的一个方向。”
一名广告行业资深从业者也告诉霞光社,她认为Sora将颠覆旅游、生活方式和服务行业的内容。随着视频制作过程变得更简单,大品牌广告和小品牌广告之间的界限将逐步缩小,而“讲故事”等内容创意环节,将再次成为广告中最重要的因素。
而在游戏出海领域,Share Creators创始人兼CEO Ada Liu认为,视频生成带来的改变将是“跨时代”的。
“在游戏行业, AI可以帮助生成前期的概念图,UI icon等。计算机图形制作的流程非常长,从3D制作,到渲染、合成,每个环节都需要投入大量专业的人员。尤其在风格探索阶段,如果直接生产出视频,相当于直接跳到最后一步,节省了大量的制作时间和成本。”
但 Ada Liu同时认为,AI生成内容想要完全取代人工还存在不少距离。“可能再发展一两年,能取代2D部分的一些低端批量制作工种。但主美之类定方向的美术人员,是不会被取代的。毕竟一个产品的美术风格需要人来选择。”
Ada表示,Sora的演示视频效果令人印象深刻,但还是要关注实际上的效果,因为目前无法试用,只能等等看。而郭林也认为,目前AI工具距离产出“真正能落地”的视频,主要差距仍在于内容真实性,以及工具易用性两个方面。
根据IDC的预测,未来五年内,AIGC对于营销、软件测试等行业将带来巨大影响。到2025年,35%的企业将掌握使用生成式人工智能来开发数字产品和服务。到2026年,生成式AI将承担42%的传统营销琐碎任务,如搜索引擎优化、内容和网站优化、客户数据分析、细分、潜在客户评分以及超级个性化。到2028年,基于生成式AI的工具将能够编写80%的软件测试工作,从而减少对人工测试的需求,提高测试覆盖率、软件可用性和代码质量。
可以预见的是,即便AI生成内容仍然面临道德和滥用方面的潜在风险,但其在创造力和效率方面的无限潜力,将持续吸引全球科技巨头的加码投入和争夺。