2 月 16 日,OpenAI 最新的 Sora 大模型发布,让用户仅通过输入一句话,就可生成与好莱坞画面相媲美的视频,且长度最多可达 1 分钟,这让不少科技大佬折服,引爆科技圈。
OpenAI 表示,Sora 将推动通用人工智能(AGI)的加速发展。该公司称:“我们正在教授人工智能理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要现实世界交互的问题。”
OpenAI 的 ChatGPT 在数千个英伟达 GPU 上进行训练和运行,这推动此轮 AI 基础设施布局的发展,此次 Sora 大模型发布,有望再次带动整个 AI 产业链的热度。
Sora 大模型诞生,市场掀起 AI 浪潮
OpenAI 发布视频生成大模型 Sora,通过文本指令,Sora 可以直接输出长达 60 秒的高清视频,包含高度写实的背景、复杂的多角度镜头以及富有情感的多角色叙事,更为可贵的是,Sora 生成的视频表现出对于真实世界物理常识的深刻理解。从本轮 AI 应用端发展实践来看,以文本创作(小说、剧本)、图像创作(绘画、平面设计、摄影)、视频创意(广告、短视频、传统影视、游戏)为代表的创意创作领域因其高容错率、高投入度,在 AI 浪潮之初就被市场广泛认为将会成为最先被 AI 深刻赋能的产业之一;
新技术开始应用,视觉数据训练有效
Sora 取法 Tokens 文本特征标记,是基于 Patches 视觉特征标记的模型。OpenAI 研究团队从 LLM 中汲取灵感,认为 LLM 范式的成功在一定程度上得益于 Tokens 的使用,Tokens 统一了代码、数学和各种自然语言的文本模式。类似于 LLM 范式下的 Tokens 文本标记,Sora 创新性地使用了 Patches(视觉特征标记)。
鉴于 Patches 之前已被证明是视觉数据模型的有效表示,OpenAI 研究团队进一步研发发现 Patches 是一种高度可扩展且有效的表示,可以被用于在不同类型的视频和图像上训练生成模型。
文生视频成为新功能,搜索流量开始暴涨
确保“物理世界常识”始终在场的通用模拟工具。OpenAI 目前发布的Sora视频大模型主要具备文生视频、视频编辑、文生图三类功能,其中前二项为最核心的 AI 功能。
随着 AI 技术的发展,当下的市场需求已经从文生图向文生视频扩展,目前为当下 AI 应用焦点,相关产品流量开始显著提升。
LatentVideoDiffusion模型的问世奠定T2V领域的基石。2023年,Runway发布 LatentVideoDiffusion(潜在视频扩散)模型,能够基于初始图像与文本描述来编辑并生成新的视频。
而 OpenAI 近期发布的 Sora 则是一个基于 DiffusionModel(扩散模型)的 Transformer。扩散模型的工作原理是通过连续添加高斯噪声来破坏训练数据,然后通过逆转这个加噪过程来学习恢复数据,Transformer 则是一套编码器和解码器的架构,将文本编码成数字向量,然后通过解码将数字向量还原出文本。Sora 融合了两者,通过编码器-解码器架构处理含噪点的输入图像,并在每一步预测出更清晰的图像版本,被用于从高维的时空碎片张成的空间中,观察并提取丰富的时空碎片之间的关联与演化的动态过程。
AI 技术向上渗透,大模型改变影视产业
未来以 Sora 为代表的 T2V 大模型有望深刻改变影视产业工作流程。
此前 AI 赋能影视产业的逻辑主要以 AI 算法进入既有的影视内容生产、分发环节,以降本增效地方式为影视产业节约成本、提高效率为主。伴随以 Sora 为代表的 T2V 大模型的问世,机器生产内容(MGC 模式)的时代或在不远的将来成为现实。当影视内容的剧本创作不再需要编剧,当拍摄制作不再需要真人演员、场地置景、专业的拍摄与后期团队,当以 TikTok 为代表的“推荐你喜欢”模式转向“生成你喜欢”模式继而重新定义“生成即渠道”,影视产业,无论是传统的 PGC 电影、电剧集还是新兴的 UGC 短视频、短剧,抑或是饱受期待的 3D 视频内容,也许都将面临 T2V 大模型对于影视产品工作流的巨大冲击与深刻变革。未来,不断迭代演进的 T2V 大模型有可能以更少交互的 Agent 形态存在,从而更便捷地响应市场海量的视频内容需求。
大模型升级提高算力需求,数据中心投资开始快速扩张
虽然大模型的效果展示震惊世界,但是真正保障大模型运行的训练算力基础才是重中之重,大模型的升级迭代也将带动算力基础设施的需求。
OpenAI 的 ChatGPT 在数千个英伟达 GPU 上进行训练和运行,这推动英伟达成为此轮 AI 基础设施布局中的最大赢家。未来随着国内大模型的诞生也会进一步催生国内算力基础设施的订单。
2022 年,十大云服务商(阿里巴巴/亚马逊/苹果等)在数据中心基础设施共投入 1140 亿美元,占云服务商支出最大份额。预期到 2027 年,人工智能基础设施支出将推动数据中心资本支出超过 5000 亿美元,全球数据中心资本支出预计将增长 15%,超过 20%的全球服务器可能会加快部署。
国内大模型对算力的需求将指数级增长,AI 算力将从单机走向集群时代。大算力集群是业界厂家 AI 模型开发的共同选择,如腾讯数万卡规模的星星海 AI集群,华为数万卡规模昇腾 AI 集群等,AI 芯片、AI 服务器等的需求量提升。
在中国,随着训练模型的完善与成熟,模型和应用产品逐步进入投产模式,处理推理工作负载的人工智能服务器占比将随之攀升。IDC 预计,到 2027 年,用于推理的工作负载将达到 72.6%
投资建议:目前随着人工智能技术的发展,AI 技术能力已经能够从文生图开始向文生视频、图升视频的功能发展,这次技术进步有望通过 AI 技术改变影视产业的格局,同时技术的进步也提高了对算力的需求,下游算力基础设施行业也有相应提振,市场有望在近期借助 Sora 形成一个 AI 产业链的全局热度。
建议关注:AI、Sora 概念、算力、传媒、AIGC、AI 短剧、CPO、多模态 AI
300166 东方国信 300624 万兴科技 603888 新华网
300058 蓝色光标 300308 中际旭创 000938 紫光股份
风险提示:若各赛道商业应用场景无法按预期落地,或相关场景客户没有较强的付费意愿,可能会对各公司 AI 布局创收产生影响。
参考资料:
2024 年 2 月 18 日 国金证券 《计算机软件深度研究》
市场有风险,投资需谨慎。本文仅为投资者教育使用,不构成任何投资建议,投资者据此操作,风险自担。力求本文所涉信息准确可靠,但并不对其准确性、完整性和及时性做出任何保证,对投资者据此进行投资所造成的一切损失不承担任何责任。
免责声明
本文由汇正财经的投资顾问:顾晨浩(登记编号:A0070620080002)进行编辑,仅供参考,请自主决策,风险自担。投资有风险,入市需谨慎!