计算机孟灿|计算机深度研究：Sora开启创意领域iPhone时刻

作者：国金证券研究发布时间：2024-02-19

金选·核心观点

行业观点

Sora问世，视频创作领域迎来“iPhone时刻”。2023年2月15日，OpenAI发布视频生成大模型Sora，通过文本指令，Sora可以直接输出长达60秒的高清视频，包含高度写实的背景、复杂的多角度镜头以及富有情感的多角色叙事，更为可贵的是，Sora生成的视频表现出对于真实世界物理常识的深刻理解。部分媒体报道惊叹——“Sora之后，现实将不再存在”。从本轮AI应用端发展实践来看，以文本创作（小说、剧本）、图像创作（绘画、平面设计、摄影）、视频创意（广告、短视频、传统影视、游戏）为代表的创意创作领域因其高容错率、高投入度，在AI浪潮之初就被市场广泛认为将会成为最先被AI深刻赋能的产业之一；从本轮AI模型发展演绎来看，以ChatGPT为代表的文本创作(以Midjourney、Stable Diffusion为代表的图像创作(以Runway、Sora为代表的视频创作的发展速度无疑是极为惊人的。我们认为，从文字到图像到视频，AI内容创作的信息升维越来越考验模型的创作效率与生成结果的稳定性（早期版本的Midjourney存在生成时间长、生成结果违背物理常识或者“AI感”明显的问题；Runway Gen-1/2也存在生成视频时长较短且生成视频逻辑连贯性较弱等缺陷），但正如Midjourney V5/6已逐步广泛实现多行业的商业化落地，我们认为Sora的问世有望推动着视频创作领域的“iPhone时刻”到来。

Sora取法Tokens文本特征标记，是基于Patches视觉特征标记的Diffusion Transformer模型。OpenAI研究团队从LLM中汲取灵感，认为LLM范式的成功在一定程度上得益于Tokens的使用，故而通过将视频信息分解为带有时空特征的Patches训练了Diffusion Transformer模型。从训练角度而言，基于Patches视觉特征标记对原生视频进行采样扩大了可用样本的规模且省去了标准化样本的步骤。从推理角度而言，基于原生视频训练的模型在生成新视频方面改善了构图和取景。OpenAI目前发布的Sora视频大模型主要具备文生视频、视频编辑、文生图三类功能，在文生视频过程中，用户通过输入Prompt提示词(DALL·E生成图像(Sora生成视频。

文生图和文生视频是当下AI应用端落地焦点，海外相关技术产品迭代迅速。据Discord，按邀请页面流量排序的十大AI应用程序中，有5个是图片生成应用程序，2个是音频生成应用程序，2个是视频生成应用程序，其中，Midjourney位列第一，Pika位列第二，图片约占前10名流量的74%，视频约占前10名流量的8%。文生图领域，海外有Adobe（老牌创意软件巨头，现已发布下一代Firefly支持多种文生图功能）、Midjourney（文生图模型新锐，现已广泛实现商业化落地）。文生视频领域，海外有Pika（AI初创公司，支持一键生成3秒共计72帧视频）、Runway（拥有最早商业化的T2V模型Runway Gen-2）。

国内推荐关注万兴科技和美图公司等创意软件龙头投资机会。万兴于2023年9月宣布即将发布国内首个专注于以视频创意应用为核心的百亿级参数多媒体大模型“天幕”，具备一键成片、AI美术设计、文生音乐、音频增强、音效分析、多语言对话等核心能力。2022年底至2023全年万兴对旗下T2V/I多款拳头产品进行AI功能更新，AI赋能之下订阅收入占比及订阅续约率取得双增。美图公司于2023年12更新视觉大模型MiracleVision 4.0，具备文生视频、图生视频、视频生视频等多模态能力，AI赋能之下订阅业务收入占比逐年增长。

计算机孟灿|计算机深度研究：Sora开启创意领域iPhone时刻

推荐体验

相关资讯

计算机孟灿|计算机行业深度研究：AI应用复盘

计算机孟灿|计算机软件行业深度研究：海外巨头复盘

计算机孟灿|计算机软件行业深度研究：XR产业拐点将至

计算机孟灿|计算机行业深度研究：海外顶级VC视角看AI应用落地

计算机行业：Sora技术深度解析

近期资讯

交通运输部东海航海保障中心召开2024年江苏辖区新闻发布会

祥鑫科技等多公司剧透人形机器人业务布局情况

全球单机功率最大的纯氢发电机组首次点火成功

刚刚确认：可达中度污染！上海突发空气重污染黄色预警，减少户外活动

六大新质生产力最热赛道，解锁万亿产业投资密码

大模型·大未来｜金证优智科技副总裁林勇：持续关注大模型的四个技术方向

首席气候官｜专访曼恩能源方案高级副总裁、亚太区负责人沙柏能：人工智能+人类智能是脱碳关键，2050年后海运业燃料格局将迎巨变

赛道Hyper | 这公司竟以高端影像力震撼全场？

“小新”上岗！焦作高新区“AI智能+政务服务”开启新模式

消息称苹果正加紧研发AI芯片以减少对第三方的依赖

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响