当前位置：首页|资讯|人工智能|Sora|OpenAI

人工智能行业深度报告：从Sora看多模态大模型发展

作者：侠说发布时间：2024-03-05

人工智能 Sora OpenAI

1、OpenAI发布视频生成模型Sora，视频生成能力实现大幅提升

2024年2月16日，OpenAI发布视频生成模型Sora，能生成各种持续时间（甚至长达1分钟）、宽高比和分辨率的视频和图片。Sora 模型基于 Diffusion Transformer技术，采用视频压缩网络（Video compression network）、潜空间patch（Spacetime latent patches ）、直接在原始大小训练（Training on data at its native size）以及重新标注技术（Re-captioning technique）技术，可以图像和视频作为输入，实现制作无缝循环视频、给静态图片添加动画、扩展视频时间线、视频到视频编辑、视频拼接等功能；

2、国内外厂商相继发力布局多模态大模型领域，2024年文生视频有望进入商业化探索哦阶段

目前除OpenAI之外，谷歌、字节跳动等厂商均已推出具备文生视频能力的多模态模型。基于对Stable Video Diffusion、谷歌W.A.L.T以及其它文生视频模型的分析，我们认为高质量数据以及底层通用大模型是文生视频能力的重要决定因素，随着Transformer架构的引入，以及3D建模领域模型的迭代，2024年文生视频有望在时间长度、画面清晰度、内容逼真程度等方面实现显著迭代，打开商业化应用空间。

3、海外已有部分文生视频商业化案例，未来有望覆盖全球千亿级视频内容生成市场

根据PR Newswire数据预测，2025年全球数字视频市场内容规模有望达到3271.9亿美元，2021-2025年CAGR超过14%。目前海外已有Synthesia、Runway等厂商在文生视频领域形成成熟商业方案，应用于企业产品介绍、操作指南、客户服务等场景。我们认为以Sora为代表的多模态模型有望显著降低视频等数字内容的创作成本，市场空间广阔。

报告节选内容如下：

完整版资料下载：公众号《侠说》

推荐体验

相关资讯

人工智能行业报告：从Sora看多模态大模型发展

报告出品方：浙商证券以下为报告原文节选------1 多模态AI综述1.1 AI模型：必将从单模态走向多模态，实现复杂场景下的智能决策1.2 2024年，有望出现多模态领域类ChatGPT的

人工智能 Sora

报告派研读 2024-03-06

AIGC专题：从Sora看多模态大模型发展（附下载）

输入原始视频，输出一个在时间和空间上都压缩了的潜在空间。为了效率以及联合处理图像和视频，该团队是以窗口方式计算自注意力，这基于两种类型的非重叠配置：空间（S）和时空（ST）•该团队在文本-图像和文本-视频对上联合训练了W.A.L.T的文本…

烟树晚雁 2024-03-06

人工智能行业深度报告：ChatGPT引发的大模型时代变革

（报告出品方：华安证券）1 引言 ChatGPT 是由 OpenAI 研发的一种语言 AI 模型，使用上亿参数的大模型和海量语料库来生成语句，目前可以实现写诗、撰文、编码的功能。ChatGPT 广受用户欢迎，短短五天注册用户数量便超过 100 万，60 日月活破亿。产业界如微软、谷歌、百度也对于 openAI 及其竞品加大投入。2 ChatGPT 引发...

人工智能 ChatGPT OpenAI 微软谷歌

未来智库 2023-02-27

2024从Sora看基于多模态大模型的智能驾驶新范式(附下载)

今天分享的是：2024从Sora看基于多模态大模型的智能驾驶新范式（报告出品方：兴业证券）Sora在工程上证明了Transformer做多模态大模型的能力。2024年2月16日，OpenAl推出文生

Sora 自动驾驶

济南宝哥说房产 2024-03-12

人工智能行业专题报告：从算力、算法、数据和应用看AIGC

（报告出品方/作者：华西证券，朱芸，李佳妮，侯钧皓，吴嘉悦） 01、核心观点 AIGC未来已来，超预期持续出现。从2018到2023年，四代GPT模型高速进步，从简单的问答、阅读理解、文本总结，到

人工智能 AIGC

未来智库 2023-03-20

近期资讯

上海财经大学成立计算机与人工智能学院，“80后”院长什么来头？

12月28日，上海财经大学成立计算机与人工智能学院，“80后”学者、现上海财经大学教授陆品燕担任院长。陆品燕是世界知名的理论计算机科学家，曾获2014年中国计算机学会青年科学家奖、2019年国际计算机学会(ACM)杰出科学家奖、第八届世界华人数学家大会ICCM数学银奖及2020年上海市劳动模范（先进工作者）。

澎湃新闻 2024-12-29

李想“驾驶”理想冲入人工智能

但在九周年的时候，李想延续了自今年3月的沉默和低调，他没有内部讲话，也没有发内部信，“他也就出来参与了内部活动的抽奖。”“L3或者有监督智能驾驶并不是L2的延续，而是L4或者自动驾驶的先导程序。李想认为，AGI（通用人工智能）有三个阶段。

钛媒体APP 2024-12-29

这一家族又添利器 2025年“探索三号”将进行常规化科考

12月29日，我国首艘具有覆盖全球深远海探测并具备冰区载人深潜支持能力的综合科考船“探索三号”正式入列，标志着“探索”系列家族又添一大国利器。“探索三号”入列后，明年上半年将搭载“深海勇士”号载人潜水器在南海开展常规科考作业、深海装备海试以及深海考古等工作。2025年下半年，将进入深海大洋开展载人深潜作业。

千龙网 2024-12-29

麒麟8000A加持！华为畅享70X下周见

有微博网友爆料称，华为即将推出全新的畅享70X智能手机，预计将于下周正式亮相。据悉，华为畅享70X将搭载华为自主研发的麒麟8000A芯片，并支持5G网络，这一变化不仅结束了近几代畅享系列机型不支持5G的历史，也标志着华为畅享系列将告别高通骁龙芯片。除了5G网络的支持，华为畅享70X还将配备旗舰机才有的北斗卫星通信功能。

中关村在线 2024-12-29

Intel三款酷睿Ultra 200H处理器性能曝光：最高16核、5.4GHz

快科技12月29日消息，英特尔即将推出的新款酷睿Ultra200H系列的三款SKU在Geekbench上曝光，揭示了它们的单核和多核性能以及规格。首先是酷睿Ultra5225H，其在Geekbench6测试中单核得分2665分，多核得分14526分。

驱动之家 2024-12-29

一加Ace 5系列双品齐发，开启游戏体验天花板

2024年12月26日，一加正式发布游戏体验天花板一加Ace5系列——一加Ace5及一加Ace5Pro。一加Ace5系列深度聚焦性能和游戏体验，搭载骁龙8系旗舰平台和行业首个自研芯片级游戏技术「风驰游戏内核」，带来持久满帧的流畅游戏体验。一加Ace5Pro售价3399元起，一加Ace5售价2299元起。

时代周报 2024-12-29

最高时速450公里高铁来了！CR450动车组样车在京发布｜快讯

据国铁集团发布消息，12月29日，CR450动车组样车在北京发布，这标志着“CR450科技创新工程”取得重大突破。

华夏时报 2024-12-29

粉碎十年里的十大“科学”流言！看看你“中招”了几条

12月29日，由北京市科协、北京市委网信办主办的“智止流言探求真知”——“科学”流言求真榜十周年发布，粉碎十大“科学”流言。1.流言：据不完全统计，二维码每天的全球使用量高达100多亿。

北青网 2024-12-29

深圳：竞逐“低空第一城”

1000多架无人机腾空而起，在空中不断变换造型，组成奥运五环、火炬手、运动员等图案，配合无人机释放的流光溢彩焰火秀，点亮了城市夜空……参加表演的无人机全部来自深圳一家专精特新的“小巨人”企业。公司创始人高建民介绍。这只是深圳1700余家无人机及产业链企业中的一家，烟花表演也只是深圳众多无人机应用场景中的一项。

金台资讯 2024-12-29

海关总署：促进海关业务数据互联互通，深入推进长三角云擎站点建设

钛媒体App12月29日消息，海关总署今天公布出台新一轮支持长三角区域一体化发展16项措施。

钛媒体快报 2024-12-29

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1