当前位置：首页|资讯|AIGC|OpenAI|Sora

AIGC行业跟踪：OpenAI发布Sora，引领多模态大模型再突破（附下载）

作者：楼船落雪发布时间：2024-03-05

AIGC OpenAI Sora

今天分享的是【AIGC行业跟踪：OpenAI发布Sora，引领多模态大模型再突破】报告出品方：招商

OpenAl正式推出文字生成视频模型 Sora，可生成逼真长视频，且较其他模型在处理较长视频场景方面的表现更出色。根据 OpenAl 官网的介绍,OpenA正在教人工智能理解和模拟运动中的物理世界，旨在训练能够帮助人们解决需要真实世界交互的问题的模型。Sora 文生视频主要能力包括: 1)生成复杂场景且遵循物理世界规律，2) 借助 GPT 能力实现准确理解 Prompt，3)创建多个镜头并维持镜头间的一致性。相较其他视频模型，Sora 率先将文生视频长度突破 1 分钟，并实现较高的视频质量和一致性。根据 Gabor Cselle及 KEITO 等的对比，Sora 生成视频的长度与质量较 Pika、RunwayML 和Stable Video 等文生视频模型更出色。口Sora 经过大规模训练后表现出模拟能力。根据 Sora 的技术报告，OpenAl发现，视频模型在大规模训练时表现出了新兴功能，这些功能使 Sora 能够模拟现实世界中人、动物和环境的某些方面。具体来说，Sora 的模拟能力体现在:1)3D 一致性，2)长序列连贯性和目标持久性，3) 与世界互动，4)模拟数字世界。这些功能表明，视频模型的持续扩展是开发物理和数字世界以及生活在其中的物体、动物和人的高性能模拟器的一条有效路径。

Sora 为使用 Transformer 架构的扩散模型，OpenAl 将视觉数据转为patches 从而实现大规模训练。模型架构方面，Sora 是一种扩散模型，它从看起来像静态噪声的视频开始生成视频，然后通过多个步骤消除噪声来逐渐对其进行转换。与GPT模型类似，Sora 使用 Transformer 架构，从而实现强扩展性能。Transformer 在各个领域都表现出了卓越的缩放特性，在这项工作中，OpenAl发现扩散 Transformers 也可以有效地缩放为视频模型。在训练过程中，OpenAl 将视频和图像表示为称为 patch 的较小数据单元的集合，类似于 GPT中的 token。通过统一表示数据的方式，OpenAl 可以在比以前更广泛的视觉数据上训练模型，涵盖不同的持续时间、分辨率和纵横比。

免责声明：以上报告均系本平台通过公开、合法渠道获得，报告版权归原撰写/发布机构所有，如涉侵权，请联系删除；资料为推荐阅读，仅供参考学习，如对内容存疑，请与原撰写/发布机构联系

推荐体验

相关资讯

AIGC专题：从Sora看多模态大模型发展（附下载）

输入原始视频，输出一个在时间和空间上都压缩了的潜在空间。为了效率以及联合处理图像和视频，该团队是以窗口方式计算自注意力，这基于两种类型的非重叠配置：空间（S）和时空（ST）•该团队在文本-图像和文本-视频对上联合训练了W.A.L.T的文本…

烟树晚雁 2024-03-06

AIGC专题：从Sora看基于多模态大模型的智能驾驶新范式（附下载）

今天分享的是AIGC系列深度研究报告：《AIGC专题：从Sora看基于多模态大模型的智能驾驶新范式》。（报告出品方：兴业证券）报告共计：9页海量/完整电子版/报告下载方式：公众号《人工智能学派》

AIGC 自动驾驶 Sora 人工智能

小猫超可爱 2024-03-02

2023年AIGC多模态大模型应用快速迭代(附下载)

今天分享的是：2023年AIGC多模态大模型应用快速迭代（报告出品方：国信证券）报告概要A1带动近期市场表现，(hatbot用户活跃表现良好。1)从海外看，由于0penA1、谷歌等大模型进展迅速，

漫热动漫 2024-03-22

2024从Sora看基于多模态大模型的智能驾驶新范式(附下载)

今天分享的是：2024从Sora看基于多模态大模型的智能驾驶新范式（报告出品方：兴业证券）Sora在工程上证明了Transformer做多模态大模型的能力。2024年2月16日，OpenAl推出文生

Sora 自动驾驶

济南宝哥说房产 2024-03-12

传媒行业AIGC系列研究：多模态大模型引领，应用端曙光初现

今天分享的是：《传媒行业AIGC系列研究：多模态大模型引领，应用端曙光初现》（内容出品方：国信证券）报告共计：31页摘要康层大横型持续选代，国产大模型加速应用走向成熟。年初以来海内外大模型特别是

奇怪的小宝贝82 2024-04-30

近期资讯

安徽博衡电力科技取得种配电柜的排线结构专利，能够灵活适应不同大小电器元件的混合安装需求

金融界2024年12月28日消息，国家知识产权局信息显示，安徽博衡电力科技有限公司取得一项名为“种配电柜的排线结构”的专利，授权公告号CN222214814U，申请日期为2024年4月。

金融界 2024-12-28

广西亮峰科技取得配电柜布线组件专利，增加夹持线缆数量

金融界2024年12月28日消息，国家知识产权局信息显示，广西亮峰科技有限公司取得一项名为“一种配电柜布线组件”的专利，授权公告号CN222214812U，申请日期为2024年4月。专利摘要显示，本实用新型公开了一种配电柜布线组件，属于配电柜布线结构技术领域。

金融界 2024-12-28

在Excel中轻松计算平均数的技巧与注意事项总结

计算平均数是Excel中最常见的操作之一。无论你是在做家庭预算、学生成绩分析，还是在工作中处理销售数据，平均数都能帮助你快速了解数据的整体趋势。

新报观察 2024-12-29

湖北致光取得便于理线的电表箱专利，确保导线排布在凹型板内部时不会翘起脱离凹型板

金融界2024年12月28日消息，国家知识产权局信息显示，湖北致光科技有限公司取得一项名为“一种便于理线的电表箱”的专利，授权公告号CN222214816U，申请日期为2024年4月。

金融界 2024-12-28

国网重庆市电力公司江津供电分公司取得具有线束整理功能的电表箱专利，可整理电表箱线束

金融界2024年12月28日消息，国家知识产权局信息显示，国网重庆市电力公司江津供电分公司取得一项名为“具有线束整理功能的电表箱”的专利，授权公告号CN222214821U，申请日期为2024年4月。

金融界 2024-12-28

在一台电脑上成功安装双系统的详细步骤与注意事项指南

咱们这就来聊聊，怎么在一台电脑上安装双系统，通常是Windows和Linux的组合，当然你也可以根据自己的需求选择其他系统。另外，你还需要一个USB启动盘，推荐使用Rufus或者UNetbootin这些工具来制作启动盘。确保你的电脑有足够的硬盘空间，最好是至少留出50GB的空闲空间给Linux系统。

新报观察 2024-12-29

如何删除QQ账号：步骤与注意事项详解，助你轻松做出决定

好吧，今天就跟大家聊聊怎么删除QQ这个问题。虽然QQ在很多人生活中占据了重要的位置，但总有一些时候，我们可能会觉得需要把它删掉。没错，删掉QQ之前，得先登录你的QQ账号。找到这个熟悉的蓝色小企鹅，输入账号和密码，进入你的QQ界面。

新报观察 2024-12-29

书签的多种用法与技巧：让阅读体验更丰富有趣的探索之旅

书签，这个看似简单的小工具，却在我们阅读的旅程中扮演着重要的角色。无论你是在看一本厚厚的小说，还是在翻阅一本专业的参考书，书签都能帮助你快速找到上次停下的地方，避免了翻阅整本书的麻烦。今天就来聊聊书签的用法，以及在使用书签时的一些小技巧。首先，书签的种类多种多样，有纸质的、塑料的、金属的，甚至还有电子书签。

新报观察 2024-12-29

重庆志优电气取得便于理线的配电柜专利，提高对线缆的理线效果

金融界2024年12月28日消息，国家知识产权局信息显示，重庆志优电气有限公司取得一项名为“一种便于理线的配电柜”的专利，授权公告号CN222214818U，申请日期为2024年4月。

金融界 2024-12-28

使用格式工厂轻松压缩视频文件，提升存储与分享便利性

在日常生活中，视频文件的大小常常让人感到困扰。这个软件在网上比较常见，下载安装包也不大，几分钟就能搞定。一般来说，25fps到30fps的帧率已经能够保证视频流畅播放。

新报观察 2024-12-29

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1