当前位置：首页|资讯|OpenAI|Sora

传媒行业OpenAI Sora专题：Transformer扩展优势凸显，视频理解与生成能力提升

作者：住事如风发布时间：2024-03-02

今天分享的是【传媒行业OpenAI Sora专题：Transformer扩展优势凸显，视频理解与生成能力提升】报告出品方：西南证券

事件: 2024年2月16日，OpenAI发布文生视频模型-Sora及其技术报告《Video generationmodels as world simulators )

从Sora模型看文生视频的技术路径: 技术路径尚未收敛，Transformer扩展特性优势凸显。市场大多认为扩散模型是图像和视频生成领域的主流路径，没有重视Transformer架构scale up的能力。OpenAI技术报告指出，Sora是基于扩散模型，但更强调，Sora是一个基于Transformer架构的扩散模型，其优秀的生成能力离不开Transformer架构优秀的scaling特性。当前，为构建性能更优、效率更高的视频生成模型，已出现多种结合Diffusion Model和Transformer架构的构建方式。

从sora模型看文生视频的最新能力( 假设展示视频以代表Sora的一般性表现:1)强大的理解能力: Sora模型不仅可以理解Prompt的内容，还能理解事物在物理世界中的存在方式，突出的语言理解能力是其能够准确生成视频的前提。2)优秀的生成能力: 长度:可生成60s视频，@复杂度:能够生成包合多个角色、多种主题、多类运动形态的复杂场景，3逼真度:能够呈现更多的视觉细节，具备更高清的画质，为用户提供逼真的视觉体验，连贯性&一致性: 可以生成同一角色的多个镜头，保持其在整个视频中的外观，在角度移动和切换情况下人物和场景元素在一维空间中的位置关系能够保持一致的运动:5可控性:在某一Prompt基础上只改动一个关键词仍能生成优质的视频，具备较好的可控性。3)其他能力 :图生视频，视频扩展/编辑/拼接/模拟等。

从Sora模型看文生视频的行业影 :目前OpenAI已向部分视觉艺术家、设计师和电影制作人提供访问权限，以获取专业的反馈。我们认为，以Sora为代表的视频生成模型有望给广告/设计/短视频/游戏等行业带来变化。从中短期来看，视频生成模型将更多的作为创作工具对相关行业进行赋能。

免责声明：以上报告均系本平台通过公开、合法渠道获得，报告版权归原撰写/发布机构所有，如涉侵权，请联系删除；资料为推荐阅读，仅供参考学习，如对内容存疑，请与原撰写/发布机构联系

推荐体验

相关资讯

OpenAI Sora专题：Transformer扩展优势凸显，视频理解与生成能力提升

①DALL·E帮助文本和视频的高质量配对：OpenAI技术报告指出，研发团队将DALL·E3的文字描述技术应用到视频训练上，训练出一个较强的文字描述模型，并在训练Sora时通过使用大量的与视频相对应的高准确度…

OpenAI Sora DALL·E

报告派研读 2024-03-06

OpenAI推视频生成模型sora：可以假乱真动画与视频行业面临变革

雷递网乐天2月16日AI正在加速行业变革。AI企业OpenAI今日正式发布视频生成模型sora，Sora是视觉数据的通用模型，它可以生成不同时长、长宽比和分辨率的视频和图像，最多可达一分钟的高清视频。具体来说，Sora在可变持续时间、分辨率和宽高比的视频和图像上联合训练文本条件扩散模型。

雷递 2024-02-16

OpenAI推出人工智能视频生成模型 “Sora” | 国际专题

搜狐知世账号报道过去24小时国际事件：…

OpenAI 人工智能

知世 2024-02-21

多模态深度学习模型在视频理解中的优势与挑战

在某些情况下，某种单一数据源可能受到干扰或者失效，但是多模态深度学习模型可以通过其他数据源提供的信息来弥补这种缺失，从而提高鲁棒性。综上所述，多模态深度学习模型在视频理解中具有明显的优势，能够提高准确性、拓展…

金山红贝 2024-02-21

传媒行业专题报告：AIGC赋能漫画生产，有望驱动文学IP价值提升

2）按内容呈现来看，早期动画和漫画内容较为割裂，动漫画内容皆为单独创作，后期随制作工艺提升，由漫画改变的动画逐渐占据市场主流，包括《火影》、《名侦探柯南》、《海贼王》等著名IP，动画漫画深度融合形成“动+漫”…

报告派研读 2024-01-22

近期资讯

祝福祖国！神十八乘组在空间站展示载人航天历程卷轴

今天是新中国成立75周年，神十八乘组在空间站迎接国庆，向大家展示了一幅展示载人航天历程的卷轴。

上游新闻 15小时前

微软 Win11 “重温经典”，紧凑任务栏有望回归

IT之家10月1日消息，消息源@PhantomOfEarth今天（10月1日）在X平台发布推文，报道称在Windows11BetaBuild22635.4291预览版更新中，引入了“显示较小任务栏图标”选项。1.安装Windows11Build22635.3790预览版更新。

IT之家 15小时前

要回家了！神舟十九号载人飞船，本月发射！

根据中国载人航天工程办公室发布的10月载人航天月历，我国计划于本月下旬发射神舟十九号载人飞船，迎接神舟十八号乘组返回。本月，神十八乘组将完成太空出差任务，开启返程之旅。

光明网 15小时前

苹果危险了！华荣米OV新机10月发：四大趋势已明朗

但这两款新机只是手机行业新一轮竞赛的开始，在激烈的竞争之下，去年11月发布天玑9300的联发科，今年将天玑9400发布会时间提前到10月9日，高通则将于10月21日-10月23日召开2024骁龙峰会，带来全新旗舰芯片骁龙8Gen4（也可能命名为“骁龙8Elite”）。

雷科技 15小时前

智能家居：未来生活的全景画卷

通过将各种智能设备和技术集成到家庭环境中，智能家居不仅提高了生活的便捷性和舒适性，还提升了能源效率和安全性。智能设备（SmartDevices）SmartDevices智能设备是智能家居系统的核心，包括智能灯泡、智能插座、智能门锁、智能家电等。

新报观察 15小时前

索尼：PlayStation网络出现问题

索尼称，其在线游戏服务PlayStationNetwork出现问题，影响了包括PS5和PS4在内的平台。用户可能难以在PlayStationStore上启动游戏、应用程序或网络功能，以及登录账户或购买产品。索尼称，将努力“尽快”解决这个问题。

金融界 15小时前

号称2D版《绝区零》的《归龙潮》：玩着玩着就睡着了

归龙潮这游戏，距离公测已经过了挺长时间。也许不少人都没听说过，但在关注二游的圈子中，它的讨论度并不低。一方面，这游戏是新工作室的处女作，属于是二游厂商新血液。而且美术有特色，

18小时前

神十八在轨超5个月，神舟十九号3乘组10月出征，6名航天员将同飞

神舟十八号在轨已经超过5个月，这也意味着返回地球的时间越来越近了，所以，很快三位航天员就要准备迎接神舟十九号航天员，并且准备返回地球的准备。下面就详细来看看，这一次我国神舟十八号航天员到底完成了什么成果来了，接下来我国神舟十九号载人飞船任务会有什么变化。

环球科学猫 15小时前

江西吉安市五中开展庆祝新中国成立75周年系列活动

学校精心策划了一系列庆祝活动，以表达对祖国的热爱与祝福。“我和国旗合个影”活动吸引众多同学参与，创意合影展现对祖国的热爱。此次庆祝活动不仅丰富了校园生活，更激发了同学们的爱国热情和民族自豪感。

中国新闻网 15小时前

AMD锐龙9000两大补丁正式发布！延迟大降58％、性能提升35％

快科技10月1日消息，随着X870E/X870主板的正式解禁上市，AMD宣布了多条重大消息，尤其是锐龙9000系列的延迟问题、架构优化。AMD表示，部分媒体测试发现，双CCD配置锐龙9000系列的核心间延迟偏高，但他们测试的场景很罕见，对实际性能影响很小，但即便如此，AMD还是做了优化。

驱动之家 15小时前

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1