当前位置：首页|资讯|人工智能|OpenAI|谷歌|英伟达|Sora

“世界模型”：通往通用人工智能的探索

作者：AIAgent观察发布时间：2024-03-12

人工智能 OpenAI 谷歌英伟达 Sora

近日，热议“世界模型”的潮流突然袭来。

“世界模型”大讨论的起因是三个新模型的密集发布：OpenAI发布了一款名为Sora 的新模型，宣称其为“世界模型”：Meta发布V-JEPA，虽然其在视频生成上的表现略逊于Sora，却号称应用了非生成式的世界模型；谷歌也发布了Genie，并称Genie是根据互联网视频训练的基础世界模型。

由此也引发了AI圈内的头部科学家、研究者对于世界模型的大讨论。英伟达AI研究员Jim Fan认为，Sora是一款数据驱动的物理引擎，是个可学习的模拟器或“世界模型”。而图灵奖获得者、Meta首席科学家杨立昆（Yann LeCun）却认为，Sora的生成式模型与“世界模型”相去甚远，视频生成与“世界模型”的因果预测有很大不同——视频生成的空间非常大，只需要产生一个合理的样本就可视为成功，而真实视频的合理延续空间要小得多，尤其是在特定动作条件下，难度就更大了。

当前，业界对于“世界模型”并没有一个标准的定义，但它被普遍认为是通往通用人工智能的重要路径，其目标是构建一个能够准确理解和模拟现实世界的系统，以实现更自然、智能的人机交互；其特点在于让机器能够像人类一样对真实世界有一个全面而准确的认知，不仅包括对事物的描述和分类，还包括对事物的关系、规律、原因和结果的理解和预测，从而进行推理和决策。

世界模型的发展充满了竞争和挑战，其中包括对物理规律的模拟。一个理想的世界模型应该能够准确地模拟物体的运动、碰撞和互动，以及其他物理规律。这需要深入的物理建模和计算能力。从OpenAI发布的视频来看，虽然具有高保真度，但模拟物理规律似乎是其薄弱点，交互能力也难以展现出来。与之相比，谷歌的Genie对真实世界物理有着更深入的理解，能够推断生成环境中的潜在动作。

Meta的V-JEPA则提供了新的思路和方法。杨立昆认为，实现“世界模型”更理想的方式，应该是让机器智能像人类般学习、建立起周遭世界的内部模型，从而高效学习、适应并制定计划以完成各种复杂的任务；因此他认为，JEPA架构更能接近“世界模型”路线。

V-JEPA是一个具有创新意义的AI模型。通过观察视频来学习世界的内部模型，V-JEPA可以从视觉数据中提取出更丰富和更通用的特征表示，从而提高AI在各种视觉任务上的性能和效率。

Sora、谷歌Genie和Meta V-JEPA代表了不同的探索方向，各自有着不同的优势和不足。谁能够引领世界模型的风向，目前还难以下定论。而这种竞争和争议将进一步推动“世界模型”的进步。

推荐体验

相关资讯

WAIC 2024| 专家：通专融合是通往通用人工智能的战略路径

在大会科学前沿主论坛上，上海人工智能实验室主任、首席科学家，清华大学惠妍讲席教授，衔远科技创始人周伯文揭示了通用人工智能（AGI）的未来图景，还剖析了通往AGI的战略路径——通专融合。通过对历史生产力提升的分…

人工智能 AGI 清华

环球Tech 2024-07-07

从感知世界到认知世界 “紫东太初”全模态大模型持续探索通用人工智能新路径

5月6日，在华为昇腾AI开发者峰会上，中国科学院自动化研究所“紫东太初”大模型研究中心常务副主任、武汉人工智能研究院院长王金桥介绍，基于华为全栈国产化软硬件平台昇腾AI与开源AI框架昇思MindSpore，中国科学院自动化研究所和武汉人工智能研究院正在联合打造“紫东太初”2.0全模态大模型，可实现文本、图片、语音、视频、3D点云、传感信号...

人工智能华为

央广网 2023-05-07

AGI/通用人工智能

参考消息网3月1日报道（文/何娟）近日，开放人工智能研究中心（OpenAI）发布文本转视频大模型Sora，可以将文本转换为长达60秒的高清视频，被认为是实现通用人工智能（ArtificialGeneralIntelligence，AGI）的重要里程碑。

AGI 人工智能 OpenAI Sora

参考消息 2024-03-01

通用人工智能，何谓通用？（2024.05.14归档）

【本篇首发于2024.05.14微信朋友圈】 [图片] [图片] 还记得三年前，我在课上问了Jimmy Ba一个问题：如何实现真正的AGI？当时Jimmy是这么说的目前有两个主流方向，第一个是以OpenAI为代表的大语言模型，只要参数堆得够多，就可以大力出奇迹把通用智能堆出来。没想到仅仅一年出头，OpenAI还真就堆出了一个gpt3 第二个则是以DeepMind为代表的世界模拟，让一个智能体在模拟环境中交互和学习，如果模拟的环境越来越复杂，直到趋近真实世界的复杂程度，那么这个智能体自然就会有一定程度的

人工智能 AGI OpenAI 大语言模型

TheIllusiveMan00 2024-09-11

世界人工智能大会首设“迈向通用人工智能”展区，360智脑大模型参展

2023世界人工智能大会于7月6在上海开幕，大会首次设置“迈向通用人工智能”主题展区，三六零(601360.SH,下称“360”)集团自研通用大模型“360智脑”入驻展区。展区以“打造人工智能世界级产业集群”为指引，设置“算力基础”、“模型底座”、“智能应用”、“创新前沿”四大板块，360集团、阿里、商汤等大模型企业入驻。 360展区展示了“360智脑”大模型为上海市训练的两个“城市本地宝”：上海城市招商宝和上海文旅万事通。“城市招商宝”现场就上海咖啡行业发展前景等问题给出了投资建议，“文旅万事通”能够

人工智能商汤融资

王评天下 2023-07-06

近期资讯

“嫦娥五号月球样品展”亮相北京天文馆，涵盖月壤多种形态

展览展示共计0.6克嫦娥五号月球样品，涵盖了月壤的多种形态。展览通过丰富的展品和创新的科技手段，多维度展示月壤特性，介绍月球样品所承载的科学价值。12月28日，“问月——中国探月工程嫦娥五号月球样品展”拉开帷幕。2020年12月，嫦娥五号成功从月球带回月壤样品，月球样品科研工作随之展开。

新京报 2024-12-28

快手：可灵AI上线可图1.5模型图生视频推出尾帧生成功能

12月28日，记者从快手获悉，可灵AI宣布面向全球上线可图1.5图像模型，AI图片的画面质量和人像美感再上新台阶；同时推出全新的“AI模特”功能，可精准生成高质量AI模特。此外，可灵AI还发布了基于可灵1.5模型的尾帧生成能力，对口型功能也上新更多音色。AI图片方面，快手介绍，本次可图1.5图像模型带来了画面质量及美感大幅提升。

中国证券报 2024-12-28

咸宁卧飞电子取得一种易接电拆装的手机锂电池专利，解决手机锂电池接电检查不便问题

金融界2024年12月28日消息，国家知识产权局信息显示，咸宁卧飞电子有限公司取得一项名为“一种易接电拆装的手机锂电池”的专利，授权公告号CN222214386U，申请日期为2024年1月。

金融界 2024-12-28

2024年MIT最具影响力的十大研究：液态金属3D打印、防篡改ID标签

为纪念这一年的辉煌成就，MITNews特别精选了今年最受关注的10大热点研究项目，下面进行简要介绍（部分研究项目可点击图片阅读原文）。现有的金属增材制造方法，如电弧增材制造，虽然能够生产大型部件，但速度慢且容易产生结构缺陷，限制了其广泛应用。

DeepTech深科技 2024-12-28

详细指南：如何正确安装INF文件以确保设备正常运行

INF文件是一种文本文件，通常用于安装驱动程序或其他软件组件。INF文件是“信息文件”的缩写，主要用于描述驱动程序的安装过程。通过安装INF文件，你可以手动告诉系统如何处理这些设备，从而确保它们能够正常运行。

新报观察 2024-12-28

美推翻阿波罗17号月壤结论，月球年龄不对，如今为重返月球很着急

》杂志给出了精确的说明，那就是说来自美国“阿波罗17号”登月任务下的月球样品之中，出现了月球上“最古老的一块”。德国航空航天中心研究人员2020年发布的计算结果显示，月球形成于约44.25亿年前。过后，研究人员们通过以采自月球的一块苏长岩碎片中的锆石晶体为样本，首次使用原子探针层析成像技术。

环球科学猫 2024-12-28

西部首个AI主题公园落地成都全国AI数字创意大赛揭榜

12月27日，西部首个AI主题公园发布会暨新“智”慧全国Al数字创意大赛颁奖盛典在成都市武侯区铁佛公园落幕。经过数月的精心筹备与激烈角逐，广州美术学院的参赛作品“竹宝清洁机器人”凭借其独特的创意设计和卓越的功能性，一举夺得大赛一等奖。

封面新闻 2024-12-28

苏州佑米取得便于更换插针的电池换电口专利，实现快速便捷维修

金融界2024年12月28日消息，国家知识产权局信息显示，苏州佑米科技有限公司取得一项名为“便于更换插针的电池换电口”的专利，授权公告号CN222214387U，申请日期为2024年4月。专利摘要显示，本实用新型公开了一种便于更换插针的电池换电口，属于换电电池充放电口技术领域。

金融界 2024-12-28

量子计算加速发展，业内：距离商业化应用还有很长的路要走

12月上旬，谷歌公司推出其最新量子芯片Willow。几天之后，我国科研团队在预印本网站arXiv发布了“祖冲之三号”的相关成果。业内人士认为，目前，量子计算依旧处于早期发展和产业化初期阶段，距离商业化应用还有很长的路要走，需要产学研各界长期共同努力。

华尔街见闻 2024-12-28

未来之瞳科学公园开园西安丝路科学城释放宜居宜业“强磁力”

央广网西安12月28日消息（记者陈锵）12月27日，西安高新区举办未来之瞳科学公园开园暨新建道路通车仪式。公园主要再生水源为西安市第七污水处理厂，国际社区东岸污水处理厂作为备用水源，经西太路敷设的再生水管网对项目进行供水，通过永安渠水系生态系统自然储存净化，转化为具有生态属性的“生态水”，再退入天然水体，形成再生水、雨水生态涵养循环系统。

央广网 2024-12-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1