当前位置：首页|资讯

赋能智慧交通、智能电网，北大等学者以“多智能体强化学习研究”登上Nature子刊

作者：福布斯发布时间：2024-09-06

最近，由北京大学人工智能研究院杨耀东课题组牵头，北京大学工学院、计算机学院和伦敦国王学院协作完成的研究成果——“大规模多智能体系统的高效强化学习” 在人工智能顶级学术期刊 Nature Machine Intelligence 上发表。

据悉，该成果首次在多智能体系统中实现了高效的去中心化协同决策，显著提升了人工智能方法在大规模多智能体系统中的扩展性和适用性。

多智能系统主要以庞大的智能体交互数据为基础，利用大量计算资源驱动每个智能体学习如何与其他智能体合作执行复杂任务，其核心范式是多智能体强化学习。

论文表示，开发大规模智能体系统的主要挑战在于实现可扩展，即在保持足够性能的同时，实现AI模型的扩展。现有研究表明，分布式人工智能可以通过分解复杂任务并将其分布在协作节点上，以便提高可扩展性。然而，由于对通信和采样数据的大量要求，以往的技术在的适用性和可扩展性都有不足。

研究团队开发了一个基于模型的分散策略优化框架，可以有效地部署在多智能体系统中。通过利用全局动力学的代理级拓扑解耦的局部观测，证明了这种分散机制实现了对全局信息的准确估计。重要的是，他们进一步引入了模型学习，以在有限数量的采样数据下强化单调改进的最优策略。不同场景的实证结果表明，该方法具有卓越的可扩展性，特别是在具有数百个智能体的现实世界系统中，从而为扩展智能系统铺平了道路。

研究结果表明，该方法能够扩展到具有数百个智能体的大规模电网和交通等网络化系统中，在较低的通信成本下实现较高的决策性能。例如，当在城市交通系统中控制交通信号灯时，频繁的大规模通信操作容易增加功率损失和被信号干扰的概率，并且计算复杂性将随着交通灯数量的增多而指数级增加。因此，有必要设计能够在有限数据和客观通信约束下，将决策能力扩展到包含大量智能体的复杂真实系统中的多智能体强化学习方法。

推荐体验

相关资讯

IJCAI2023 多智能体强化学习论文合集

国际人工智能联合会议（International Joint Conference on Artificial Intelligence, 简称为IJCAI）是人工智能领域中最主要的学术会议之一。该会议每两年举办一次，汇聚了世界各地的学者、研究人员和工程师，分享最新的人工智能研究成果、探讨前沿技术和趋势、以及交流学术思想和见解。AMiner通过AI技术，对 IJCAI2023 收录的会议论文进行了分类整理，今日分享的是多智能体强化学习主题论文，共11篇，我们在这里展示十篇最受欢迎的论文，欢迎下载收藏！1.

AMiner科技 2023-06-07

OpenRL强化学习框架，支持单智能体、多智能体训练，还可训练自然语言任务!

OpenRL 是由第四范式强化学习团队开发的基于PyTorch的强化学习研究框架，支持单智能体、多智能体、自然语言等多种任务的训练。OpenRL基于PyTorch进行开发，目标是为强化学习研究社区提供一个简单易用、灵活高效、可持续扩展的平台。目前，OpenRL支持的特性包括：简单易用且支持单智能体、多智能体训练的通用接口支持自然语言任务（如对话任务）的强化学习训练支持从 Hugging Face 上导入模型和数据支持LSTM，GRU，Transformer等模型支持多种训练加速，例如：自动混合精度训练，

第四范式 Hugging Face

OpenRL官方 2023-05-15

AI并没有学习 Nature子刊最新研究解码人工智能黑盒

波恩大学化学信息学专家JürgenBajorath教授和他的团队设计了一种技术，揭示了药物研究中使用的某些人工智能系统的运行机制。研究结果表明，这些人工智能模型主要依赖于回忆现有数据，而不是学习特定的化学相互作用来预测药物的有效性。研究结果最近发表于《自然机器智能》杂志。

金融界 2024-01-16

综述 | 200+参考文献！自动驾驶的多智能体强化学习

来源：3D视觉工坊添加小助理：cv3d008，备注：方向+学校/公司+昵称，拉你入群。文末附3D视觉行业细分群。扫描下方二维码，加入「3D视觉从入门到精通」知识星球，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门秘制视频课程、最新顶会论文、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研，欢迎扫码加入！ [图片] 0. 论文信息标题：Multi-Agent Reinforcement Learning for Autonomous Driving: A S

3D视觉工坊 2024-08-26

深度强化学习实战:用OpenAI Gym构建智能体

链接：https://pan.baidu.com/s/1VQOax7FanvU83L2iBXibUw?pwd=ewdn 提取码：ewdn一本介绍在OpenAI Gym环节中构建智能体的实战指南！只需要专注算法的优化，无需浪费时间去搭建环境！ ·从零起步，内容通俗易懂，轻松学习OpenAI Gym的用法 ·运用强化学习/深度强化学习算法构建智能体，不用浪费时间去搭建环境！ ·案例应用侧重于游戏、自动驾驶领域，帮你解决基于智能体的领域问题！ ·基于Python编程语言，讲解基本概念和应用知识，操作易上手！●

OpenAI 百度自动驾驶编程

刘姥姥看人间 2023-07-28

近期资讯

电网仿真、预测、调度决策中的AI应用实践

关键词：人工智能新能源电网仿真计算负荷预测调度运行智能决策电力系统超算知识图谱强化学习大模型机器学习气象预测功率预测时序预测辅助决策峰会概述讲义导图核心内容01 电网与人工智能：融合与发展2023年我国电网总装机达29.2亿千瓦。新能源装机超过10亿千瓦，发展迅速。国网经营区2023年新增装机2.4亿千瓦。新增装机量接近美国新能源总装机（2.5亿千瓦）。新能源发展带来电网安全等巨大挑战。电力系统运行技术已形成高度可靠基于物理模型的机理分析模式。国网公司建立基

AIoT智慧城市知识库 2024-09-12

6-JSA二维数组

----------▉ 什么是二维数组？表格中的数据有行、列之分，A1就是A列第1行的单元格，这种行列就像是一个坐标系，有横轴、纵轴，这就是二维。在JavaScript中也可以模拟出这样的二维数据，很简答，给把数组的每个参数中，再赋值一个数组就可以了。比如上面表格中的数据，就可以使用下面的JSA代码来填充。```function test(){ let a= [[1,2,3],[4,5,6]] Range("A1:C2").Value2=a}```----------▉ 为什么要用二维数组？JSA中提到数

拉小登Excel 2024-09-12

Blank liposome对照脂质体/空白脂质体/粒径400nm 脂质体载药定制服务

产品名称：400nm空白脂质体(lipsome)英文名称：400nm Blank Liposome 目录号：ML-定制产品说明：400nm空白脂质体（Blank Liposome）是一种由磷脂双层膜构成的纳米级球状囊泡，直径约为400纳米，内部不含任何药物或活性成分。400nm的脂质体粒径较大，适用于特定的生物医学应用，如用于提高特定细胞或组织的摄取率，或用于研究脂质体的物理化学特性。在药物递送、基因载体和疫苗开发等研究中，400nm空白脂质体常作为对照组，用于评估载药脂质体的效果和排除载体本身的影响

魅罗科技 2024-09-12

如何强化仓储安全，延长重型货架寿命

仓储重型货架的安全性和使用寿命对于仓库的运营至关重要。为了保障其安全并延长使用寿命，可以从以下几个方面进行考虑和实施：一、保障仓储重型货架安全合理选择与安装：需求分析：根据存储物品的重量、尺寸、存取频率等因素，合理选择重型货架的类型和规格。质量检查：在购买前，对货架的材质、焊接工艺、承重能力等进行仔细检查，确保货架质量符合相关标准。专业安装：聘请具有资质的专业团队进行货架的安装，确保安装过程符合规范，安装位置准确，基础稳固。规范使用与操作：限制承重：严格遵守货架的额定承重限制，不得超载使用。均匀分布：尽量

鑫歆杰钢钩 2024-09-12

每日一题9月11日答案

物理化学有机化学无机化学分析化学化工原理生物化学高分子材料科学基础

振宇考研 2024-09-12

TDK官方认证中国四大TDK电容代理名单

在快速迭代的电子科技时代，选择可靠的合作伙伴是确保项目成功与品质保障的关键。TDK，作为电子元件领域的领航者，凭借其卓越的产品性能和稳定的质量，赢得了全球客户的信赖。今日，我们自豪地宣布TDK公司正式授权的四大一级代理商名单，他们不仅承载着TDK的品牌荣耀，更以专业的服务和优质的产品，为市场注入源源不断的活力。一、奋能达电子（深圳）有限公司 —— 品质之源，服务之巅作为TDK及MURATA村田的原厂授权代理商，奋能达电子（深圳）有限公司以其深厚的行业积淀和卓越的供应链管理能力，为客户提供了一站式的电子

奋能达电子 2024-09-12

宝马X6 2023款说明书用户手册｜BMW X6 2023 Owner's

2023款宝马X6说明书为PDF电子版本，2023款宝马X6车主手册帮助车主快速掌握车辆的各种实用功能，免费下载方便携带，2023款宝马X6用户手册是车主必备的电子使用手册。点击进入：https://www.carobook.com/bmw-sms/bmw-x6-2023-owners-manual.html [图片] 2023款宝马X6采用了运动风格的溜背造型，让整车拥有非常优雅动感的外观。2023款宝马X6重新设计了下包围造型，中网下部采用了一块黑色饰板，内部包含了复杂的空气动力学结构。采用了回旋镖

CarOBook车主随身手册 2024-09-12

【医疗面试】跟黎老师读报学面试第37期

医院开设六点半窗口 [图片] [图片]

医疗面试黎老师 2024-09-12

Sulfo-Cy5.5 DBCO，磺化Cy5.5-二苯基环辛炔

磺化Cy5.5-二苯基环辛炔（Sulfonated Cy5.5-DIBO）是一种具有荧光特性的染料，与二苯基环辛炔（DIBO）结合，常用于生物正交化学反应，特别是在点击化学中。该分子包含Cy5.5染料的磺化版本，因此具有良好的水溶性，同时保持较强的荧光特性。由于其磺化基团，该化合物能够与生物体系相容，并减少非特异性结合。应用：用于生物正交反应，如与叠氮基团的点击化学反应。标记细胞或蛋白质，用于活体成像和生物分子检测。磺化的特性使其能够在水相系统中使用，适合体内实验。 [图片] 相关产品： Sul

齐岳创科 2024-09-12

智能测试桩-管道阴极保护智能检测

阴极保护智能测试桩是一种专为管道阴极保护监测而设计的智能化设备。它能够自动采集数据，并在采集完成后自动上传至服务器。测试桩内部配备有时钟，我们可以预先设定上传时间，以便在指定的时间点进行数据采集和上传。阴保智能测试桩采用了目前高标准高精度的 A/D 转换芯片，确保了采集数据的准确性。其内部还搭载了 ARM 和 MCU 芯片，具有低功耗、高可靠性的特点，能够实现测试桩的自动数据采集和上传功能。此外，内置的 EMI 抗干扰滤波电路和科学的防雷电路，为设备的正常稳定运行提供了保障。该设备内部还配备了 GP

奥科阴极保护小课堂 2024-09-12

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1