自博弈指的是智能体通过与自身副本或历史版本进行博弈而进行演化的方法,近年来在强化学习领域受到广泛重视。这篇综述首先梳理了自博弈的基本背景,包括多智能体强化学习框架和博弈论的基础背景。...【查看原文】
自博弈指的是智能体通过与自身副本或历史版本进行博弈而进行演化的方法,近年来在强化学习领域受到广泛重视。这篇综述首先梳理了自博弈的基本背景,包括多智能体强化学习框架和博弈论的基础背景。
清华北大
机器之心 2024-09-10
OpenAI训练了一个自博弈(Self-play)模型o1-IOI,该模型在2024年国际信息学奥林匹克竞赛(IOI)中获得了213分,超过49%的人类选手(即大模型大约处在人类水平的中间状态)。但自博弈模型…
OpenAI
书圈 2024-10-07
源自:自动化学报作者:胡子剑, 高晓光, 万开方, 张乐天, 汪强龙“人工智能技术与咨询” 发布摘 要作为一种不需要事先获得训练数据的机器学习方法, 强化学习(Reinforcement learning, RL)在智能体与环境的不断交互过程中寻找最优策略, 是解决序贯决策问题的一种重要方法. 通过与深度学习(Deep learning, DL)结合, 深度强化学习(Deep reinforcement learning, DRL)同时具备了强大的感知和决策能力, 被广泛应用于多个领域来解决复杂的决策问题
人工智能机器学习深度学习
ltyt_AI 2023-12-22
什么是强化学习?强化学习 (RL) 是一种功能强大的机器学习 (ML) 方法,近年来在各行各业中得到越来越广泛的应用。这是一种基于反馈的方法,让人工智能 (AI) 驱动的系统(称为 agent,代理)通过反复迭代来学习如何在环境中完成任务。当需要实时决策、缩短周转时间、降低功耗和提高性能时,RL 可以充当得力助手。RL 是人工智能技术的一个子集,在各行各业中的应用越来越普遍,其中包括电子设计自动化 (EDA)。EDA 中的 RL 可助力设计复杂的电子电路和系统,此类设计通常要进行多次迭代,并且需要不断优化
机器学习人工智能
Cadence楷登 2024-01-31
研究团队负责人杨耀东表示:「未来我们将继续深入推进多智能体学习理论与方法的研究,并赋能具身智能和世界模型等前沿人工智能领域,显著提升更广泛的智能系统在协作、预测和决策方面的能力,使其在复杂动态环境中更加灵活高…
北大人工智能
机器之心Pro 2024-09-17
金融界2024年12月25日消息,国家知识产权局信息显示,中国电信股份有限公司申请一项名为“移动终端的定位方法、装置以及电子设备”的专利,公开号CN119172852A,申请日期为2024年9月。专利摘要显示,本申请公开了一种移动终端的定位方法、装置以及电子设备。涉及通信技术领域。
金融界 2024-12-25
金融界2024年12月25日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“一种数据传输方法及装置”的专利,公开号CN119172863A,申请日期为2023年6月。专利摘要显示,本申请提供了一种数据传输方法及装置。该方法包括:第一装置根据第一时间段是否包含一个完整同步信号和物理广播信道SSB,确定第一上行数据的时域资源。
金融界2024年12月25日消息,国家知识产权局信息显示,先禾新材料(苏州)有限公司取得一项名为“一种用于导热胶生产的原料快速反应装置”的专利,授权公告号CN222196596U,申请日期为2024年4月。将罐体内部的各种原料都翻拌起来,从而保证其内的原料能够。
金融界2024年12月25日消息,国家知识产权局信息显示,佐竹机械装备(大连)有限公司取得一项名为“一种通用型升降搅拌机”的专利,授权公告号CN222196592U,申请日期为2024年5月。
金融界2024年12月25日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“通信方法与装置”的专利,公开号CN119172856A,申请日期为2023年6月。专利摘要显示,本申请提供了一种通信方法与装置,该方法提供一种能够有效降低信道质量对数据传输的影响的方案。
金融界2024年12月25日消息,国家知识产权局信息显示,融科智汇(天津)新材料科技有限公司取得一项名为“一种混合机滚筒清料装置”的专利,授权公告号CN222196604U,申请日期为2024年1月。
金融界2024年12月25日消息,国家知识产权局信息显示,佛山市恒力泰科技有限公司取得一项名为“一种带有喷吹结构的搅拌机”的专利,授权公告号CN222196598U,申请日期为2023年12月。
金融界2024年12月25日消息,国家知识产权局信息显示,江苏正赫通信息科技有限公司申请一项名为“基于深度卷积神经网络指纹定位方法、设备及介质”的专利,公开号CN119172854A,申请日期为2024年11月。
金融界2024年12月25日消息,国家知识产权局信息显示,力辰邦西仪器(常州)有限公司取得一项名为“一种可调角度电动搅拌器”的专利,授权公告号CN222196599U,申请日期为2023年12月。
金融界2024年12月25日消息,国家知识产权局信息显示,中国移动通信有限公司研究院、中国移动通信集团有限公司申请一项名为“旁链路SL定位鉴权方法、装置及介质”的专利,公开号CN119172860A,申请日期为2023年6月。专利摘要显示,本发明提供了一种旁链路SL定位鉴权方法、装置及介质,属于通信技术领域。
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1