Llama 版 o1 来了，来自上海 AI Lab，强化学习代码已开源，基于 AlphaGo Zero 范式

作者：量子位发布时间：2024-11-05

复刻 OpenAI o1 推理大模型，开源界传来最新进展： LLaMA 版 o1 项目刚刚发布，来自上海 AI Lab 团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play 强化学习，PPO，...【查看原文】

相关资讯

Llama 版 o1 来了，来自上海 AI Lab，强化学习代码已开源，基于 AlphaGo Zero 范式

复刻 OpenAI o1 推理大模型，开源界传来最新进展： LLaMA 版 o1 项目刚刚发布，来自上海 AI Lab 团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play 强化学习，PPO，

LLaMA 编程 OpenAI

量子位 2024-11-05

北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式

根据相关人士推测，o1 的模型训练数据截止到去年十月份，而有关 Q \* 的爆料大约是去年 11 月，这似乎展示 o1 的训练中也用到了 TreeSearch 的技巧。

北大 OpenAI

机器之心 2024-09-15

OpenAI震撼发布最强模型o1！强化学习突破LLM推理极限

具体来说，o1系列是OpenAI首个经过强化学习训练的模型，在输出回答之前，会在产生一个很长的思维链，以此增强模型的能力。接下来它会给自己定义任务、分析限制条件、列出需要用到的方法。o1-preview在某些…

OpenAI

等保测评办理 2024-10-22

OpenAI o1模型引领大模型结合强化学习新范式，推理模型为AI Agent带来哪些利好？

在OpenAI的o1模型中，思维链是内置的特性，模型在训练时就已经学会了如何进行这种多步骤的推理。这个库将当前推理相关的论文分成调查、分析、技术、小模型扩展、多模态推理等多个类别，总共收录了110多篇论文，并…

OpenAI

钛媒体APP 2024-09-30

刚刚，OpenAI震撼发布o1大模型，强化学习突破LLM推理极限

语言模型的 AlphaGo 时刻？

OpenAI

机器之心 2024-09-13

近期资讯

vivo Y200＋发布骁龙4 Gen 2＋720P屏幕 1099元起

【CNMO科技消息】近日，CNMO注意到，vivo上线了一款vivoY200＋新机。高通骁龙4Gen2是高通旗下的入门级手机SoC，采用三星4nm工艺制程，CPU采用两颗性能核心+六颗能效核心组成的八核心方案。

手机中国 2024-12-27

小米卢伟冰：小米全球月活跃用户数已超6.86亿

华尔街见闻获悉，在小米“人车家全生态”合作伙伴大会上，小米集团合伙人、总裁卢伟冰透露，小米全球月活跃用户数已超6.86亿，小米澎湃OS互联能力日均使用超4000万次，小米IoT已连接设备数达到8.6亿台。小米智能手机的全球出货量预计同比增长2350万台，高端手机2024年销量同比增长43%。

华尔街见闻 2024-12-27

从“支付”到“智付” 数字人民币塑造消费新生态

拿出手机，在应用商城下载“数字人民币”APP，按照几个简单步骤就可以拥有一个“数币钱包”，走进上海的地铁、商店、消费等场所手机“碰一碰”，即可用数字人民币进行消费支付。如今，数字人民币“格外丝滑”的智能应用已经渗透到社会生活的多个方面，引领着消费方式革新。

光明网 2024-12-27

民航无线电“安全卫士”：为每次飞行编织安全网

中新网云南新闻12月27日电(艾芯羽)当一架架飞机优雅地起降于跑道之上，这背后凝聚着一群默默付出、鲜为人知的专业人士——民航无线电管理检查员的辛勤与智慧。他们，如同飞行安全链上的隐形守护者，用专业和严谨，为每一次飞行编织起一张无形的通信安全网。晨曦初破，祥鹏航空无线电管理检查员刘丽娜和金家已经整装齐备，踏上了飞机的舷梯。

中国新闻网 2024-12-27

联诚精密：下属子公司部分零件产品应用于工业机器人领域

联诚精密(002921)12月27日在互动平台表示，公司下属子公司的部分零件产品应用于工业机器人领域，人形机器人未来市场空间广阔，公司将积极研究探索人形机器人领域的业务发展机会。

证券时报 2024-12-27

亚信科技斩获5项“星河”标杆案例，获评数据产业代表性厂商

日前，在中国通信标准化协会、中国信通院在京举办的2024数据资产管理大会上，亚信科技携广东、河南、重庆、河北和云南客户打造的相关项目分别获评大数据“星河”奖的“典型案例”“潜力案例”，亚信科技作为代表性厂商入选《数据治理产业图谱3.0》。

砍柴网 2024-12-27

王腾：没想到这波骁龙8 Gen3机型REDMI K80售价最高销量最好

快科技12月27日消息，REDMI总经理王腾发文表示，回顾年底这一波骁龙8Gen3新机，没想到K80居然是起售价最高的那个，但也是产品力最强、性价比最高、销量最好的那个。据悉，REDMIK80起售价是2499元，同时集齐了2K直屏、超声波屏幕指纹、金属中框以及IP68级防尘防水，同档罕见。

快科技 2024-12-27

自主研制科考+考古！“探索三号”交付启航

今天（12月26日），我国自主设计建造的深远海多功能科学考察及文物考古船“探索三号”在广州南沙正式交付启航。“探索三号”是我国首艘具有覆盖全球深远海探测并具备冰区载人深潜支持能力的综合科考船。“探索三号”船长约104米、排水量约10000吨，最大航速16节、艏艉双向破冰、续航力15000海里、载员80人。

北青网 2024-12-27

各界拥抱AI规模化产业应用契机

视频生成、语音交互等AI应用近年来持续火热，在2024年已让越来越多用户得到高效便捷的体验。更令业界瞩目的是，2024年各传统行业开始拥抱AI技术，将行业数据、计算模型赋予具备深度学习能力的AI，在工业生产领域开启规模化应用的路径。

中国战略新兴产业 2024-12-27

乔治·斯穆特：科学的真正意义不在于答案，而在于不断提出问题｜比亚迪·封面对话诺奖得主

2006年，乔治·斯穆特因对宇宙微波背景辐射的突破性研究，揭示了宇宙起源的神秘面纱，从而获得诺贝尔物理学奖。

封面新闻 2024-12-27

Llama 版 o1 来了，来自上海 AI Lab，强化学习代码已开源，基于 AlphaGo Zero 范式

推荐体验

相关资讯

Llama 版 o1 来了，来自上海 AI Lab，强化学习代码已开源，基于 AlphaGo Zero 范式

北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式

OpenAI震撼发布最强模型o1！强化学习突破LLM推理极限

OpenAI o1模型引领大模型结合强化学习新范式，推理模型为AI Agent带来哪些利好？

刚刚，OpenAI震撼发布o1大模型，强化学习突破LLM推理极限

近期资讯

vivo Y200＋发布骁龙4 Gen 2＋720P屏幕 1099元起

小米卢伟冰：小米全球月活跃用户数已超6.86亿

从“支付”到“智付” 数字人民币塑造消费新生态

民航无线电“安全卫士”：为每次飞行编织安全网

联诚精密：下属子公司部分零件产品应用于工业机器人领域

亚信科技斩获5项“星河”标杆案例，获评数据产业代表性厂商

王腾：没想到这波骁龙8 Gen3机型REDMI K80售价最高销量最好

自主研制科考+考古！“探索三号”交付启航

各界拥抱AI规模化产业应用契机

乔治·斯穆特：科学的真正意义不在于答案，而在于不断提出问题｜比亚迪·封面对话诺奖得主

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响