当前位置:首页|资讯

北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

作者:机器之心发布时间:2024-09-15

根据相关人士推测,o1 的模型训练数据截止到去年十月份,而有关 Q \* 的爆料大约是去年 11 月,这似乎展示 o1 的训练中也用到了 TreeSearch 的技巧。...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1