当前位置:首页|资讯

Llama 版 o1 来了,来自上海 AI Lab,强化学习代码已开源,基于 AlphaGo Zero 范式

作者:量子位发布时间:2024-11-05

复刻 OpenAI o1 推理大模型,开源界传来最新进展: LLaMA 版 o1 项目刚刚发布,来自上海 AI Lab 团队。 简介中明确:使用了蒙特卡洛树搜索,Self-Play 强化学习,PPO,...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1