当前位置:首页|资讯

顶尖高校联手打造!OpenR 开源框架:在推理过程中整合强化学习,显著提高模型的推理能力!

作者:蚝油菜花发布时间:2024-10-18

OpenR是由多所高校联合开发的开源框架,旨在提升大型语言模型的推理能力,整合搜索、强化学习和过程监督技术,应用于数学求解、代码生成等领域,显著提高推理效率和准确性。...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1