当前位置:首页|资讯

OpenAI o1模型:偏科的理科生

作者:HB888发布时间:2024-09-14

LLM需要增强的地方 大模型的三大基础能力:• 语言理解和表达能力:GPT-3 已解决• 世界知识存储:GPT-4已经解决了不少• 逻辑推理能力:是最薄弱的环节,o1模型在这方面有明显的进步。 原理 o1模型增强逻辑推理能力的思路是:收到问题后,自动生成CoT,再生成答案。避免人类写基于于CoT的Prompt。 如果让o1获取自动生成CoT的能力,通过强化学习提升模型自动找到正确推理路径的能力。 新的范式? OpenAI发现:在强化学习的训练和推理过程中,随着计算能力的增加,模型推理效果(如找到正...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1