当前位置:首页|资讯

微软出招,新模型数学超GPT-4o编程胜Llama3.3,训练新范式引热议:midtraining

作者:华尔街见闻发布时间:2024-12-17

微软推出最新小模型Phi-4。参数量仅14B,MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。数学能力上,Phi-4在美国数学竞赛AMC 10/12上超过了GPT-4o等一众大模型,分数冲上90。编程能力也是开源模型一流,超过了70B的Llama 3.3和72B的Qwen 2.5。微软在技术报告中还提出了一个新的训练范式——midtraining。(量子位)


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1