当前位置:首页|资讯|Claude|GitHub|编程|OpenAI

Claude 3.5 Sonnet 更新后是编程领域的王者

作者:浩叔_AI应用开发指南发布时间:2024-10-25

Claude 3.5 Sonnet 更新后在编程领域是目前世界上最好的模型! 在SWE-bench验证测试中的表现从33.4%提高到了49%(SWE-bench 一个专门用于测试大模型解决实际GitHub问题能力的数据集),超过了所有公开模型,包括OpenAI的O1 Preview,并在编程能力创下新纪录,提高到了93.7%,超过了GPT-4o [图片] 上面的基准测试不包含 OpenAI的O1 Preview。 Claude Sonnet 3.5 对比 OpenAI的 O1 Preview 在某些基准测...【查看原文】


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1