当前位置:首页|资讯

AI 科学家太多,谁靠谱一试便知!普林斯顿新基准 CORE-Bench:最强模型仅有 21% 准确率

作者:新智元发布时间:2024-09-25

普林斯顿大学新发布的 CORE-Bench 基准测试,通过 270 个基于 90 篇跨学科科学论文的任务,可评估 AI 智能体在计算可重复性方面的表现...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1