当前位置:首页|资讯|AI大模型|编程

大模型M定律---定义AI数学指标和AI应用框架关系的换算方法

作者:信号再生中发布时间:2024-08-30

我们能隐约感知出一个心得:目前ai大模型的数学指标,可鞥是大模型的性能最接近的可信指标,而不是所谓的各类排名,刷分刷出来的各类哈哈一笑的榜单,要知道,lmsys的榜单其实是人刷出来的。。。anyway 你不能信任它。唯一可信的几乎只有逻辑和数学指标。 对人类语言的执行精度,模糊识别等。 目前最新的swe bench里,有公司号称做到了30%,而之前的几个报道里最好成绩是不到20%,这里先不管swe bench lite啥的。 代码辅助的测试工具,几乎等于数学的可用性情况,包含算法等。因为我们发现,现在流行...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1