?【AIGC每日新闻】【Hugging Face升级LLM排行榜,提升语言模型评估】Hugging Face最近对其开放LLM排行榜进行了升级,增加了新的基准测试和评估方法,以应对大型语言模型(LLM)性能提升的停滞问题。此次升级包括六个更具挑战性的基准测试,初步排名显示Qwen2-72B-Instruct位居榜首,其次是Meta的Llama-3-70B-Instruct和Mixtral 8×22b。新增的标准化评分系统可以更公平地比较不同的评估类型。此外,还引入了“维护者亮点”类别和社区投票系统,以优...【查看原文】