当前位置:首页|资讯

自动化、可复现,基于大语言模型群体智能的多维评估基准Decentralized Arena来了

作者:机器之心发布时间:2024-10-22

研究者们已经并陆续构建了成千上万的大规模语言模型(LLM),这些模型的各项能力(如推理和生成)也越来越强。因此,在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。...【查看原文】


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1