当前位置：首页|资讯|人工智能|AI大模型

『弈衡』人工智能大模型评测平台白皮书

作者：金田游戏生活发布时间：2024-07-25

人工智能 AI大模型

『弈衡』人工智能大模型评测平台白皮书（2024年）-中移智库

报告共计：21页

《『弈衡』人工智能大模型评测平台白皮书（2024年）》由中移智库发布，介绍了构建AI大模型评测平台的必要性、业界现状以及中国移动的“弈衡”平台。

随着AI大模型的广泛应用，其评测面临诸多挑战，如人工评测效率低下、组织有效性不足等。构建高效、系统化且可信赖的评测平台至关重要，需提高评测执行成效、加强全面客观性、增强结果管理规范性、保障评测体系演进性。

业界典型大模型评测平台包括OpenCompass、AgentBench、OpenEval和百度大模型内容安全评测平台等，它们具有评测全面、方式多样、高效分布式、开源可复现等优势，但也存在缺乏统一标准、安全性和公正性问题、数据集局限、技术门槛高以及分布式评测资源需求高等局限性。

中国移动的“弈衡”大模型评测平台具有以下特点：设计原则上强调智能化自动化、灵活可扩展性和交互体验设计；整体架构采用分层与模块化设计，包括底层能力层、评测管理层、评测执行层、结果分析层和行业应用层；特色及创新点包括对标国际一流的评测体系、基于大模型技术的智能化结果评判和基于自组织的端到端自动化流程，创新点为用大模型测试大模型和自动化智能评测引擎；主要功能包括数据与模型管理、评测流程管理和结果分析与展示；优势包括多维度评测体系达业界一流水平、具备“一键测试”功能、可拓展性强、效率高且可靠。

未来，“弈衡”平台将扩展评测需求，创新评测技术，构建和共享评测数据，并构建完善的评测生态，推动各方深度合作。

以下为报告节选内容

推荐体验

相关资讯

『弈衡』人工智能大模型评测平台白皮书

报告共计：21页《（2024年）》由中移智库发布，介绍了构建AI大模型评测平台的必要性、业界现状以及中国移动的“弈衡”平台。随着AI大模型的广泛应用，其评测面临诸多挑战，如人工评测效率低下、组织有效性不足等。…

人工智能 AI大模型

尚书铲铲 2024-08-01

“弈衡”通用大模型评测体系白皮书

人工智能大模型(以下简称大模型)是实现生成式人工智能服务(AIGC)的重要技术，ChatGPT上线两个月活跃用户(MAU)突破1亿，激发了大模型技术的爆发式发展，全球科技公司开启大模型“科技竞赛”。国外科技巨…

人工智能 AIGC ChatGPT

报报小猴 2023-08-03

通用大模型评测体系白皮书（附下载）

ChatGPT上线两个月活跃用户（MAU）突破1亿，激发了大模型技术的爆发式发展，全球科技公司开启大模型“科技竞赛”。

AIGC学派 2023-08-20

人工智能发展白皮书2023

在科技日新月异的今天，人工智能已成为最具革命性的技术之一，有望对人类社会生活产生显著的影响。过去几年，人工智能相关理论研究、技术创新、软硬件升级等整体推进，极大地促进了人工智能行业的发展。进入2022年，以c…

笨蛋跑反了 2023-09-09

行业报告 | 人工智能白皮书

原创 | 文 BFT机器人01人工智能发展概述人工智能是引领未来的新兴战略性技术，是驱动新一轮科技革命和产业变革的重要力量。习近平总书记多次作出重要指示，强调“要深入把握新一代人工智能发展的特点，加强人工智能和产业发展融合，为高质量发展提供新动能”。近年来，人工智能相关技术持续演进，产业化和商业化进程不断提速，正在加快与千行百业深度融合。站在“十四五”开端这一特殊的节点，我们坚信全面梳理人工智能政策、技术、应用以及治理的发展态势，能够有益于凝聚业界共识，推动人工智能持续健康发展。（一）全球不断升级人工智能

BFT白芙堂机器人 2023-07-14

近期资讯

CR450，终于见面了！

中国铁道科学研究院集团有限公司首席研究员赵红卫介绍：“CR450动车组突破了更高速安全运行、减阻降耗、减振降噪、全要素轻量化、智能化融合设计等技术，构建了时速400公里动车组的技术体系，实现了理论、技术、装备、标准、管理模式的全面创新。”

极目新闻 2024-12-30

小米 REDMI 14C 手机上架：120Hz 屏、Helio G81-Ultra，499 元起

此外，该机带有侧边指纹，配备5160毫安时电池，支持18W有线充电，支持Wi-Fi5，配备3.5mm音频接口，官方称该机使用1216G超线性扬声器，至高可达到150%外放音量。

IT之家 2024-12-30

浙江蓝德能源取得一种隔膜白油喷淋萃取装置专利，隔膜残油量低

金融界2024年12月30日消息，国家知识产权局信息显示，浙江蓝德能源科技发展有限公司取得一项名为“一种隔膜白油喷淋萃取装置”的专利，授权公告号CN222218685U，申请日期为2024年5月。

金融界 2024-12-30

电脑清理方法：提升性能与使用体验的有效指南

电脑就像我们的生活一样，随着时间的推移，难免会积累一些“垃圾”。这些“垃圾”不仅占据了存储空间，还可能让你的电脑运行得越来越慢。今天，就来聊聊怎么有效地清理电脑，让它焕然一新。首先，咱们得从最基本的开始。打开电脑，看看桌面上那些图标。是不是一堆堆的？有些可能已经很久没用过了，干脆直接删除吧。

新报观察 2024-12-30

vivo内部MR团队已达500人，原型机体验明年9月上线

钛媒体App12月30日消息，vivo执行副总裁胡柏山称，vivo的MR团队已经达到500人规模，预计将在2025年9月份在全国十几个城市上线高保真原型机体验，产品已经在部分指标体验上会超越了苹果。在商业化进展上，则要根据内容生态的匹配情况。

钛媒体快报 2024-12-30

年底买电脑应该怎么选？一文讲透华为智慧PC选购攻略

【CNMO科技消息】不知不觉中，2024年已经进入尾声，而崭新的2025正在迎接我们。现在，华为智慧PC感恩回馈季正式开启，如果大家有选购电脑的需求，不妨来看看，一文讲透华为智慧PC选购攻略，相信可以帮助大家新年选到最趁手的生产力工具。

手机中国 2024-12-30

有效管理数据：文件压缩的技巧与常见问题解决方法

随着我们日常生活中产生的数据量不断增加，如何有效地管理这些数据，尤其是如何进行文件压缩，成为了一个值得关注的话题。

新报观察 2024-12-30

iPhone 17系列正面屏幕图曝光最低6.3英寸灵动岛缩小

【CNMO科技消息】明年的iPhone17系列，不仅在产品阵容方面会有所不同，Plus版本被全新的主打轻薄的Air版本替代，而且在正反面的设计方面也会迎来较大更新。

手机中国 2024-12-30

中国一项“超级工程”，在海底建发电站，日本感叹中国太牛

人们关于资源的利用开始越来越多，而早期的一些不可再生资源也开始越来越紧缺，电力作为现在人们生活当中最常用的一种资源，也受到了多方面的挑战，我国在技术的进步之下，现在又有了一大超级工程。

基建不倒翁 2024-12-30

美国电网：AI需求或致崩溃危机重重

：AI热潮下，美国电网面临严峻挑战】今年，人工智能热潮带动美股市场及相关领域狂飙，投资者热情高涨，但AI未来喜忧参半。有报告称，为满足人工智能计算需求，美国数据中心激增，对当地电网或为坏消息。这种“扭曲”电力供应或破坏接电，增加电气火灾脆弱性，导致限电和停电，AI数据中心问题更大，因其能源需求不稳定。

和讯网 2024-12-30

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1