当前位置:首页|资讯|GPT-4|人工智能

vivo自研大模型评分64.4分,接近GPT-4,成绩出色!

作者:PConline太平洋科技发布时间:2023-08-17

原标题:vivo自研大模型评分64.4分,接近GPT-4,成绩出色!

8月16日消息,小米的人工智能大模型MiLM-6B才发布不久,又有一家国内手机厂商的自研大模型面世。

vivo的自研大规模预训练语言模型“vivo_Agent_LM_7B”现身C-Eval,并取得了相当出色的成绩。C-EVAL是中文大语言模型评估基准。

  • 覆盖更广泛的领域。
  • 具有四种不同的难度--特别是C-EVAL HARD基准是中国第一个提供复杂推理问题的基准。
  • 努力减少数据泄漏--作者的问题大多来自模拟考试的PDF或Microsoft Word文件,这些文件由作者进一步处理,而AGIEval和MMCU收集的是中国过去国家考试的确切题目。

C-EVAL的概览图。不同颜色的主体表示四个难度等级:初中、高中、大学和专业。

(图源:知乎)

从C-Eval可以得知,vivo_Agent_LM_7B是由vivo AI全球研究院自主研发的有着70亿参数的大规模预训练语言模型。

vivo_Agent_LM_7B最终得分为64.4分,位列C-Eval第五名,而且在社会科学领域的多个科目得到了80-90的高分。

它在总成绩上与排名第二的GPT-4(68.7分)相当接近。

而vivo_Agent_LM_7B模型大概率最终将被用在vivo的语音助手Jovi中,为用户带来更良好、智能、快捷的使用体验。

编辑点评:各家厂商都在发展自己家的人工智能大模型,现如今人工智能是另一个时代风口,没有厂商想落后一步,便疯狂地一同追赶。人工智能大模型将丰富手机的智能交互方式,也许是成为系统个性化的另一个核心竞争点。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1