新经济视界|国产大模型加速迭代性能逼近甚至赶超GPT-4

作者：封面新闻发布时间：2024-05-09

封面新闻记者欧阳宏宇

继文心、星火之后，又一中国造大模型性能赶超GPT-4。

5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo。据阿里云智能集团首席技术官周靖人介绍，在中文语境下，文本理解、文本生成、问答建议、闲聊对话和安全风险等多项能力上赶超GPT-4。

据了解，相比通义千问2.1版本，通义千问2.5在理解能力、逻辑推理、指令遵循、代码能力上均得到提升。在权威基准OpenCompass上，通义千问2.5得分追平GPT-4 Turbo。同时，通义千问最新开源的1100亿参数模型在多个基准测评，超越Meta的Llama-3-70B。

国产大模型技术爆发一年多，在全球范围内也从曾经的追赶者到如今的并行者甚至引领者。清华大学基础模型研究中心联合中关村实验室在上月底发布的报告显示，在语义理解、阅读理解等能力上，文心一言4.0已超过GPT-4 Turbo。科大讯飞也在今年初透露，讯飞星火V3.5整体已经接近GPT-4水平，尤其在数学、语言理解、语音交互能力超过GPT-4 Turbo。

在大模型投入上，中国的大模型公司取得重大突破，背后是基于各种预训练模型框架和开源项目，各种模型如雨后春笋般诞生。不过，在业内人士看来，和国外大模型相比，国内的大模型发展起步晚一些。加上高性能算力的限制和数据质量的差距等，国内研发的大模型无论规模还是核心能力，与世界先进水平还存在一年左右的差距。

据上海人工智能实验室评测，虽然国产大模型在中文场景下国内最新的大模型已展现出独特优势，尤其在语言、知识维度上接近GPT-4 Turbo的水平；但在金融、工业等要求可靠的场景落地需要的关键能力上相比于GPT-4还存在差距。

“国内大模型要整体赶超GPT-4 Turbo等国际顶尖的大模型，在复杂推理、可靠地解决复杂问题等方面，仍需下大功夫。”上海人工智能实验室领军科学家林达华指出，这关系到落地应用时大模型的可靠性，比如，随着大模型进入商用，在金融场景下若要分析公司财报，甚至是工业领域分析技术文档，数学等方面的计算能力就会成为一个壁垒。

相关资讯

国产大模型，逼近GPT-4

国产大模型，逼近GPT-4 国产“GPT Store”发布了。作者｜赵健国产大模型与OpenAI还有多少差距？在去年11月30日的「甲子引力」年终盛典上，智谱AI CEO张鹏给

GPT-4 OpenAI

甲子光年 2024-01-16

国产大模型，逼近GPT-4｜甲子光年

国产“GPTStore”发布了。国产大模型与OpenAI还有多少差距？在去年11月30日的「甲子引力」年终盛典上，智谱AICEO张鹏给到的答案是，在单点或少量指标上可以逼近OpenAI，但总体平均能力还存在不小的差距，而这也是压力与动力的来源。但在两个月后的今天，这个差距已经无限接近。

GPT-4 OpenAI

甲子光年 2024-01-16

雷递 2024-01-16

新经济视界|国产大模型加速迭代性能逼近甚至赶超GPT-4

推荐体验

相关资讯

国产大模型，逼近GPT-4

国产大模型，逼近GPT-4｜甲子光年

国产大模型放大招：逼近OpenAI 的GPT-4

数说新经济 | AI大模型接连问世……六大关键复盘2023年新经济发展趋势

GLM-4国产大模型上线称整体性能逼近GPT-4 降低推理成本

近期资讯

掌握钢笔工具：数字设计与插画的创作利器与技巧概述

江苏永拓电气取得一种便于组装的配电箱专利，具备便于快速组装的优点

黄山腾云取得电柜线缆导向机构专利，方便工作人员在柜体中布线

如何轻松查看苹果手机上的手机号码：多种方法详解

江苏合益电气取得开关柜束线组件专利，提高适用性便于使用

掌握五笔输入法技巧：轻松输入汉字“羊”的方法与练习建议

郑州中都电气取得中置式开关柜接地装置专利，提高装置的适用性

家庭用电耗电量计算与节能小技巧指南

苏州森源电气取得一种配电柜多功能内撑板专利，固定支撑框更加便捷

如何轻松关闭触摸键盘：设备与系统的实用指南

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

新经济视界|国产大模型加速迭代 性能逼近甚至赶超GPT-4

新经济视界|国产大模型加速迭代性能逼近甚至赶超GPT-4