通义千问2.0上线，阿里云：做AI时代最开放的云，已支撑国内一半大模型

作者：新京报发布时间：2023-11-03

近一个月以来，国内多家大模型纷纷更新换代，“百模大战”也随着大模型能力的提升愈发火热。10月31日，2023云栖大会上，阿里云旗下大模型通义千问也迎来了2.0的升级，并成为了文心一言、科大讯飞之后第三家宣布超越GPT3.5的大模型，同时，基于通义千问的大模型“全家桶”也向公众亮相。

不过，相比其他研发大模型的企业，阿里云不仅做到了通义千问的开源，还为全国80%的科技企业和一半的大模型公司提供了算力支持。

事实上，本届云栖大会阿里云更强调开放与生态。除了加速自研大模型迭代，从升级AI基础设施到产品结构、AI开源社区的搭建都在贯彻“开放”这一主题。其中，AI开源社区魔搭集聚了280万开发者、2300多个模型，模型下载量超过1亿。

在云栖大会上，阿里云CTO周靖人发布了8个基于通义千问的行业大模型：通义灵码—智能编码助手、通义智文—AI阅读助手、通义听悟—工作学习AI助手、通义星尘—个性化角色创作平台、通义点金—智能投研助手、通义晓蜜—智能客服、通义仁心—个人专属健康助手、通义法睿—AI法律顾问。此外，周靖人还发布了一站式大模型应用开发平台——阿里云百炼，开发者可在5分钟内开发一款大模型应用，几小时即可“炼”出一个企业专属模型。

在大模型时代，通义千问系列大模型有什么样的发展目标？阿里云又将扮演何种角色呢？

━━━━━

更好的大模型加速应用创新

在2023云栖大会现场，周靖人公布了阿里自研大模型的最新进展，发布千亿级参数规模的通义千问2.0。通义千问2.0在10个权威测评中全面超越GPT-3.5和Llama2，加速追赶GPT-4。

具体来看，过去6个月，通义千问2.0在性能上取得巨大飞跃，相比4月发布的1.0版本，通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前，通义千问的综合性能已经超过GPT-3.5，加速追赶GPT-4。

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上，通义千问2.0的得分整体超越Meta的Llama-2-70B，相比OpenAI的Chat-3.5是九胜一负，相比GPT-4则是四胜六负，与GPT-4的差距进一步缩小。

中英文理解能力是大语言模型的基本功。英语任务方面，通义千问2.0在MMLU基准的得分是82.5，仅次于GPT-4，通过大幅增加参数量，通义千问2.0能更好地理解和处理复杂的语言结构和概念；中文任务方面，通义千问2.0以明显优势在C-Eval基准获得最高得分，这是由于模型在训练中学习了更多中文语料，进一步强化了中文理解和表达能力。

在数学推理、代码理解等领域，通义千问2.0进步明显。在推理基准测试GSM8K中，通义千问排名第二，展示了强大的计算和逻辑推理能力；在HumanEval测试中，通义千问得分紧跟GPT-4和GPT-3.5，该测试主要衡量大模型理解和执行代码片段的能力，这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。

据了解，阿里云在大模型方面的研究，从2018年底、2019年初就已经开始，通义千问模型就是在之前阿里云预训练模型的技术体系里面发展起来的。

“我们从4月份开始对外发布以后，也进行了一系列升级，通义千问2.0是个千亿级规模的大模型，我们的目标一方面是开发产品本身，更重要的是我们把这个大模型以API方式开放出来，能够让更多人使用。至于模型能力的部分，我们也做了很多测评，我们希望在通用的测评集里比较客观地验证模型的能力，今天我们面对ChatGPT3.5来说有非常大的胜率，ChatGPT4.0里大家各有胜负。当然这一方面是一个评测集，另一方面也是大家使用的体感，我相信最好的是用户来做评价，大家可以去尝试，给一个判断，而且本身这个模型也在不断地演进过程当中，其实每个人的体感是不一样的。即使回答同一个问题，有的人觉得模型A不错，有的人觉得模型B不错，其实很大程度上模型反馈质量好坏也是个性化的体感，这个是我们接下来面对的一个技术问题，怎么能够找到大家个性化的需求，能够更加地帮助大家个性化地去定制相关的模型。”周靖人说。

当前，千行百业都想借助大模型实现生产和服务方式的变革，但大模型使用的高门槛把大部分人挡在了技术浪潮之外。不论是定制专属大模型，还是基于大模型构建创新应用，都有很高的人才、技术、资金要求。

在云栖大会现场，周靖人发布了一站式大模型应用开发平台——阿里云百炼，该平台集成了国内外主流优质大模型，提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具，为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。开发者可在5分钟内开发一款大模型应用，几小时即可“炼”出一个企业专属模型，开发者可把更多精力专注于应用创新。

为推动大模型更易在千行百业集成落地，阿里云基于通义“打样”了8个行业大模型，并在现场公布进展：个性化角色创作平台通义星尘、智能投研助手通义点金、AI阅读助手通义智文等首次亮相；智能编码助手通义灵码已在阿里云内部大规模采用，广受好评；工作学习AI助手通义听悟每天处理5万余个音视频，累积用户超100万。

大模型正引发千行百业的新一轮创新，目前，央视网、朗新科技、亚信科技等企业已率先在阿里云百炼上开发专属模型和应用，朗新科技在云上训练出电力专属大模型，开发“电力账单解读智能助手”“电力行业政策解析/数据分析助手”，为客户接待提效50%、降低投诉70%。

━━━━━

全面升级AI基础设施

大模型是本轮AI浪潮的核心技术，基础模型的质量很大程度决定了AI产业化的前景。训练大模型是囊括了算力底座、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程，只有强大的云计算体系才能训练出高质量的大模型。

周靖人表示，2009年阿里云就提出“数据中心是一台计算机”的理念，今天，AI时代更加需要这样的技术体系。作为一台超级计算机的云计算，可高效连接异构计算资源，突破单一性能芯片瓶颈，协同完成大规模智能计算任务。

为了保证大模型训练的稳定互联和高效并行计算，阿里云全新升级了人工智能平台PAI。PAI底层采用HPN 7.0新一代AI集群网络架构，支持高达10万卡量级的集群可扩展规模，超大规模分布式训练加速比高达96%，远超业界水平；在大模型训练任务中，可节省超过50%算力资源，性能全球领先。

阿里云通义大模型系列就是基于人工智能平台PAI训练而成。除了通义大模型，中国一半大模型公司跑在阿里云上，百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等大批头部企业及机构均在阿里云上训练大模型。

百川智能创始人兼CEO王小川表示，“百川成立仅半年便发布了7款大模型，快速迭代背后离不开云计算的支持。”百川智能和阿里云进行了深入合作，在双方的共同努力下，百川很好地完成了千卡大模型训练任务，有效降低了模型推理成本，提升了模型部署效率。

客观而言，国内大模型的发展与“不计成本登月”的OpenAI还存在差距。王小川表示，国内大模型的现状是“理想上慢一步，落地上快三步”。虽然在技术创新和技术理想上美国有所领先，但是中国的应用落地能力更强。百川拥有经验丰富的搜索团队，过去成功打造过基于语言模型的超级应用，且拥有经过市场验证的技术、产品、商业化能力，团队掌握的搜索技术可以助力大模型研发，且能补齐大模型在幻觉等问题上的短板。

除了团队、经验等优势外，百川实现平均每月迭代一款模型的另一重要原因是云计算的支撑。王小川介绍，模型的快速迭代和部署离不开云计算，百川智能和阿里云作为紧密的合作伙伴，在模型预训练和模型部署等方面进行了深入合作。在双方的共同努力下，百川很好地完成了千卡大模型训练任务，有效降低了模型推理成本，提升了模型部署效率。

阿里云已成为中国大模型的公共AI算力底座。截至目前，中国众多头部主流大模型都已通过阿里云对外提供API服务，包括通义系列、Baichuan系列、智谱AI ChatGLM系列、姜子牙通用大模型等。

随着AI产业化逐步深入，必将迎来大规模智能算力需求爆发。阿里云已在全球30个地域建设了89个云计算数据中心，提供3000余个边缘计算节点，云计算的低延时、高弹性优点将发挥得淋漓尽致。今年，阿里云成功支撑火爆全网的妙鸭相机短时间高强度的流量爆发。

周靖人说：“随着大模型技术与云计算本身的融合，我们希望未来的云可以像车一样也能够自动驾驶，大幅提升开发者使用云的体验。”

据悉，阿里云上有超过30款云产品接入了大模型能力，例如阿里云大数据治理平台DataWorks新增了全新的交互形态——Copilot，用户只需用自然语言输入即可生成SQL，并自动执行相应的数据ETL操作，整体开发与分析可提效30%以上，堪比“自动驾驶”。

阿里云容器、数据库等产品上也提供了类似的开发体验，可实现NL2SQL、SQL注释生成/纠错/优化等功能，未来这些能力还将集成到阿里云其他产品上。

━━━━━

坚定开放共促生态繁荣

阿里云的定位是要服务好AI时代创业者

“促进中国AI生态繁荣，是阿里云的首要目标。阿里云将坚定打造AI时代最开放的大模型平台，我们欢迎所有大模型接入阿里云百炼，共同向开发者提供AI服务。”周靖人表示。

阿里云是国内最早开源自研大模型的科技公司，掀起中国大模型开源浪潮。目前，阿里云已开源通义千问7B、14B版本，下载量突破百万。在现场，周靖人宣布通义千问72B模型即将开源，将成为中国参数最大的开源模型。

除了与开发者共享自研新技术，阿里云还大力支持三方大模型发展。在阿里云魔搭社区上，百川智能、智谱AI、上海人工智能实验室、IDEA研究院等业界顶级玩家，都开源首发他们的核心大模型，阿里云则为开发者们“尝鲜”大模型提供免费GPU算力，截至目前已超3000万小时。

周靖人透露，魔搭社区现已聚集2300多款AI模型，吸引280万名AI开发者，AI模型下载量突破1亿，成为中国规模最大、开发者最活跃的AI社区。

2023云栖大会上，阿里云宣布了一项重磅计划：“云工开物计划”，给中国所有大学生每人送一台云服务器。此外，阿里云还将为签约高校提供更大规模的算力资源支持，助力中国青年学者和学子攀登科研高峰。目前，清华大学、北京大学、浙江大学、上海交通大学、中国科学技术大学、华南理工大学等高校已首批达成合作。

对于阿里云在AI时代的定位，周靖人在接受媒体采访时表示，阿里云今天的定位是服务好各种各样AI时代的创业者、开发者、企业客户等等。也就是通过多层技术的能力，能够让用户在平台上得到最好的支持，帮助他们解决创业上的挑战、进行创新上的加速、让人工智能能够落地。

“在各个维度上，今天阿里云所面对的客户分很多阶层。有的可能来自于模型创业公司，对于他们来讲，更希望使用到最先进的AI基础设施做大模型研究。还有一类客户，希望能够把已有的开源模型有效结合自己产品做二次创新。更多则希望用通义千问这种开源的模型，帮助它做自己的业务系统开发。”周靖人说。“今天，阿里云的要服务好所有上面讲到的客户，所有在智能时代期待利用数字创新，或者利用人工智能的方式做科技创新的客户，并希望以完善的产品矩阵有效支持好他们，这就是我们当前的定位。”

“过去十来年，阿里云服务了中国移动互联网的大发展。今天，随着大模型技术的迅速发展，智能化时代正在开启。阿里云正在面向AI时代进行全面的技术升级和创新，打造AI时代一朵最开放的云。”阿里巴巴集团董事会主席蔡崇信说。

值班编辑古丽

拜托，命运的齿轮又不是全自动的

湖南10岁男童遭阿拉斯加犬咬伤，仍在ICU内抢救

联大高票通过！美国以色列等投反对票