封面新闻记者 欧阳宏宇
继日前文心大模型、星火认知大模型完成迭代,又一头部通用大模型也宣告升级。
10月31日,阿里云在杭州正式发布了通义千问2.0。据介绍,通义千问2.0拥有千亿级参数,综合性能超过GPT-3.5,正在加速追赶GPT-4。现场,阿里云CTO周靖人透露,通义千问的APP版本在各大手机应用市场正式上线,所有人都可通过APP直接体验。
大模型是本轮AI浪潮的核心技术,基础模型的质量很大程度决定了AI产业化的前景。周靖人介绍,过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,新版本在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。
在具体能力方面,中英文理解、数学计算、代码推理能力是大语言模型的基本功。据了解,以英语任务为例,通义千问2.0在MMLU基准中仅次于GPT-4;在HumanEval测试中,其得分也紧跟GPT-4和GPT-3.5。
模型能力的提升,也带来了市场需求的扩容,千行百业都想借助大模型实现生产和服务方式的变革。类似于文心大模型4.0推出后上线了十余款原生应用,星火大模型升级至3.0版本后,新增了虚拟人格、心理健康等功能,更多的通用大模型也在垂直场景深化布局。
据介绍,通义大模型2.0也同步训练了包括编码、阅读、研投等垂类大行业模型。开发者可以通过网页嵌入、API/SDK调用等方式,这些模型能力集成到自己的大模型应用和服务中。
“随着大模型技术与云计算本身的融合,我们希望未来的云可以像车一样也能够自动驾驶,大幅提升开发者使用云的体验。”周靖人回忆称,他此前提到过“数据中心就是一台计算机”的理念,今天,AI时代更加需要这样的技术体系。“云计算就是一台超级计算机,可高效连接异构计算资源,突破单一性能芯片瓶颈,协同完成大规模智能计算任务,携手千行百业推动AI创新,共享技术红利。”