当前位置:首页|资讯|通义千问|阿里巴巴|AI绘画

阿里云换帅后祭出杀手锏:升级通义千问大模型,做AI浪潮下的“卖铲人”

作者:时代在线网发布时间:2023-11-02

原标题:阿里云换帅后祭出杀手锏:升级通义千问大模型,做AI浪潮下的“卖铲人”

图源:阿里云官方

一个多月前,阿里云进行了一场人事调整,张勇卸任阿里云董事长与CEO职务,由阿里巴巴集团CEO吴泳铭兼任。

把时间维度拉长一些,可以发现,开年以来,阿里云的变革非常频繁,先是率先打响云服务降价的第一枪,接着开启分拆上市倒计时,随后又推出“通义千问”大模型,AI绘画创作大模型“通义万相”。

“我们要打造AI时代最开放的云。”10月30日,在2023年云栖大会上,阿里巴巴集团董事会主席蔡崇信开场演讲中表示,目前中国80%的科技企业,一半的大模型公司都跑在阿里云之上。

在现场,阿里云CTO周靖人公布了云计算基础能力的最新进展,升级了人工智能平台,并发布千亿级参数规模的大模型通义千问2.0,以及一站式模型应用开发平台阿里云百炼,阿里云已初步建成AI时代全栈的云计算体系。

云计算和大模型,谁优先?

自从ChatGPT在全球范围内爆火,大模型的混战持续了大半年,一众科技大佬纷纷下场,各行各业也争先恐后地蹭上大模型的热度。

作为国内最早布局云计算的厂商,阿里云站在了行业的风口。大模型的不断优化对算力有了更高的要求,庞大的训练规模也需要稳定的云服务设备承接。

以ChatGPT为例,2018年Open AI在训练GPT-1时,所用到的参数数量和数据训练量分别为1.17亿和5GB,到了GPT-4,训练参数量则出现了爆发式的增长,达到了1.6万亿。

“云计算和GPT的关系就像电和电机一样。”阿里云创始人王坚在会上表示。他认为,人工智能和云计算的结合,是云计算的第三次浪潮。它不会在一年、两年完成的,可能要几十年才能达到高峰。

同时拥有云计算和大模型的阿里云对自身的定位更像是卖铲人,重视AI发展的基础设施,把云计算的能力开发到极致。

以全新升级的人工智能平台PAI为例,PAI底层采用HPN 7.0新一代AI集群网络架构,支持高达10万卡量级的集群可扩展规模,超大规模分布式训练加速比高达96%;在大模型训练任务中,可节省超过50%算力资源。

“通过阿里云多层技术的能力,不管是AI的基础设施、模型的能力,还是像百炼的平台,能够让开发者、创业公司获得最好的支持,帮助他们去解决创业上的挑战以及创新上的加速等等。”周靖人在接受时代财经等媒体群访时说道。

百川智能成立仅半年就发布了7款大模型,快速迭代背后离不开云计算的支持。百川智能与阿里云进行了深入合作,并且完成了千卡大模型训练任务,有效降低了模型推理成本,提升了模型部署的能力。

截至目前,中国众多头部主流大模型都已通过阿里云对外提供API服务,包括通义系列、Baichuan系列、智谱AI ChatGLM系列、姜子牙通用大模型等。

通义千问升级,性能超过GPT-3.5

云栖大会首日,阿里云正式发布了千亿级参数大模型通义千问2.0,相比今年4月推出的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上有明显提升。目前,通义千问的综合性能已经超过GPT3.5,正在加速追赶GPT-4。

通义大模型家族全面升级 图源:阿里云

不过,无论是推出大模型应用的大厂,还是独角兽企业都达成了某种共识:通用大模型不是行业发展的终极目标,做好垂直领域的落地才能让大模型发挥出应有的价值。比如科大讯飞将星火认知大模型升级至V3.0,发布了12个行业大模型,腾讯混元大模型也进行了一次升级。

一位大模型行业从业者曾经向时代财经表示,大部分行业用户都有一个明确的要求:想要产品实现一站式服务,并且能够实现个性化的定制。

周靖人表示,阿里云并不打算做C端产品,而是会把模型能力开放出来,以API的形式,让开发者集成模型的能力来解决自身需求。

截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。

基于通义千问大模型训练的8大行业模型组团上线,他们分别是智能编码助手通义灵码、AI阅读助手通义智文、工作学习AI助手通义听悟、个性化角色创作平台通义星尘、智能投研助手通义点金、智能客服通义晓蜜、个人专属健康助手通义仁心、AI法律顾问通义法睿。

8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。其中,通义星尘、通义点金、通义智文等是首次亮相;通义灵码已在阿里云内部大规模采用;通义听悟每天处理5万余个音视频,目前已累积用户超100万。

周靖人透露,阿里云计划于近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型。

除了与开发者共享自研新技术,阿里云还大力支持三方大模型发展。在阿里云魔搭社区上,百川智能、智谱AI、上海人工智能实验室、IDEA研究院等业界顶级玩家,都开源首发他们的核心大模型,阿里云则为开发者们“尝鲜”大模型提供免费GPU算力,截至目前已超3000万小时。

据了解,去年云栖大会发布的魔搭社区现已聚集2300多款AI模型,吸引280万名AI开发者,AI模型下载量突破1亿,成为中国规模最大、开发者最活跃的AI社区。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1