当前位置:首页|资讯|AI大模型

在云栖大会,我看到AI大模型的未来

作者:科技每日推送发布时间:2023-12-04

原标题:在云栖大会,我看到AI大模型的未来

10 月 31 日,数智行业最大规模的盛会,云栖大会正式开幕。

小编一大早就坐大巴车来到了大会现场,大会从主题展馆设置到 500 多场分论坛的话题设置,以及现场各种沉浸式的科技体验,处处都在展示“云+AI”技术创新的最新进展,吸引了全球数万开发者参会。

今年云栖大会的主题回归“计算,为了无法计算的价值”,这也是2015年云栖大会的主题。2015年那会,中国移动互联网大爆发,云栖现场充满着创造和梦想。

今年,AI再次推动了热潮。阿里云的主题回归,也是定位的再次重申,计算是各种技术发展的基础,只有通过所有人的创新才能成为无法计算的价值。

开幕式上,阿里的新帅,阿里巴巴集团董事会主席蔡崇信,满面笑容,意气风发,用平淡却难掩兴奋的语气,说出让现场振奋十足的话:

智能化时代正在开启,AI将成为各行业新型生产力,中国80%的科技企业和一半的大模型公司都跑在阿里云上,阿里云希望成为AI时代一朵最开放的云,“我们坚信不开放没有生态,没有生态就没有未来。”

踏踏实实迈过15年,

阿里云厚积薄发

作为阿里集团于2009年成立的第8家子公司,阿里云已有15年的发展史。

蔡崇信在致辞上回顾了阿里云的建立初衷,“从2009年阿里云计算写下第一行代码开始,阿里就希望让计算成为像水和电一样的公共服务,成就更多开发者和企业。”

迄今,云计算已经支撑了三次创新浪潮。

第一次是,互联网&移动互联网创新浪潮。因与在线和大数据息息相关,很多互联网&移动互联网企业从诞生第一天起,就长在云上。云计算平台是孵化培育中小企业创新发展的基础。

比方说米哈游,“数字原生企业”的典型代表。2011年,这家公司在只有8个人的时候就跑在阿里云上,共同开启了“游戏创业”和“云上之旅”。

基于阿里云全球稳定的云服务器、数据库、存储、网络、安全等弹性扩缩能力,以及贴身的技术护航服务,米哈游给玩家提供了稳定、高质量的游戏体验。

第二次是,产业智能浪潮。当云计算成为社会新基础设施后,传统组织纷纷拥抱云计算,从增效降本走向云上创新。云计算平台成为数字经济的基础。

一个典型的例子是,小鹏汽车。2022年8月,小鹏汽车宣布在乌兰察布建成中国最大的自动驾驶智算中心“扶摇”,用于自动驾驶模型训练。

“扶摇”基于阿里云智能计算平台,以更低成本实现了更强算力,将小鹏自动驾驶核心模型的训练速度提升了602倍。

第三次是,人工智能浪潮。AI诞生后几起几落,但依托云计算的积累,大模型迎来勃发,AI进入新时代,催生了新的创业创新。云计算是AI大爆发的基础。像百川、智谱等国内主流的大模型,都实现在阿里云上。

推理方面也是,之前刷爆朋友圈的妙鸭相机,其实就是阿里大文娱下面的一个小团队出品的,也部署在阿里云。自7月17日正式上线以来,“妙鸭相机”就以9块9价格和高质量“写真”照获得了大量关注,高峰期一度有4000-5000人排队。

“妙鸭相机”的相片生成需要庞大的GPU算力进行计算,高峰期的量级至少需要几千台GPU服务器才能满足,线下部署不切实际,云上部署能节省大量成本和时间。

支撑这种大模型应用的,就是阿里云。正是阿里云提供的高弹性底层算力,让“妙鸭相机”轻松应对暴涨数百倍的算力需求。

在现场,阿里云

又给大家带来怎样的惊喜?

在下午的技术主论坛中,阿里云CTO周靖人宣布,正式发布通义千问2.0。

2.0版本的通义千问,达到了千亿级参数规模,在10个权威测评中,综合性能超过GPT-3.5和LLaMA-2,也大有迎头追赶GPT-4的架势。

与此同时,基于通义大模型训练的8大行业模型组团上线,直接面向当下最受欢迎的垂直场景,包括通义听悟、通义晓蜜、通义智文、通义星尘、通义灵码、通义法睿、通义仁心、通义点金等。

用户可以在官网直接体验模型功能,开发者可以通过网页嵌入,API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。

支撑阿里云自研大模型的,正是全新升级的人工智能平台PAI。为了保证大模型训练的稳定互联和高效并行计算,阿里云全新升级了人工智能平台PAI。

PAI底层采用HPN 7.0新一代AI集群网络架构,支持高达10万卡量级的集群可扩展规模,超大规模分布式训练加速比高达96%,远超业界水平;在大模型训练任务中,可节省超过50%算力资源,性能全球领先。

此外,阿里云多款基础云产品性能也得到大幅升级,例如阿里云最新的第八代ECS实例和HPC新型实例,性能分别提升20%和40%;OSS对象存储读取带宽则提升10倍至100 Gbps,有效加速大模型相关计算和数据分析;RDS数据库读写性能提升了102%……

容器技术是当下IT行业最炙手可热的技术之一,有 64% 的最终用户在生产中会使用到 K8s和相关容器技术。

作为国内最早布局容器技术的云厂商,阿里云率先推出全球首款容器计算服务(Alibaba Cloud Container Compute Service,简称ACS),以 Serverless 形态交付算力,用户无需关注底层节点及集群,只需轻松配置即可创建pod资源并部署应用。

周靖人说:“随着大模型技术与云计算本身的融合,我们希望未来的云可以像车一样也能够自动驾驶,大幅提升开发者使用云的体验。”

据悉,阿里云上有超过30款云产品接入了大模型能力,例如阿里云大数据治理平台DataWorks新增了全新的交互形态——Copilot,用户只需用自然语言输入即可生成SQL,并自动执行相应的数据ETL操作,整体开发与分析可提效30%以上,堪比“自动驾驶”。

阿里云容器、数据库等产品上也提供了类似的开发体验,可实现NL2SQL、SQL注释生成/纠错/优化等功能,未来这些能力还将集成到阿里云其他产品上。

接下来,阿里云将走向何处?

阿里云是国内最大的云计算厂商,常年位居中国公有云(IaaS+PaaS)市场份额第一。

IDC数据显示,2022年下半年国内公有云市场前五强分别为,阿里云(31.9%)、华为云(12.1%)、天翼云(10.3%)、腾讯云(9.9%)、亚马逊AWS(8.6%)。

2023年上半年,阿里云总营收497亿元,也是中国营收规模最高的云厂商。

目前,中国云计算厂商经营大模型生态,有两种思路:一种倾向于垂直整合,一种倾向于平台生态,两种路线核心产品服务都是AI算力、MaaS平台,只不过,垂直整合路线是“以我为主”,平台生态路线则追求开放性。

显然,阿里云选择的是平台生态路线。目前全国80%的科技企业和一半主流大模型企业,都跑在阿里云上。百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等头部企业及机构,均在阿里云上训练大模型。

阿里云还开源了70亿参数、140亿参数的自研大模型,同时720亿参数的大模型也将开源,将成为国内最大的开源大模型。2022年阿里云牵头建设国内首个AI开源社区魔搭ModelScope。魔搭社区已聚集了2300多款AI模型、280万开发者,AI模型下载量突破1亿。

在阿里云魔搭社区上,百川智能、智谱AI、上海人工智能实验室、IDEA研究院等业界顶级玩家,都开源首发他们的核心大模型,阿里云则为开发者们“尝鲜”大模型提供免费GPU算力,截至目前已超3000万小时。魔搭已成为中国最大、最活跃的AI开源社区,也有人称之为中国的Hugging Face。

开放大模型生态,意味着会带来更大的算力消耗、算力租用,这也更容易激发上层应用生态,带来“模型越强、应用越多、用户越广、算力越大”的正向循环。

在美国市场,大模型对云计算厂商的拉动作用已初现端倪。微软便是一个典型,其凭借着OpenAI加Auzre的完美组合,成功实现弯道超车。微软2024财年一季度财报显示,微软智能云营收同比增长19.4%,相比亚马逊AWS、谷歌云,营收增速在反弹。微软智能云的营业利润率为48.4%,攀升至三年来的最高点。

相比之下,国内大模型仍处于早期发展阶段。当下的训练需求相对较高,推理需求尚未爆发。不过,随着未来基于大模型开发的应用逐渐普及,推理需求会逐渐成为主流。

IDC在2022年12月报告显示,中国AI服务器训练负载将不足40%,推理负载将超过60%。

公开资料显示,国内多家云厂商高管判断,随着商务谈判、落地交付逐步推进,2023年四季度、2024年一季度后,国内大模型商用案例才会规模化出现。那时,大模型会产生明显业绩拉动作用。

在周靖人看来,大模型对国际云厂商的财务表现已产生明显影响。在中国市场,AI对云计算产业带来的变化才刚刚开始,需要给产业发展一定的时间。半年来,中国的大模型生态正在逐渐繁荣。假以时日,未来算力消耗也会快速增长。

未来,云上大模型产业应该就像今天的民航一样,机场网络是基础设施,在航线上,不同厂商、不同型号的飞机都能飞;相应的,云上的算力资源,也能让不同行业的各种大模型都能跑起来。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1