阿里云对于 AI 的终极 Vision 是什么?
作者 | 宛辰
编辑 | 靖宇
10 月 31 日,在 2023 云栖大会上,阿里云 CTO 周靖人担纲释放阿里云在技术方面的新进展。让人意外的是,整个上午的论坛,鲜少有与阿里云大模型本身相关的消息,取而代之的是:Serverless、容器、流程式的开发等关键词。这多少与近来训练对标 GPT-4 的大模型、卷「多模态」的产业气候,有些不同。
大到会场主视觉 logo,小到每个展位台标识,「计算,为了无法计算的价值」,这句口号作为 2023 云栖大会的主题,被印在云栖小镇的各个角落。这句话看英文更清晰,放在 2023 年看,更具深意,Computing for the Value beyond Computation。
显然,不止大模型,阿里云回到计算这个更复杂的底层系统里,思考整个布局。
阿里云大模型的新消息在当日下午放出,只用一页 ppt 的时间,周靖人宣布了升级版的大模型通义千问 2.0,并一口气发了 8 个「应用模型」。会后,有记者问:为什么发了很多行业模型,阿里云有很多 AI 应用厂商客户,阿里云怎么考虑跟他们的关系,阿里云是什么都做吗?
「不是,看开发者」,周靖人回应道。为大模型开发者提供 AI 训练、推理的底层设施是一方面,另一边,更大体量的开发者有更多维度的需求:
在模型上做二次开发,需要魔搭这样的开源模型社区,里面有不同维度、体量的开源模型;
细分下去,也有开发者需要百炼这样的一站式大模型开发应用平台,以产品化的方式来做整个专属模型的开发、部署;
同时也需要「应用模型」这样的产品让大家体验模型能做什么,能够解决什么样实际的问题,来进一步释放开发者的创新。
开发者,这个关键群体正在进入大模型产业玩家的主视线。几天前,中国科学院院士王怀民提出,谁吸引了中国的开发者?更进一步是消费者,谁的技术就有可能成为有影响力的主导者。
更早的一两年之前,周靖人同智谱科技首席科学家、清华大学教授唐杰聊起要做「魔搭」的时候,唐杰说一定会把模型放在这里,但没有想到一年以后魔搭社区能够有上亿的模型下载量。去年云栖大会上,伴随魔搭社区一同推出的 MaaS(模型即服务),也已经成为今年云计算的关键技术栈。
面对这场高信息密度的发布会,如果只从中选一件最重要的事,周靖人觉得是「开放的技术体系」。开放,也成为本届云栖大会上被频繁提及的字眼。
阿里巴巴集团董事会主席蔡崇信表示,阿里云要做 AI 时代最开放的一朵云。他说,「不开放就没有生态,没有生态就没有未来。同时,为了帮助大家,自己也要做,只有站在更先进、更稳定的技术能力之上,才有更大的开放底气。」
开放也是阿里云的灵魂人物——阿里云创始人王坚博士留下的基因。据阿里云内部人士,对于业内普遍叫的公有云,王坚博士更偏爱「公共云」的叫法。这符合他对于云计算就像水电煤的直觉判断,他认为,「就像电一样,每分钟、每秒钟都在用,但你不会感觉到它的存在了,云计算也是这样的公共服务」。
而他的直觉,来源于 John McCarthy,后者最早编了「人工智能」这个词,也是最早达特茅斯讨论人工智能方案的 10 个人之一。鲜为人知的是,在那场会后,他还定义了云计算。
服务器是一个很好的商业模式,云计算完全是颠覆的,60 年后,智能和云计算终于走在一起,融合出更有生命力的广阔空间。
新一代云计算长什么样子,也成为从微软到亚马逊等云计算巨头都在密切关注的议题。在 2023 云栖大会上,阿里云给出了一种解题思路。
一系列产品发布背后,阿里云到底想做什么?Vision 和 Mission 又是什么?在云栖大会特别节目 APSARA Live2023,极客公园创始人张鹏,和阿里云首席技术官周靖人聊了上述洞察里,AI 时代,阿里云的使命与进化。
以下是对话原文,经极客公园整理:
01
回归,并非有意而为之
张鹏:今年云栖大会的演讲,不管是你,还是(王坚)博士,都让我有「回归」的感觉。我看到大量产业和产品分享,聚焦在技术的实质进展,很像 2015 年移动互联网热潮涌动时,在云栖大会上探索云计算释放价值。是不是你们有意为之的?
周靖人:不是有意为之。跟开发者有深度的技术探讨以及前瞻性的技术讨论,这是我们举办云栖大会的初衷。
另外也是一个比较特殊的时刻,今天我们处在 AI 技术变革的时代。在技术变革之上,是模型和各个方面的突破和创新,代表技术体系的全面升级和创新过程。
特别是云计算作为整个模型背后的技术体系,也在进行全面升级和创新,所以整个技术演进的速度大大提高。不光模型层,还有背后相关的技术,以及应用的开发范式都在发生翻天覆地的变化。
张鹏:今年的主题是:计算,为了无法计算的价值。怎么理解这个主题?
周靖人:整个计算更多是广义的计算,AI 模型背后的一系列发展代表的是一个技术体系,离不开今天云计算的方方面面的发展和创新。
在这次 AI 技术变革里面,大家时常想到模型的训练,训练过程有算法的工作,它是整个系统化的工作——利用云计算的方方面面,能够通过云计算的超大规模的分布式系统,把算力有效结合起来,联合成千上万的计算模块共同训练一个超大规模的模型。这本身就是一个非常有挑战的计算问题,跟我们的计算、对数据的理解密切相关。
再到模型的推理,也是一种计算。如何利用今天异构的计算模块,在很短的时间里给大家提供更好的模型服务,背后是计算和数据之间不断融合、不断产生化学反应。
02
数据中心是一台计算机
张鹏:2009 年,阿里云提过一个观点,数据中心是一台计算机。今天看来,大模型对计算本身提出新的要求,怎么理解这些新要求?
周靖人:在阿里云成立之初我们讲,数据中心就是一台计算机,这句话在 AI 时代有更深层次的含义和诠释。
大模型的提升不是靠单一的芯片,是靠成千上万的芯片完成,在这里有网络的架构以及各种优化;也有在系统层,怎么能够做到分布式的超大规模的训练。通过把这些计算模块有效融合起来,把成千上万的单元、GPU 或者是特殊的芯片融合成一个计算引擎,协同完成一个模型训练。
今天的云计算就是把算力的模块,成千上万的能力发挥出来,组建成更强大的超级计算机,为人工智能各个方面的创新提供支持。
所以数据中心是一台计算机,在这个时代会进一步被认证。
张鹏:对于计算的要求越来越高,这背后不只是一些算法,或者说一个逻辑往里面堆数据一定可以出结果,会有越复杂的问题涌现出来。
周靖人:这次技术变革有一个非常重要的特点,要取得领先的地位,必然懂 AI 还得懂云计算,这两者密切相辅相成,缺一不可。
如果今天有算法的能力,但是缺少云计算的支持,很难发展起来;但是今天只有云计算,没有基于 AI 的全面升级,也会面临时代的淘汰。美国当前的局面,也能够反映出这样的现状。比如微软现在有云和 OpenAI 联合,既发挥 AI 的能力,又发挥云的能力;Google 既有自己的 AI 算法能力,也有云计算的能力;但是在这个竞争里面亚马逊云 AWS 的情况比较微妙。
大家不断追赶,在这个时代,我们认为阿里云也具备得天独厚的优势,一方面我们在云计算方面深耕多年,有非常强的技术基础;另一方面,我们在 AI 方面投入非常早,2019 年就开始大模型的研究,AI 基础非常雄厚。有幸能够拥有这两方面的能力,帮助我们在这样的技术变革里面脱颖而出,更好地为大家提供 AI 的基础设施和 AI 模型的能力。
张鹏:国内很多大模型公司的模型训练,依托于阿里云完成,他们在盘大模型未来发展的过程中,最希望阿里云解决的问题到底是什么?什么是阿里云认为应该做好的基础设施?
周靖人:阿里云最重要的一个初心,就是要服务好今天各种各样的开发者。在 AI 时代,我们的开发者有各种各样的画像,分为几种类型:
一种类型是做模型的创业公司,这些公司有自己的技术和实力,也有很多前瞻性想法,能够尝试打造自己的大模型,包括百川、相关科研机构等,都是阿里云重要的合作伙伴,也是我们重要的客户。
他们希望利用我们世界级水平的 AI 基础设施,有效获得超大规模的模型训练。这绝对不是一个简单的 GPU 芯片的堆积,其中涉及到网络、存储、调度和容错等方面问题。如何在这样一个 AI 竞争的时代里,能够快速迭代,这是致胜的关键。也就是说,谁有最强有力的 AI 基础设施,就会在这样一场 AI 竞争里面脱颖而出。
张鹏:他们想要做世界级的模型,你们就帮他们做世界级的基础设施,大家都是同样一个世界级的目标。
周靖人:对。还有一些开发者基于某种原因,不自己做模型,而更关注业务系统,或者兴趣点在各种应用,更希望今天有一些训练好的模型使用。
分很多类,第一类是有二次开发的能力,希望今天拿训练好的基础模型,在上面做调整和改进。那么,通义千问把模型开源,提供各种各样的服务,和很多的工具给他们。
比如,百炼是以产品化的形式,帮助开发者做模型的二次开发,这是针对企业级的客户。
还有更多的客户希望从头做,从模型开始搭建系统,我们也提供有效的支撑:魔搭社区整个开源的模型开放给他们,他们可以在上面自由发挥、创造。这也是一类重要的开发者。
还有一类开发者,关注模型的使用,需要一个完整的模型,不需要做额外的调整,怎么通过 API 的方式接入到我们的系统里面,这是他们关心的。
张鹏:甚至不是用阿里云的模型,他用百川智能的模型,阿里云也可以帮他把这个事有效落地。
周靖人:针对这样的客户我们提供一些模型,包括行业模型,我们更多开放这个接口让他使用。同时,我们其他的平台提供第三方的模型,让他用 API 的方式快速对接在自己的业务系统里面来,这是我们一个重要的开发者群体。
阿里云今天讲是一朵开放的云,针对各种各样的客户、各种各样的开发者,我们保持开放的心态,在不同层次给他们提供开放,给他们更多产品技术的支持,让他快速在自己熟悉的领域做创新和突破。
03
云可以自动驾驶吗?
张鹏:这一点让人印象深刻。阿里云要做一个最好的大模型,同时,在大模型作为新的计算变革下,要做很多不只是大模型的东西,支持所有要应用大模型创造价值的人,用好这个基础设施。
在基础设施上,今天你讲了一个新的观点,Autonomous Cloud,我想要求证一下,云能不能自动驾驶?
周靖人:Autonomous Cloud 比较好理解,没有歧义,背后的含义是把云的管理、运维、开发方方面面智能化的能力,真正做到自动运维、自动开发、自动支持,在一定程度上是一个自动驾驶云。
今天云本身是一个非常复杂的系统,做一个类比,整个云的操作系统比一辆车复杂很多。
云的所有运维、管理、各种各样的优化、追求极致的性能,这中间有很多的算法,我们希望这部分的算法工作,从以前的人工方式,变成今天以规则的方式运营,真正升级出全方位的智能化。
通过人工智能算法的能力,包括模型的能力,大幅度提升今天云本身自身运营的效率、优化质量,能够让这么复杂的一个系统通过算法、人工智能的方式能够帮助他更加有效的运作。这是一个方面,我们让云的运作变得更加智能。
第二个方面,云的使用,涉及到开发者。开发者今天有各种各样的编程语言,使用云的接口,我们今天发布了通义灵码的产品,可以帮助开发者快速做系统的开发代码的编写。不管是今天可以根据上下文,自动按照编程人员的思维逻辑快速生成补全代码;同时帮助大家生成单元测试、生成注视、生成调试的一些系列工具,找到这个代码当中的 BUG,以及各种问题。
阿里云首席技术官 周靖人
张鹏:算是 L2 级别的自动驾驶?
周靖人:对,至少是 L2。我们希望今天让云的使用更加智能,进一步减少大家开发工作,能够自动编写很多的代码。
另外就像一辆车需要维护一样,云也是需要运维,这些可以进行自动化,用我们智能化的算法进行全方位的升级。今后真正做到云的运维在保证绝对的安全情况下,减少人员的干预,降低不可避免的遗憾的事故几率,很大程度提升整个系统的稳定性和安全程度。包括我们日常的客服文档查询和相关的咨询教育等等,都可以通过模型的方式来提供质的飞跃。
所以我们真正希望,云作为这么复杂的一个系统,能够采用我们模型上面一系列的进展,在 AI 时代真正做到自动驾驶的云。
张鹏:不管你或者是博士都在说,阿里云要做最开放的云,怎么理解最开放的云?
周靖人:我觉得开放性是我们做云计算的初心,我们的目标是服务好今天云上各类开发者,能够让他们在自己的领域里面得到更好的支持。
所以一方面,我们把最核心的 AI 基础设施开放给大家使用。另一方面,我们积极参与模型社区。
魔搭社区在过去一年成绩斐然,去年这个时候,我们第一次发布魔搭社区,那个时候刚刚起步。通过一年的时间,今天魔搭社区已经成为中国最大的模型社区,今天所有的模型创业公司做模型发布的时候,都把魔搭作为首选,今天已经有上亿次模型下载的规模,这是展示今天阿里云对于开放性的一个重要支持。
另外,我们把通义千问模型开放出来、开源出来。我们今天是国内头部企业唯一开源自己大模型的公司,把开放性做到极致,把核心能力分享给开发者。我们认为创新无处不在,要把这些能力赋予给开发者,赋予给合作伙伴,让他们发挥自己的创造力,只有这样,AI 的产业才能得到突飞猛进的发展。
张鹏:听起来,我们前半场在聊:什么是这个时代最好最需要的云计算,后半场聊最开放的云,做最开放的云才会让计算的革命变成商业的创新,变成价值。
今年云栖大会,你脑子里涌现出的第一想法是哪个词?
周靖人:这个词是:动力。希望云计算能够成为大家在智能时代的创新和突破的核心动力,希望跟大家一起来创新、突破,能够真正把云计算把我们的 AI 的能力能够赋予到我们各行各业,能够展开在 AI 时代的大创新。
*头图来源:阿里云
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
极客一问
你如何看待今年的
云栖大会?
热点视频
世界上还有很多未解之迷,极客公园与深势科技围绕 AI for Science 驱动下的科学研究新范式,探索「AI+」时代的全新价值和可能
点赞关注极客公园视频号,
观看更多精彩视频
更多阅读