即便采访间里抛来尖锐问题,周靖人也是面不改色,依旧冷静平和地回答。温和、镇定,是很多外界人对他的评价。作为阿里云的CTO,他颇有一些学术风范。其博士毕业于美国哥伦比亚大学,2018年被选为IEEE fellow。如今,周靖人已然是阿里云在AI大模型时代的技术掌舵人。那么,作为“技术船长”的他,到底希望将“云之船”驶向何方?
图 | 周靖人(来源:资料图)
AI大模型时代,阿里云的角色与定位
10月31日,2023云栖大会技术主论坛上,周靖人发表了长达一小时的演讲,详细阐述了阿里云在AI大模型时代的布局和定位。
他表示:“我们的定位是服务好AI大模型时代的创业者、开发者、以及企业客户等。”也就是说,阿里云正在努力成为AI大模型时代的基础设施。人工智能和云计算的结合,被称作是云计算的第三次浪潮。“AI技术变革背后的实质,是技术体系的全面升级。表面上看起来是模型的事情,其实背后涉及到云计算的方方面面,甚至是计算机科学技术的全面升级。”周靖人表示,“如果AI和云计算无法有效融合在一起,就会不利于产业的发展。”基于此,阿里云既搭建了云计算能力,又自研了大模型。
此次云栖大会上,阿里云宣布通义模型大家族实现全面升级,正式推出千亿级参数大模型通义千问2.0。该模型在复杂指令理解、文学创作、通用数学、知识记忆等能力上均有大幅提升。评测发现,通义千问2.0在MMLU、C-Eval、GSM8K等10个主流Benchmark测评集上,整体得分超越Meta的Llama-2-70B,综合性能超过GPT-3.5,未来有望追赶GPT-4。同时,阿里云也上线了通义千问APP,用户通过APP可以直接体验最新的模型能力。而文生图模型——通义万相也实现了多项技能的提升:比如通过引入涂鸦能力,让模型基于用户绘制的草图快速生成相应图片;再比如通过引入写真馆,只需几张照片即可生成虚拟形象。目前,通义千问和通义万相两款大模型已经在钉钉中实现深度集成。
另外,为帮助相关企业推动大模型落地,阿里云还推出一站式大模型应用开发平台——“百炼”。该平台能提供模型选型、微调训练、安全套件、模型部署等服务、以及全链路的应用开发工具,能在真正意义上帮助企业解决模型落地中的难题。通过“百炼”平台,开发者只需5分钟就能开发一款大模型应用,几小时即可搭建一个企业专属模型。需要说明的是,“百炼”平台依赖的是整个阿里云对于数据的安全管控。所上传的企业级数据仅能用于企业自家模型的微调,并不会用于其他大模型的训练。周靖人表示:“我们会通过‘百炼’这个平台,加强每一个流程的能力,提供各种部署方案,更好地解决企业在模型应用和业务体系方面的需求。”
“云客户”,实际上可以分为很多层次。譬如:有的希望使用AI基础设施打造新的大模型;有的希望结合已有的开源模型,在自家产品上做二次创新;有的希望为科研带来助力。总体而言,所有希望利用数字创新或人工智能做科技创新的人,都能获得阿里云的一臂之力。基于此,阿里云发布了8款基于通义打造的行业大模型。
其一,推出工作学习AI助手“通义听悟”,该产品能听懂并转写音视频中的文字内容,也能帮助用户快速理解音视频内容,进行内容摘要和分析。目前,通义听悟的用户数累计超过百万,每天处理的音视频达到五万余条。
其二,推出个性化角色创作平台“通义星尘”,它能将个性角色引入日常对话之中,用户不仅能选择内置的一系列个性鲜明的人物,还能自主定义第三方角色,从而更好地使用游戏、情感陪伴、教学服务等功能。
其三,推出智能编码助手“通义灵码”,该产品本身已被阿里云内部大规模采用,在大大提升用户代码编写效率的同时,还能解决不少开发难题。有开发者体验“通义灵码”之后表示:“像我肚子里的蛔虫,我刚写了开头,立即给我补了我想写的代码。”
其四,推出智能客服“通义晓蜜”,它既能根据企业需求定制客服对话机器人,又能提升客服质量和效率。
其五,推出智能投研助手“通义点金”,用户只需上传相应的财研报告文档,就能通过对话方式,获悉文档中的所有内容并得到专业回答。同时,由于该产品已被接入实时金融信息,故能给用户带来多元化信息和实时性答案。
其六,推出AI阅读助手“通义智文”,帮助用户快速阅读、提炼和解读论文,告别通过机翻阅读论文的繁琐。
其七,推出AI法律顾问“通义法睿”,提升用户对于法律知识的理解能力、对于法律文书的阅读能力等。
其八,推出个人专属健康助手“通义仁心”,用户可以咨询关于疾病和药品等健康知识。
(来源:资料图)
周靖人表示,训练这八款模型的出发点在于,“打样”展示模型所能解决的实际问题。打开通义千问的官网,即可直接体验这些模型的功能。开发者则能通过网页嵌入、API/SDK调用等方式,在自家大模型中集成通义系列大模型的能力。对于这种开放的做法,周靖人说道:“我们是API级别、模型级别的开放,能让大家发挥更大的想象空间,实现更多业务创新。”
那么,在打造大模型的背后,阿里云主要有哪些投入?首先,在技术上阿里云始终致力于提升产品性能和整体资源利用率。比如,推出一系列无服务器(serverless)化产品,帮助降低使用云的门槛。秉承为每一家AI公司提供足够算力的理念,以更高效的方式支持算力需求。以及推出ACS阿里云容器服务,进一步应对更加趋于容器的开发范式,实现各产品之间资源的互通,帮助大模型开发者快速部署。在生态方面阿里云则致力于推进模型的开源,将所有做模型、用模型的能力都悉数对外进行开放。
毫无疑问,开放——是本届云栖大会上阿里云释放得最为鲜明的关键词之一。这种开放,不仅面向大企业,也面向中小企业;不仅面向业界,也面向学界;不仅面向传统行业,也面向新兴行业。
做AI时代最开放的“云”
新能源汽车行业的大火,让自动驾驶成为科技圈内的热门词语。周靖人表示:“随着大模型技术与云计算本身的融合,我们希望未来的云可以像车一样实现自动驾驶、运维、管理和优化,大幅提升开发者使用云的体验。”那么,“云”该如何走向自动驾驶?笔者观察到,阿里云计划从以下几个维度出发。
第一,对复杂庞大的分布式云计算系统进行优化。比如,利用AI调整各种性能参数,帮助整个系统自动保持最优状态。
第二,不断提升云上开发的效率,使其变得更加智能和简洁。
第三,全面升级运维系统,通过AI的方式助力更加及时、精准地完成系统的运维,增强系统的安全性和稳定性。
第四,不断升级客服体系和文档体系,用大模型更好地服务客户和开发者。目前,超过30款云产品均已接入阿里云的大模型能力。
阿里云的开放,也体现在开幕式的演讲嘉宾安排上。会上,既有百川智能这样仅创办仅仅半年的AI新兴企业,也有童语故事这样来自儿童教育赛道的垂类企业,更有来自复旦大学的高校老师。
作为一家AI大模型公司,百川智能自2023年4月成立以后,短短半年之内连发7款基础大模型。快速发展的原因之一在于,获得了云计算能力的支持。据了解,百川智能在模型预训练和部署等方面与阿里云开展了合作,基于后者的云计算能力完成了针对千卡大模型的训练,并分别实现了模型推理成本的降低、以及部署效率的提升。
复旦大学团队则联合阿里云共同打造了智能计算平台CFFF(Computing for the Future at Fudan)。CFFF平台包括智能计算集群“切问一号”和专用型高性能计算集群“近思一号”,前者在复旦校内部署,后者在阿里云乌兰察布数据中心部署。基于CFFF平台,复旦团队已经在气象、医疗和化学分子预训练等科学大模型上取得了一系列成果。
童语故事创业者张华的另一重身份,是一名6岁女儿的父亲。基于给女儿自制故事绘本的初衷,张华开启了大模型创业之路。三个月前,他和团队在淘宝和微信小程序里上线了同名AIGC儿童绘本产品,它的绘本内容由大模型生成,配图由通义万相或Stable Diffusion生成,1-3分钟便可得到一则个性化故事。目前,其已完成20多版的迭代,其中的消息队列、数据库、开发、域名等IT配置皆在阿里云上完成。
如前所述,研发大模型是一个系统性工程,背后涉及到算力底座、网络、大数据、AI框架等复杂技术体系,这背后离不开云计算的支撑。周靖人表示:“面向智能时代,阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵AI时代最开放的云。”
如今,算力资源是有限的。而为了实现海量、异构芯片的高性能连接,给AI应用提供坚实的算力,阿里云全新升级模型训练平台——PAI灵骏平台,其具备高性能、高吞吐、低延时等特点,支持3.2Tbs的网络带宽,能通过分布式的调度和编译,在超大规模训练上实现高达96%的线性加速比。同时,为了实现低延时的模型推理,阿里云一并推出模型即服务平台——PAI灵积平台,它不仅能降低模型服务的延迟,从而降低模型服务的成本,还能确保足够的稳定性,助力模型的快速部署。
(来源:资料图)
联合生态伙伴共建繁荣开放的生态,是AI时代下的一个关键议题。周靖人表示:“促进中国AI生态繁荣,是阿里云的首要目标。”在2022年的云栖大会上,阿里云正式发布魔搭模型社区。短短一年时间,其已经发展成为中国最大的AI模型社区,汇集2300多个高质量AI模型,模型整体下载体量超过1亿。周靖人说:“魔搭社区已经成为开源平台上最重要的渠道,所有头部大模型公司都把其作为模型发布的重要阵地。”包括百川智能、智谱AI、上海人工智能实验室等公司或机构,都在魔搭社区上开源首发其核心大模型。同时,魔搭社区也提供了各种丰富的数据集。截至目前,阿里云还为广大开发者提供累计3000万小时的免费GPU算力,帮助他们试跑开源大模型。
除了搭建开源社区,阿里云也在基于通义千问进行持续开源。在今年8月和10月,其分别开源通义千问7B模型和14B模型,并已实现超百万的下载量。不久之后,预计还将开源通义千问72B模型,将成为中国最大的开源大模型。
(来源:资料图)
当下,学术界对于云计算的使用需求也在不断增加。在本届云栖大会上,阿里云正式发布“云工开物”计划,宣布将为所有中国在校大学生每人提供一台云服务器,即每年为其提供300元免费额度,方便学生使用云产品甚至开通云服务器。同时,也会为合作高校的教师提供优惠折扣,助力高校师生在云和AI的技术支持下,更好钻研前沿技术、勇攀科研高峰。目前,包括清华大学、北京大学、浙江大学、上海交通大学、中国科学技术大学、华南理工大学等高校已与阿里云建立首批战略合作关系。
为本届亚运会提供技术支持,也是阿里云在2023年不可磨灭的浓重一笔。本次亚运会是一场真正的云上亚运会,核心系统做到100%上云,借此打造出史上首个全覆盖的数字化服务体系“一屏三端”。而这背后主要基于阿里云的弹性计算、高可用性和强大存储能力。正如奥林匹克广播服务公司与奥林匹克频道服务公司首席技术官索蒂里斯·萨拉穆里斯(Sotiris SALAMOURIS)所言:“云是讲好奥运故事的关键,云计算是一系列技术创新的助推器,让沉浸式观赛体验成为可能。过去5年阿里云作为奥运会转播的基础设施,让奥运故事触达了更多全球观众。”
未来,2024巴黎奥运会还将基于阿里云实现云上转播,并增加搭载在阿里云上的多机位回放系统,预计将给观众带来三维定格画面、慢动作回放等技术创新,实现让全球观众在“云”上看比赛的效果。
(来源:资料图)
可以看到,此次云栖大会既有对过往的回顾,也在通过发布新产品来给未来注入新希望。总的来说,此次阿里云面向开发者发布了一系列模型升级,分享了以模型为中心的创新范式加速,宣布了其在“云”基础设施方面的进展。同时,阿里云着重提到生态的重要性,希望联合生态伙伴构建开放、开源的繁荣生态,并希望通过释放一系列的技术红利,推动“云”的普惠发展,让云计算加速AI浪潮之下的产业智能升级。