当前位置:首页|资讯

生成式AI落地的无数种可能,都在云栖大会看到了|甲子光年

作者:甲小姐甲子光年发布时间:2024-09-22

接管数字世界,改变物理世界。

作者|栗子

“生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级APP,而是接管数字世界,改变物理世界。”

这是阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在2024云栖大会的开场演讲中最重要的观点。

阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭 图片来源:阿里云

从ChatGPT到o1模型,在过去的两年时间里,OpenAI引领全球的生成式人工智能产业进入了新的发展周期。但与其他所有IT技术一样,今天的生成式AI也同样走出了典型的Gartner曲线。

在经历过最初的狂热之后,行业中慢慢出现了对生成式AI的失望与质疑。其中被人诟病最多的问题,就是如今的生成式AI是否会和上一波判断式AI一样难以落地,难以获得更多的商业化价值。

去年,国内AI大模型赛道的发令枪刚刚打响。当年云栖大会的关注点更多聚焦在算力层面,生态伙伴们对于商业化这个问题还没有太多的答案。

然而仅仅过了一年,在今年的云栖大会上,我们就已经看到了AI正在千行百业的逐步渗透。而身处AI浪潮的中心,阿里云自己的动作,也越发清晰了起来。

1.生成式AI要改变物理世界

在谈论今天的生成式AI究竟是一个多大的变革机会时,“互联网”是最常被人提及的参照物。

其中最为知名的论点是,比尔·盖茨曾在自己的博客GatesNotes中提及,新一轮AI革命的重要性不亚于手机和互联网的诞生,并且在未来五到十年内,AI将彻底改变人们教学和学习的方式。

显然,盖茨给了生成式AI一个极大的期待。互联网变革了人们的连接方式和信息获取效率。而在移动通信技术支持下的智能手机的普及,则把这种变革推向了新的高潮。

但与互联网与移动互联网相比,今天生成式AI的最大的区别和想象空间是什么?

毋庸置疑,过去30年,互联网浪潮的本质是连接。互联网连接了人、信息、商业和工厂。通过连接提高了世界的协作效率,创造了巨大的价值,改变了人们的生活方式。

但今天的生成式AI是通过大幅提高整个世界的生产力水平,为世界创造更大的价值。这种价值创造,可能是移动互联网连接价值的十倍、几十倍。

吴泳铭指出,在过去很长一段时间,AI的焦点主要集中在模拟人类的感知能力,比如自然语言理解、语音识别、视觉识别。但如今大模型技术的逐步成熟,给生成式AI带来了质的飞跃。AI不再仅仅局限于感知,而是首次展现了思考推理和创造的力量。

一个行业内众所周知的例子是:去年,大模型的数学能力还只有中学生水平,代码能力也只能帮助程序员写一些简单的代码。而仅仅一年之后,今天的模型能力已达到国际奥赛金牌水平,并在物理、化学、生物等多方面学科接近博士水平,代码能力也已可以独立完成复杂的编程任务。

但问题在于,仅仅只是提高大模型的计算与推理水平,并不能真正产生实际价值。生成式AI更大的发展空间一定是与真实的物理世界产生关联,帮助人们完成实际的业务、工作与学习。这才是变革的关键所在。

所以吴泳铭给出了一个非常鲜明的观点:AI要接管数字世界,改变物理世界。

“今天很多行业内人士一直在想AI最大的应用是什么,可能一直在想手机上有什么AI时代创新的超级APP。但我们认为AI最大的想象力绝对不是在手机屏幕上,而是在通过渗透数字世界、接管数字世界,并改变物理世界,这才是AI最大的想象力。”

在云计算中有个术语叫“数字孪生”,大致指的是给某个真实存在的物体在数字环境中构建一个完全一样的孪生模型,用来计算、预测甚至操控物理世界的对应物体。

而生成式AI对物理世界的改变也类似这种方式。

在吴泳铭看来,生成式AI让世界有了一个统一的语言——Token。它可以是任何文字、代码、图像、视频、声音,或者是人类千百年来的思考。AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面(比如人类行走、奔跑、驾驶车辆、使用工具,绘画、作曲、写作、表达、教学、编程的技巧等等)。理解之后,AI就可以模仿人类去执行物理世界的任务。

例如汽车行业就正在发生这样的变革。之前的自动驾驶技术,是靠人来写算法规则。几十万行代码,仍然无法穷尽所有的驾驶场景。而采用“端到端”的大模型技术训练后,AI模型直接学习海量人类驾驶视觉数据,直接让汽车具备了超越大部分司机的驾驶能力。

再比如机器人将是下一个迎来巨变的行业。未来,所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员、包括家庭里的宠物狗、保姆、助理。

“工厂里会有很多机器人,在AI大模型的指挥下,生产机器人。现在每个城市家庭里有一辆或者两辆车,未来每个家庭可能会有两三个机器人,帮助人们提升生活当中的效率。这将带来新的产业革命。”

图片来源:阿里云

2.突破瓶颈,生成式AI加速落地

其实,生成式AI之所以在商业化层面备受质疑,除了此前的模型训练、推理等成本居高不下之外,还有一个最重要的原因就是缺乏场景。

行业内的一个普遍共识是,现阶段,toB是生成式AI快速实现商业化的最佳路径。而toB就意味着需要在企业端落地。

一年前,大多数企业或许对AI如何赋能自身业务尚存疑问,并且各种专门基于各个行业数据训练的垂直模型并未成熟,大模型在企业业务上无用武之地,进而不可避免的陷入了“拿着锤子找钉子”的尴尬局面。

但一年后的今天,当算力、推理等成本的下降,端侧小模型的出现,以及企业业务场景对AI需求探索的不断加深,等等一系列的变化,使得供给方与需求方的关系开始扭转。

在不久前举办的外滩大会上,钉钉总裁叶军在论坛发言中表示,接下来的18个月是应用驱动人工智能创新的新阶段,是钉子找锤子的阶段。显然,这种关系的转换,意味着企业对大模型实际应用的核心诉求和评价标准已基本明确。生成式AI真正开始走进千行百业。

AI+教育是目前被人普遍看好的方向之一。

在本次云栖大会现场,精准学集团发布了依托AI技术打造的“超拟人AI一对一老师”。

据精准学集团创始人&CEO杨仁斌透露,该产品是公司基于其自研的语音端到端“心流大模型”,结合阿里通义大模型打造。心流大模型是精准学集团在通义千问的基础大模型上,利用私有数据,训练出的自有教育垂直大模型。

同时,为了做到更好地情绪识别,公司还在通义千问开源大模型上重新训练了语音-语音端到端的大模型,并专门面向学科知识教学优化了语音识别与语音合成技术。这一切的目的就是让AI最大化还原真人老师,能够一对一辅导孩子进行个性化的学习。

“超拟人一对一AI老师”的诞生,意味着大模型从千篇一律的“AI做题工具”真正进化到普适化的教学应用场景,开始成为一个“体系化的教学辅导老师”。这也意味着中国率先打响了全球教育垂直大模型落地的第一枪。

除了教育外,自动驾驶也是目前AI落地的一个重要赛道。

今年的云栖大会,自动驾驶显然是看点之一。特斯拉、小鹏、零跑等国内外头部车企“组团”参展。而在云栖通道开放现场,斑马智行首席产品官蔡明,也给观众带来了AI+自动驾驶的相关分享。

蔡明介绍,此前斑马智行联合通义发布了全新智能座舱AI技术品牌“元神AI”,同时展示了基于英伟达OrinX平台、通义端侧多模态大模型的智舱AI技术能力。

元神AI旨在推动解决触控交互/命令式语音交互和APP服务带来的座舱体验不佳、服务使用低频问题,通过交互变革和服务重塑,加速智能座舱“iPhone时刻”的到来。

“在未来,斑马智行会推出全自研自然语言交互方案,来代替Touch交互。同时,我们联合生态伙伴一起,推动智能座舱应用AI化,打造更多端到端的智舱生活服务Agent,来替代APP生态。”蔡明表示。

机器人与AI的结合也同样出彩。

个人开发者、知名技术博主张子豪在云栖大会现场,向观众展示了自己使用通义大模型对机器人的“调校”:基于幻尔TonyPi人形机器人,通过开源AI推理框架OpenVINO,在轻薄笔记本上本地部署端侧AI开源大模型通义千问Qwen2-7B-Instruct,使用AI编程助手通义灵码辅助编程开发和文档撰写。

“其实机器人已经是一个非常成熟的行业,为什么最近几年这么火?因为AI大模型能够真正给机器人注入灵活。AI大模型的最大好处就是,它可以把任意指令翻译成机器人的动作,直接让机器人真正理解世界的知识。”

在张子豪的调教下,人形机器人能够通过一个指令,完成搬运货物、巡线避障、花式足球等高难度动作。

图片来源:阿里云

今年云栖大会现场还有太多生成式AI的落地应用案例了。“今天我们接触到的所有客户、所有开发者、所有CTO,几乎都在用AI重构自己的产品。”吴泳铭直言。

3.重构AI基础设施,阿里云不想错过

作为目前国内最大的云计算服务商,阿里云看到了大量新增需求正在由GPU算力驱动,大量存量应用也在用GPU重新改写。在汽车、生物医药、工业仿真、气象预测、教育、企业软件、移动APP、游戏等等行业,AI计算正在加速渗透。

一个确定的趋势是:所有行业都需要性能更强、规模更大、更适应AI需求的基础设施。

而这也正是阿里云的下一步动作。

云栖大会上,阿里云CTO周靖人表示,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。

阿里云CTO周靖人 图片来源:阿里云

周靖人直言,不同于传统IT时代,AI时代对基础设施的性能、效率要求更高,CPU主导的计算体系已快速向GPU主导的AI计算体系转移。所以阿里云正以AI为中心,全面重构底层硬件,并与AI场景有机适配、融合,加速模型的开发和应用,打造一个AI时代的最强AI基建。

除硬件外,通义大模型本身也迎来了重大升级。

作为业内最早布局大模型技术的科技公司之一,去年4月,阿里云发布首个大语言模型通义千问,如今通义大模型家族已全面涵盖语言、图像、视频、音频等全模态,性能均跻身世界第一梯队,同时通义模型持续开源,已成为最受企业和开发者欢迎的国产大模型。

大会现场,周靖人宣布通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o;同时发布最强开源模型Qwen2.5系列,成为仅次于美国Llama的世界级模型群。

此外,周靖人还宣布通义千问三款主力模型再次大幅降价,最高降幅85%,百万tokens价格低至0.3元,进一步推动大模型普惠,让企业和开发者以低成本的方式用上大模型。

据周靖人介绍,目前,中国一汽、联想、微博、携程、喜马拉雅、三得利(中国)等30多万企业客户已经接入通义大模型;未来,生物医药、工业仿真、气象预测、游戏等行业还在加速拥抱大模型,这也必将带来新一轮的AI算力增长。

“这是AI基础设施全面革新带来的技术红利,我们会持续投入先进AI基础设施的建设,加速大模型走进千行百业。”

正如吴泳铭在演讲尾声时提到,阿里云正在以前所未有的强度投入AI技术研发和基础设施建设。“从历史经验来看,人们对新技术革命,往往对短期高估,又对长期低估。因为在新技术应用早期,渗透率还比较低,大部分人的本能会产生怀疑,这很正常。但新技术革命会在人们的怀疑中成长,让很多人在迟疑中错过。

显然这一次,阿里云不想错过。

(封面图来源:阿里云)

END.


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1