当前位置:首页|资讯|AI大模型|教育

安筱鹏|AI大模型:一次重构软件系统、驱动万物智能的技术革命

作者:阿里研究院发布时间:2024-02-22

原标题:安筱鹏|AI大模型:一次重构软件系统、驱动万物智能的技术革命

近期,在信息社会50人“智能时代:经济学的重构”论坛上,安筱鹏博士从大模型发展趋势、在典型行业中应用、对教育体系颠覆以及对组织形态重构等方面,深入分享了对于AI大模型的理解和洞察,以下是发言要点。

AI大模型是通用人工技术(AGI)发展的重要里程碑,AGI将引发新一轮数字技术竞争格局重构,也是大国新一轮数字技术竞争的制高点,必将对未来5-10年全球技术创新、企业竞争和国家博弈产生深远影响。从这个意义上讲,大模型代表的不是一个技术,而是开启了新的智能时代。

AI大模型既带了普惠效应,也带了极化效应。一方面,AI正在以更快的速度、更广的范围、更深的影响,让每个人、每个组织都能感受到新技术的红利。但另一方面,AI大模型带来的是人和人的分化、企业和企业的分化、地区和地区的分化、国家和国家竞争力的分化。

AI大模型正在形成更强大的规模经济和网络效应,人类社会将会迎来10万亿美元市值公司的时代。它可以在全球整合技术、人才、市场、资本等资源,让新技术通过高频迭代、低成本试用、大规模普及。这改变的不仅仅是一个企业的竞争力,也是一个地区、国家间核心竞争力和国际竞争格局。

AI大模型重构软件系统、驱动万物智能,是变革生产力的主要途径。

# ONE

AI大模型出现后,“鲍莫尔病”是否有新解?

20世纪60年代,美国经济学家威廉·鲍莫尔和威廉·鲍恩提出了一个问题:为什么教育、法律、医疗、表演、休闲等服务行业的成本和价格一直在上升,而有形商品价格持续下降? 制造业等进步部门可以通过使用劳动节约型技术大幅提高生产率,使得产品成本持续下降,而技术进步并没有带来服务业生产率大幅提高,服务业等停滞部门的成本不断上升。后来人们将这一现象称为“鲍莫尔病”。

半个多世纪以来,“鲍莫尔”不仅没解决,而且越来越严重。商品价格在不断下降,但美国服务的价格在过去十多年持续攀升。自2000以来,美国医疗服务价格增长200%、大学费用增长150%+、医疗保健增长100%,而玩具价格降了50%、电视价格降了100%。“鲍莫尔病”在进入新世纪后更严重了。

2021年3月16日,OpenAI公司CEO山姆·阿尔特曼(Sam Altma)在《万物摩尔定律》文章中预言:AI革命是继农耕时代、工业时代、计算机时代之后的第四次革命,10年后AI可以完成几乎所有工作,包括科学发明。可以确认的是,AI将使产品(Goods)和服务(Services)变得越来越便宜。为此,为迎接一个包容性的智能社会到来,政府应当建立新的税收制度和资本市场。

AI是否能够提高医疗、教育、法律、政务、创意、影视、娱乐等服务行业的生产效率,为解决“鲍莫尔病”找到新药方? 我们可以看一看几个服务业领域正在发生的变化。

软件业:每个人都是程序人,编程开启大众化时代

软件行业是过去几十年人才最稀缺的行业,AI大模型正在改变这一格局,AI软件开发和编程能力正在逼近人类。今年4月GPT4发布后,国内研究机构CSDN测试结果是,GPT-4的软件编程能力相当于中国月薪3万人民币的软件开发人水平。GPT4通过了谷歌编码L3级(入门级, 18万美元年薪)工程师测试。

Stability AI 的CEO说人工智能将在五年内取代人类程序员。谷歌旗下Deepmind公司编程应用AlphaCode,在编程比赛中超过45.7%的人类参赛者。有这样一个案例:一个只有8岁的小孩,利用人工智能开发了一款平台跳跃小游戏,代码由ChatGPT和Claude生成、美术由Stable Diffusion提供。

今年的云栖大会上,阿里云也推出了一款代码大模型,叫“通义灵码”, 可自动生成行级/函数级代码、单元测试、代码注释等,为开发者带来高效、流畅的编码体验。

从赋能实体经济的视角来看,大模型生成代码的价值,可能超过生成文字/图片/视频的价值,这个价值被远远低估了。

未来AI将重构整个软件体系,所有的软件都需要基于AI重新做一遍。这句话的关键词是“所有”。“所有”的含义是:手机上所有的APP会被重构,Windows、Office等办公软件会被重构,ERP、PLC、SCADA等工业软件会被重构。所有软件将由AI驱动,软件服务模式加速从“流程”驱动到“数据”驱动,SaaS软件从“在线化”走向“智能化”。软件开发前端从流程事务处理,到人机对话交互;软件开发后端的更多代码将自动生成。

未来所有的智能硬件包括手机、计算机、智能家电、摄像头、机器人、AGV小车、工程机械等将被AI大模型驱动。你可以问家里的摄像头,你家的猫在哪里?你可以让机器人像人一样和你聊天、端茶倒水。你可以让生产线上的码垛机器人,根据人的自然语言指令生成或圆形或方形的堆垛。

不是说仅仅在未来会重构,此时此刻的当下已经在发生变革。今年西门子和微软已经达成新的战略合作,在今年的汉诺威博览会上,展示了ChatGPT和其他Azure人工智能服务如何增强西门子工业自动化工程解决方案能力,工程团队可以通过自然语言输入生成PLC代码,从而显著减少时间和错误概率。

今年4月,阿里云工程师就在实验室将通义千问大模型接入工业机器人,在钉钉对话框输入一句人类语言,大模型就会自动生成机器人可以理解的代码,从而远程指挥机器人工作。

7月28日,谷歌DeepMind推出了一款新的机器人模型Robotics Transformer 2(RT-2)。这是一个全新的视觉-语言-动作(VLA)模型。例如,对AI说“捡起已灭绝的动物”,机械臂会在一堆塑料玩具中精准地选择恐龙。“灭绝的动物”很多,在此之前,机器人无法做到把“灭绝的动物”和“塑料恐龙玩具”联系在一起。

未来,当智能设备被AI大模型所驱动,其背后折射出的是,伴随着IT技术、CT技术、DT技术和OT技术的融合,伴随着被AI大模型所驱动,越来越多的设备正演化成一个智力水平不断成长的智能体。智能时代将是一个智能体涌现和联合的时代,这也将带来人类生产组织和生活方式的深刻变革。

AI大模型带来软件效率革命

近期美国技术圈讨论一个招聘案例:一家技术公司准备招聘1名员工,有2名程序员来应聘:一个是拥有4年编程经验的巴基斯坦人Hamid,一个是拥有19年编程经验的德国 人Alex,公司安排两个候选人开发一个软件(创建最小可行性产品MVP)。一周后,Hamid完成了95%的MVP,而Alex只完成了7%的MVP。为什么只有4年编程经验的人反而编程速度更快呢?因为他借助了代码大模型,不仅编程效率更高,整个开发成本也极大降低。

2023年10月, GitHub Copilot开发者突破了1亿,付费用户已突破了100万。从最早只有 27% 的开发者会使用到如今的46%,GitHub Copilot让开发者的代码编写效率提升了55%,高达 75% 的开发者在使用 Copilot 时感到更有成就感。GitHub CEO说“很快 AI将能实现 80%的编程”。在全球峰会上,他直播用GitHub Copilot X,仅仅耗时18 分钟就编写出了贪吃蛇游戏。

AI大模型重新定义了软件开发中的“人机交互”

简单回顾软件开发的历史,从物理交互界面的效率低、操作员必须熟悉每台机器的物理按钮功能,到编程交互界面的门槛高、操作员必须熟悉计算机硬件细节并精通编程,再到图形交互界面(GUI)空间小,而对话式交互界面(CUI)可以实现效率高、门槛低和无限触达。AI大模型的出现,真正能够打通人类语言和机器语言。

医疗:人类医师资源不足是否有解?

2023年4月28日,《美国医学会杂志》的研究显示:面对病人的咨询,“ChatGPT医生”获得好评的数量是人类医生的4倍。在“富有同情心”的指标中,ChatGPT更是收获了45%的肯定,而人类医生仅有4.6%。

医疗大模型可以大幅提高效率、创造新的价值

今天,医患比例严重不足是全球面临的共同难题。2019年《柳叶刀》的数据显示,全球缺少4300万名卫生工作人员。现在,AI阅片的准确率达到了95%以上,年轻医生准确率在80%左右。原来阅一个片需要25分钟到半小时,在AI加持下不到半分钟。

围绕医疗领域,AI已经有了很多创新。今年8月,谷歌发布全球首个全科医疗大模型Med-PaLM ,这是首个在美国医疗执照考试中达到专家水平的大模型,懂临床语言、懂影像,也懂基因组学。国内也已经发布了超过40个医疗大模型,在浙大附属医院、华山医院等医院试用。

不仅如此,AI大模型在特定的病例识别方面效率更高。国外有一个案例:一个4岁男孩牙痛持续加重,后出现走路不稳,历时3年,经17位医生(包括神经科、神经外科、儿科、内科、骨骼肌肉专科等)问诊也没有确认病因。最终疲惫而沮丧的妈妈将儿子的病历资料提问抛给ChatGPT,得到的诊断包括脊髓栓系综合征。由此,该名儿童最终得以确诊和治疗。

律师:普惠的AI律师将普及

律师这个行业的服务价格,在美国还是比较贵的,大概每小时150美元。但现在有一个年服务费只要36美元的AI律师,他不仅便宜,在某些能力上和那些每小时150美元的律师差不多。它可以进行智能化、自动化的法律检索,起草法律文件、起诉书、备忘录、判决书,预测案件判决结果等等。在美国的律师资格考试中,GPT-4已经超过了90%的学生。

目前,已经有一些公司在法律大模型这个细分领域深耕:

EvenUp:个人伤害索赔领域垂直LLM,2019年成立,B轮融资估值3.5亿美金,已落地超200家律所。

Harvey:专为律所打造的LLM,2022年11月成立,获OpenAI、红衫投资。

律商联讯:顶级法律、专利、税务等服务商,2023年5月推出全球首个面向法律界类ChatGPT生成式AI平台——Lexis+AI™。

汤森路透:法律业务是三大支柱业务之一,每年1亿美元投向AI。

设计:Midjourney让最富有创造力的艺术家们不淡定了

2022年,在美国科罗拉多州举办的艺术博览会上,一幅名为《太空歌剧院》的画作,在数字艺术类别的比赛中一举夺得冠军。据媒体报道,《太空歌剧院》与人们普遍认知的艺术作品有所不同,它是游戏设计师Jason Allen通过AI绘图工具Midjourney创作而成,一时引发很多热议。

电影导演陆川说,AI用15秒出来的效果,比找专业海报公司做一个月作品要强大很多。如果去找专业图像公司来画气氛图,一张至少要花上万元,现在用AI,可能只要十元钱。

面对这样的场景,一些人甚至悲观地表示:我们眼睁睁地见证了艺术的消亡。如果连艺术工作都无法避免被机器所吞没,那么其他高技能的工种也将面临被淘汰的危机。到时候,我们又能剩下什么呢?

今年11月28日,成立半年只有4个人的小公司Pika发布自己Pika1.0,可以通过输入文字高质量地输出视频,成为颠覆电影和视频创作现象级AI应用。近期获5500万美元融资,估值在2-3亿美元,半年用户超50万,国内已与《流浪地球3》开展合作。它将带来一次影视创造模式的革命,也许每个人都可以圆自己的导演梦和演员梦。

AI与EDA双向奔赴:引领设计变革

AI成为芯片设计的“器”,用AI帮AI,AI与EDA的双向奔赴,将开启芯片设计的下一场革命。

英伟达用AI设计GPU,比传统EDA减少25%芯片面积,功耗更低。随着摩尔定律变慢,开发其他技术来提高芯片性能变得愈发重要。设计更小、更快、功耗更低的算术电路,就是其中的方式之一。基于这样的背景,英伟达的研究人员提出了PrefixRL——用深度强化学习优化并行前缀电路。英伟达Hopper架构H100就拥有13000个AI设计电路。

谷歌也开始使用强化学习(RL)技术设计自己的TPU AI加速器布局。Synopsys和Cadence等传统芯片设计工具公司积极拥抱AI设计。

中科院陈云霁团队,推出了世界首个完全由人工智能设计的CPU芯片“启蒙1号”,短短5个小时内便生成了一个工业规模的RISC-V CPU核心,设计周期则缩短至1/1000。

# TWO

AI大模型正颠覆传统教育体系?时代需要什么样的人?

进入新的智能时代,传统的教育体系会不会因为大模型而颠覆呢?我们这个时代,五年、十年、二十年之后,到底需要什么样的人呢?我们看到,在教育领域,GPT已经通过了各种各样的开始,比如ChatGPT已经通过美国沃顿商学院MBA期末考试。

今年3月,OpenAI和宾夕法尼亚大学推出了一份研究报告,针对 1000 多种职业,探索AI大模型怎么影响美国劳动力市场。首先我们先来定义什么是“影响”, “影响”的含义是,当一个职业使用大模型时,能否让工作时间减少至少50%。研究人员的结论是: 对于19%的岗位,至少50%的工作内容会被影响。对于80%的岗位,也至少有10%的工作内容被或多或少地波及。而且高收入工作面临着更大的风险。

AI大模型是什么?今天的AI大模型可能就像历史上的火药,正在从放烟花时代走向枪炮时代,实现从冷兵器到热兵器的跨越。那什么样的人才不会被这个时代淘汰呢?我觉得有三个标签: 一是想像力,二是创造力,三是批判精神。

现在的教育体系下,我们可以想一下,哪一个是培养想象力、哪一个是培养创造力、哪一个是培养批判精神。如果没有这三个能力的时候,这些培育的人未来能够做什么工作呢?我们靠什么参与全球竞争,这些问题都值得深入去思考。

AI for Science论文数量井喷,AI已成为重要的科研手段

AI不仅仅是一种工具,近年来,AI4S(AI for Science)成为一种基本科学研究方法。理解蛋白质三维空间结构一直是生物学中的重大挑战,过去几十年,结构生物学家通过X射线晶体图学或者冷冻电镜等高科技手段,共得到十几万种蛋白质结构。

直到2020年,这一困扰生物学家50多年的问题被DeepMind团队开发的Alpha Fold2模型彻底打破,Alpha Fold2的预测精准度几乎达到冷冻电子显微镜等实验技术的水平。2022年7月28日,DeepMind公布了从细菌到人类的几乎所有已知(2亿多个)蛋白质的可能结构,并将其纳入相关数据库,供研究人员免费搜索蛋白质结构。

Google学术相关数据表明,近3年使用AI的论文数量增长率超3倍。像材料科学、生命科学、能源科学,近3年使用AI手段开展科研的比例超过34.5%。换句话说,人们认识和改造世界的方法论已经发生了重大变化。

中山大学:用云加速RNA病毒发现,重新定义了人类对病毒演化历史的认知。

全球RNA病毒种类丰富多样,且高度分化。受限于聚类统计学算法和传统计算方法,主流配置服务器运行一次试验的时长达2-3个月,科研代价大、结果精度不高,研究效率低。

中山大学医学院围绕RNA病毒研究,开发AI大模型,帮助RNA病毒发现技术突破,将RNA病毒的发现效率从2-3月缩短为一周,扩充全球RNA病毒库——近30倍的新发现病毒种、约9倍的新发现病毒超群。云和大模型大幅提升了人类发现RNA新病毒的效率,重新定义了人类对病毒演化历史的认知。

# THREE

AI大模型重新定义组织和员工?

AI大模型是人类社会第25种通用目的技术,通用目的技术将带来组织形态的变革。

Midjourney公司2021年成立,拥有1000万的社区成员,1亿的营收且零融资。此前只有11个员工,包括1个创始人,8个研发,1个法务和1个财务。PIKA公司成立6个月,也只有4个员工。它们的规模反映出一个现象:未来的企业会越来越小型化,越来越微粒化。

为什么微粒组织、微粒社会正在崛起?我们可以思考一个问题:人类是怎么协作的?如果我们把时间尺度拉长,看到的是基于信息能力提升所带来的社会协作水平的深化,是人类社会演进的一条主线。

在《人类简史》中,作者赫拉利提到,10万年前地球上存在着猿人、智人等人类祖先,但在1万年前只剩下了智人。智人在进化中率先在语言和信息交流上实现了突破,形成了一种超凡的信息认知。这样,人们不仅可以交流猎物和危险的来源,还可以设定一个目标,实现人与人之间的协作。

到了工业社会,随着印刷、电报、电话的普及,人类的协作从熟人分工演进到陌生人协同,从封闭体系到开放体系,从小尺度到大尺度,从几百人到几十万人,开启了大制造、大零售、大流通的时代。

再到今天,从计算机到互联网,从人人互联到万物互联,从人工智能到区块链,我们正在重构对外部世界的感知、获取和利用的方式。这种沟通方式的变革正在重构分工协作的基础设施、生产工具和协作模式。

一代协作技术,一代组织形态

从PC互联网到移动互联网,再到今天的智能时代,信息在组织内部的管理、监督及在外部交易、协作中的成本不断降低、协作模式不断创新,企业边界正在重新定义,科层组织正在瓦解,微粒企业(组织)正在崛起。

康威定律说“系统的技术架构会是组织架构的复刻”,但今天我们看到的更多是“逆康威定律扩展”,即我们用什么样的沟通协作系统,决定了我们是什么样的组织形态。就像经常有人说的一句话,“一代协作技术,一代组织形态”,你有什么样的技术沟通方式就会催生、诞生、孵化出什么样的新的组织形态,不同的技术时代会形成不同类型的组织。

今天,当云计算、大模型、AI到来的时候,微粒企业正在崛起。过去开发一个软件的功能,达到最小化可行产品(MVP)的团队规模可能需要40个人、50个人,今天可能只需要3到4个人,组织变得越来越小,这是技术变化的一个趋势。

AI重新定义组织形态,AI正在重新定义“员工”

AI的到来会让你拥有一个新员工,它是一个“学霸”,已经学习了地球上所有的知识。你需要与这个员工不断地交互、协作,不断地驯化与被驯化。

之前有一个概念叫“AI助理”,这个词的叫法可能不对,它可能是助理,可能是教练、顾问、队友,也可能从Copilot辅助驾驶到Autopilot自动驾驶, 我们跟AI员工之间是一个相互赋能的过程。

试想一下,数字员工应该归属哪个部门?我们看到有“数字招聘员工”、“数字财务员工”等各类数字员工,它不仅具有IT属性,还具备一些人的功能,那它是属于人力资源部门还是IT部门?这些问题目前没有结论,都是需要探讨的。

作者|安筱鹏 阿里云智能集团副总裁

责编|崇修(转载及媒体合作请评论区或邮箱留言)


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1