ChatGPT的发布可以说,点燃了全球对于生成式AI的热情和对未来世界无限的畅想。
对此,中国企业跟进的速度是前所未有的。
生成式AI从“全球爆发”到“阶梯进化”
也许,我们本来就不应该对生成式AI的发展抱着维持热度的幻想。新技术在商业化的过程中本就存在许多不确定性因素,达成盈利更是长路漫漫。从周期性来看,生成式AI技术走向成熟应用可能还需要5-10年时间,也就是说,其生命周期也是刚刚开始。
(图:研究机构Gartner的2023新型技术的炒作周期图,目前生成式AI在期望值的巅峰时期)
上图是国际研究机构Gartner对于新型技术炒作的分析图,可见从炒作的“爆发”到“回归”再到“进化”是一个正常的发展过程,几乎每个技术都有这样的阶段。对此,欣孚智库首席顾问周掌柜认为:“生成式AI眼前必然有一个全球性的从技术创新到应用创新,再到转化的过程。这个过程也许会出现热度回落,但激动人心的时刻往往会很快再次到来。”
红杉资本的生成式AI调研报告中也有类似发展进程的梳理。红杉认为促进生成式AI觉醒的主要有三个因素,即可以充分学习的模型、海量的数据以及足以支持学习的强大算力。红杉将生成式AI发展分为以下四个阶段,如图和注释:
阶段一:小模型主导阶段(2015年之前)
在2015年之前,小模型被认为是理解语言的“最先进”技术。这些小模型擅长分析任务,并且在预测交货时间、垃圾邮件分类等简单工作上越来越精确。然而,它们在生成式任务方面的表现不够出色。在当时,可以产出人类水平的写作文本或代码仍然是一个遥远的梦想。
阶段二:大模型主导阶段(2015-2022)
2015年谷歌发布了题为Attention is All You Need的论文,描述了一种名为Transformer的新型神经网络架构,可用于自然语言理解。这种架构能够生成质量更高的语言模型,且进行平行训练,显著缩短了训练时间。然而由于运算要求高,需要GPU编排,所以应用并不广泛,只能在封闭区域内进行测试。即使利用云服务,也十分昂贵。即便如此,此时的生成式AI应用还是很快进入到了竞争阶段。
第三阶段:规模浪潮来袭造就巨头(2022-2023年)
随着诸如扩散模型等新技术的产生,大模型训练和推理所需的成本获得了有效降低,这给研究界继续开发算法和模型提供了支持性条件。同时,随着巨头还开放了大语言模型,开发者们得以不断开发各种应用。新一波生成式AI创新浪潮也随之开启。
第四阶段:产业科技进入巨头时代(2023年以后)
在这一阶段中,产业科技将在AI的驱动下进入巨头时代,也就是说科技创新更加集中于具有AI能力的巨头,或者,所有的超级巨头都将变成一家AI公司,而不在局限于产业的边界,这将比互联网时代更加有趣,或许也是很多人担心的超级垄断时代。这个时代,生成式AI注定和产业大模型技术结合,成为科技巨头重要的战略发展方向。
对于未来到发展机遇,彭博智库的高级分析师曼蒂普•辛格认为:“未来十年,生成式AI将迎来爆炸式增长,从根本上改变技术行业的运作方式。”他还做了下面的图表分析行业影响:
根据彭博智库报告,2032年生成式AI收入将是2022年的十倍。这增量主要来自于几个方面:训练大模型的生成式AI基础设施(2470亿美元)、数字广告(1920亿美元)、AI服务器(1320亿美元)、对话型AI产品(1080亿美元)、AI存储(930亿美元)。
欣孚智库首席顾问周掌柜认为:“目前生成式AI还处于消化吸收互联网原始数据的阶段,所以处于爆发式智能进化前期,保有数据的互联网公司会占有一定的先发优势,未来多场景数据采集阶段必然会进入自然进化阶段。这符合科技爆发和平缓的发展规律。”
但可以得出的结论是:生成式AI全球性应用泛化的历史进程刚刚开始,将来注定出现更大的成就,但大概率会用平缓的应用方式形成更加深刻的变革成就。
全球巨头鏖战生成式AI
OpenAI确实抢了很多巨头的风头,但实际上无论美国的谷歌还是中国的百度,超级科技巨头们都在生成式AI上投入重注,这个技术显然不仅仅是一家公司的专利。
案例一:AI艺术大师形成独特风格
Dreamify应用程序就是应用了谷歌的DeepDream源代码,然后把手机上的图像转为迷幻的图片。
艺术创作方面,DeepArt是一个很值得关注的案例,作为一个在线平台,它利用深度学习算法将普通照片转化为艺术杰作。该平台由研究人员和艺术家团队开发,用户可以上传他们的照片并从广泛的艺术风格中选择,这些风格受到著名艺术家或独特图案的启发。然后,平台将所选的风格应用于上传的图像,生成一个类似于绘画或艺术品的转换版本。
案例二:蛋白质设计
Cradle/AI Protein /DeepMind公司都使用AlphaFold和AlphaFold 2技术,用来解构和分析蛋白质的结构,进而根据具体的治疗需求,优化蛋白质的结构,加速设计、测试某些蛋白质的药用效果。
人体中有十几万种蛋白质,但都由二十种氨基酸所组成。如果能确定每种蛋白质的特有功能需要,人类就能更加高效地利用它们。通过基于AI的3D结构预测功能,可以知晓从蛋白质多肽链的线性氨基酸序列到蛋白质多聚体结构多个层次的信息,来设计、测试并特性化某些蛋白质的药用效果,针对不同的治疗需求,优化相关蛋白质的结构。这能够在保持高精确度的同时,显著加速这一过程。每一轮测试都可以供人工智能学习并在后续预测和设计中做出改进。这样的研发与测试节省了大量的空间和资源,不需要庞大的投入,仅仅在96个培养板(well plate)上就可以进行。而且整体操作方便,可以自由选择设计方案中需要改动的关键点。
案例三:美国的Ello公司通过生成式AI生成教育解决方案
提高孩子适应性,帮助他们获得阅读技巧,提高批判性阅读能力。以AI为一对一教师,通过“感知、理解、交互”的过程,改进孩子的说话,以说促读,进而提升总体认知水平。Ello的自查式机器学习,构建出学习伴侣,帮助实现这一过程。在教育领域,生成式AI可以进一步更精准的判别需求,定制化的提供服务,帮助用户提高学习的效率。全球AI教育市场将在2025年达到60亿美元,其中自适应学习、智能辅导和虚拟导师等AI应用将推动市场增长。
(图:Ello阅读应用界面)
总体来看,生成式AI可以在很多层面重塑产业内部的格局。最直接的影响就是,具有高度自动化潜力的任务可以通过人工智能进行转化,并且只需要人类很少的参与与干预。
生成式AI引发大国争霸
每一项跨越时代的新技术背后注定有国家的庞大身影,绝对一点地说,在当前的科技创新环境下如果大国错过了浪潮,则会出现一步错步步错的窘境,比如错过了互联网浪潮的德国和日本就是这种情况。
过去十年,百度在AI上进行了巨大的投入,技术成果也颇多,而应用层面也在“开花结果”。
(图:百度发布的国内首张AI新基建版图 图源:中国新闻网)
BAT中曾经的带头大哥阿里,自然不甘于落后。2023年4月阿里云峰会上,阿里巴巴CEO张勇宣布了旗下“通义千问”的面世,并且表示未来阿里所有的产品都将接入该大模型。未来通义千问将基于基础设施向企业开放,企业可以在阿里云上训练企业自己的行业、垂类大模型。
中国在大模型的开发上一直在不断投入。从生成式AI模型数量上来看,全世界前十的模型研发机构中,中国占据四席,分别是百度、BAAI智源研究院、清华大学以及阿里巴巴研究院。
除了中美战略竞争之外,以色列、印度和欧洲的科技创新企业同样非常活跃地在生成式AI和大模型应用领域重度投入,如下两张图分别是对以色列和印度AI投资的梳理:
(图:以色列的生成式AI企业生态)
以色列拥有一个充满活力的初创企业生态系统,高度集中的科技公司和蓬勃发展的创业文化。以色列公司一直在不断突破可能性的边界,开发出解决现实挑战、颠覆行业的尖端解决方案。
(图:印度的生成式AI企业生态)
印度作为IT强国,在生成式AI方面也是十分活跃,虽然没有印度本土公司研发出大模型,但是在应用端,印度在不断探索和尝试。
(图:欧洲的生成式AI企业生态)