2022年11月,人工智能对话机器人程序ChatGPT面世引起了外界广泛关注,因其远高于比过去同品程序的文本反馈能力以及在理解人类提问上的优异表现,业界将之视为当前强人工智能的代表作。不到两个月里,ChatGPT用户数激增过亿,成为史上增长速度最快的消费级应用程序。这也是继AlphaGo问世之后出现的第二次强人工智能热潮。
ChatGPT的亮眼表现也牵动了行业科技巨头纷纷入局,并引发新一轮的AI备战升级。由于谷歌搜索业务被认为受ChatGPT影响最深,谷歌公司迫于压力仓促推出其竞品Bard(一款基于LaMDA语言模型的AI对话程序),却因其首秀意外“翻车”而导致股价大跌。与ChatGPT研发机构OpenAI早有投资关系的微软则继续跟进扩大投资,并高调宣布旗下搜索Bing引入ChatGPT。而国内的百度、阿里也传出正在研发类ChatGPT的项目,网易、科大讯飞、360等也在相关领域布局涉足类ChatGPT业务。
● ChatGPT的由来
ChatGPT是由人工智能实验室OpenAI开发的一款人工智能对话工具,作为深度学习的产物,该程序基于GPT-3架构的自回归语言模型进行强化巨量的文本学习训练。由于是聊天机器人的产品形态,ChatGPT仍以文本交互方式与终端使用者进行自然对话,但其功能远比此前的一般聊天智能助理强大,能够生成自动文本,应对复杂的文字工作,自动问答、生成和调试编程语言等等,应用广泛。
人工智能实验室OpenAI成立于2015年,是一个目前由非盈利向盈利过渡的商业组织,其创始人埃隆•马斯克和山姆•阿尔特曼创办动机是出于对强人工智能潜在风险的担忧。2016年OpenAI发布了机器学习公测平台,此后每年花费高昂资金用于训练,直至ChatGPT发布。
发布之初,ChatGPT的表现虽然亮眼但并非臻于完美,经使用者大量测试发现,一些专业领域知识给出的反馈仍存在事实准确性参差不齐的缺陷,其模型训练结果被认为需要进一步校正。
● 强人工智能应用兴起与现状
这些年,人工智能领域的分支以人工神经网络为架构的深度学习发展迅速,这主要得益于全球云计算市场膨胀、基础设施数量逐年扩大带来的算力资源总量的快速上升。深度学习有赖于并行分布式计算,而并行计算的技术路线是人工智能领域近十年来得以突破瓶颈和超越以往技术形态的业界共识。
在此共识之下的成果,ChatGPT这类文本应用只是其中之一,这两年还有AI绘画、AI音乐,甚至AI 3D建模的出现,无不意味着有着推理和解决问题能力的强人工智能技术形态初现端倪。
比如2022年8月发布的文本生成图像模型Stable Diffusion,它根据用户给出的文字描述生成相应的图像,也可以用于绘制和修补图像。Stable Diffusion在一个公开的数据集LAION-5B上训练模型,而LAION-5B至少包含了50亿个图像-文本数据对。除此之外,还有Disco Diffusion、Midjourney等AI绘画工具也与之类似。
再比如可以从文本描述中生成高保真音乐的模型MusicLM。例如用户输入“一段吉他即兴演奏搭配平静的小提琴旋律”,MusicLM会将文本描述条件按过程和层次建立序列并建模任务,最终生成可长达几分钟的24kHz音频文件。还有同样出彩的AI 3D建模方面,但因过程复杂目前暂未出现以文字生成样本的产品。
这些强人工智能工具由于训练所用模型依赖海量互联网已有数据,也面临着著作权争议和道德伦理方面的负面影响。由AI侵权引发的版权诉讼案件正在逐年增加,不久前代码自动生成工具Copilot侵权案尚未落定,ChatGPT在教育界又引起论文作弊与学术道德的争议。
● 强人工智能产品市场格局和未来走向
业界在经历疫情萧条期和元宇宙概念虚火之后,这种新形态的强人工智能产品落地确实给了市场一针强心,特别是2023年以来,人工智能概念板块普遍景气扬升。新的AI项目研发落地吸引着科技巨头们纷纷入场布局,由于强人工智能项目研发所需投入的模型训练经费高昂,它们也急需尽快获得大型科技公司的融资和算力资源的支持。比如2017年OpenAI仅在云计算资源上就花费790万美元,占其总支出的四分之一;而AI绘图Stable Diffusion在亚马逊云计算平台上训练共15万个GPU小时,花费成本60万美元。
由于新的AI产品落地时间不长,强人工智能市场仍在初期形成当中,这一波由Copilot、和ChatGPT两种新的AI产品形态带起的风口,在当前市场格局中走在最前面的仍然是微软。微软于2019年7月率先投资OpenAI 10亿美元,为之提供Azure云的计算训练资源,后续取得该技术的独家授权。2023年初微软跟进投资第二笔据报道为100美元资金,随后旋即宣布旗下Bing搜索引入ChatGPT,强调集成了AI的浏览器Edge+搜索Bing的全新产品矩阵,旨在对谷歌互联网业务的弯道超车。
由此可见,当前强人工智能技术初级形态以及其所代表的种种落地产品,与上一代人工智能技术相较确实令该领域的发展耳目一新,但也存在明显需要校正的算法缺陷,以及在涉及训练源的版权、学术道德、网络安全等方面的批评与风险。在优势与挑战并存的同时,未来强人工智能技术走向将更趋明朗,相信更多AI产品将在新的消费级领域涌现。
文/陈徐毅 高级工程师,科技专栏作者,中国计算机学会会员。
本文已刊发于《中关村》第238期