2023释放AI的潜能研究报告英文版（附下载）

作者：充电研究社发布时间：2023-09-20

今天分享的是人工智能系列深度研究报告：《 2023释放AI的潜能研究报告英文版》。（报告出品方： Citi）

执行摘要

在2022年ChatGPT发布之后，生成式人工智能突然出现在舞台上。作为一个概念，人工智能（AI）并不是一个新的概念，而生成式AI代表了AI进化的最新拐点。创成式人工智能的独特之处在于它拥有巨大的潜力，可以改变各行各业的工作方式，提高整体生产力。从更全面的角度来看，生成式人工智能不仅可以将人工智能本身的力量带给大众，而且事实上可以加速创新的更广泛的民主化。我们相信这是一个游戏规则改变者。

虽然这份报告看起来像是创成式人工智能突然冒出来的，但它着眼于人工智能从20世纪50年代开始的崛起，以及过去十年的显著增长。然后，我们探讨了生成式人工智能带来的潜在机遇和挑战。关键的挑战包括那些围绕偏见、不平等、真实性、侵权的挑战，以及由存在主义关注支撑的更有争议的挑战。生成式人工智能的出现毫不奇怪地将人工智能视为一个更广泛的话题，成为世界各地政策制定者的坚定焦点。然而，迄今采取的监管路径各不相同。考虑到所涉及的利害关系，我们相信政策和治理的演变将发挥决定性作用。

生成式人工智能的第一波潜在机遇集中在技术价值堆栈上，如图5所示。从历史上看，硅层实际上是技术价值栈中几乎所有技术转变的基础，而产生性人工智能预计将推动计算(即处理能力)、网络和内存芯片的显著增长。然而，当我们审视整个技术价值堆栈时，我们在每一层都看到了机会。在基础设施和平台层，我们看到了超大规模的/云提供商如今竞相构建支持生成式人工智能应用程序和服务的底层基础设施，但随着时间的推移，我们预计会看到更高或更大的差异化。当涉及到模型和机器学习操作（MLOps）时，开源社区很可能是创新的关键驱动力。再往上走，我们相信几乎所有的软件公司都会受到创成式人工智能的某种形式的影响，而公司特定的执行将是至关重要的。最后，我们相信生成式人工智能代表了服务层正在进行的人工智能/自动化计划的一个进步。

机会并不局限于技术价值栈——它们也在蔓延到技术以外的行业。为了全面了解情况，我们扩展了分析范围，考察了Generative对六大超级行业的影响（图6）。我们通过一个两阶段框架来评估风险/回报，并将其广泛应用于各个公司和行业。我们的分析发现，金融和金融科技超级行业最有可能受到整体影响，其次是消费行业。在光谱的另一端，目前阶段的自然资源和气候技术似乎是最不可能受到影响的。

创成式人工智能的未来是什么样的？研究全球趋势和增长的一个方法是从技术创新投资的角度来看。我们通过分析不同时期和不同国家的人工智能相关专利申请数量来做到这一点。研究论文也很能说明问题，从2003年到2021年，人工智能研究总累计产出增长了1300%。鉴于人工智能作为一项基础技术的重要性，各国之间正在进行科学和技术主导权的竞赛。完整版《 2023释放AI的潜能研究报告英文版》来源于公众号：百家全行业报告研究报告内容节选如下

人工智能与我们的新文艺复兴

人工智能越来越有可能成为一种广泛应用的通用技术形式，这可能会创造一个具有广泛社会、政治和经济影响的破坏性时代。生成型人工智能可能成为像印刷机一样的革命性技术，让世界各地的人们都能提高写作能力和创造力，更广泛、更廉价地分享知识和思想。印刷机的发展和思想的指数传播导致了文艺复兴，文艺复兴从根本上重塑了科学、艺术和宗教观点，促进了一个重塑世界经济的发现时代，并对各大洲产生了深远的影响，至今仍在回响。互联网和万维网的发展意味着全球数十亿人分享思想。这种全球性的授粉使个人天才无论在哪里都能被发现，并使建立在不同见解基础上的合作蓬勃发展。生成式人工智能提供了将创造力、科学和集体智慧提升到更高水平的潜力。

大型语言模型和同声传译意味着讲不同语言的人之间的障碍将被降低。这将增加获得和个性化服务的机会，从而大大改善教育和保健成果。”虽然95%的科学研究是用英语发表的，但世界上只有不到5%的人口以英语为母语。利用世界各地人们的集体智慧，不仅意味着有更多的大脑参与解决问题和创新，而且因为他们更加多样化颠覆性突破的潜力要大得多。

我们的新文艺复兴为解决人类面临的一些最大挑战提供了一个非凡的机会。人工智能不断增长的潜力意味着更有可能找到治疗癌症、老年痴呆症和其他可怕疾病的新方法，以及生产低成本清洁能源和开发能够抵御气候变化的作物的方法

500年后的今天，我们仍在颂扬文艺复兴的杰出成就。但对许多人来说，它以宗教战争、奴隶制和帝国权力的野蛮崛起而告终。在欧洲，它与原教旨主义的兴起有关，对现状的挑战导致虚荣心的篝火，燃烧，以及禁止书籍和调查。当时和现在一样，财富的日益集中和新技术的潜力为一些人创造了巨大的财富，而另一些人却失业了，这是日益紧张和愤怒的根源。那时和现在一样，失业者（15世纪的抄写员和今天的媒体人）比新创造的工作（15世纪的装订工和印刷工以及今天的程序员和知识工作者）更常被听到。当时和现在一样，随着知识经济的加速发展，地点和动态城市变得更加重要，导致对都市精英的不满日益增长。当时和现在一样，连通性和全球化导致了疾病和流行病的传播，包括导致数百万美洲原住民死亡的疾病。当时和现在一样，利用技术创造虚假叙事和传播假新闻的权力成为分裂社会和不信任专家的工具。

但文艺复兴告诉我们，这一切都不是理所当然的，因为新技术的运作需要社会许可。我们新文艺复兴的挑战是确保人工智能为所有人服务。

人工智能的兴起

机器会思考吗？70多年前，Alan Turing在他的开创性论文《计算机器与智能》中提出了这个问题。为了回答这个问题，他提出了一个著名的思考机器游戏，即图灵测试或模仿游戏，即审讯者向人类和计算机提出同样的问题，并试图找出哪一个是人类。

人工智能一直在增长，但在过去的十年中更显着。大型语言模型（LLM）的最新进展让世界感到惊讶和敬畏。令人印象深刻的是，自从图灵提出这个问题以来，与这一进步相关的社会挑战并没有发生重大变化。

1950年，贝尔实验室的计算机科学先驱克劳德·香农推出了第一个人工智能应用程序，一只名叫忒修斯的滚轮鼠标，有条不紊地在25平方米的迷宫中探索周围环境，并找到了路。出局1香农想让他的“老鼠”在迷宫中穿行，并通过学习迷宫的结构来逃离迷宫，就像希腊神话中用来标记英雄道路的线一样。鼠标本身是一个轮子上的磁铁，但在迷宫下面，一个复杂的开关和继电器网络允许它移动，并通过试验和错误来学习。受Shannon的启发，Micromouse大赛在技术进步的基础上从20世纪70年代开始举办

几年后，在1958年，来自康奈尔航空实验室的弗兰克·罗森布拉特（Frank Rosenblatt）制造了第一台图像分类计算机——感知器Mark I。这台计算机的目标是识别物体，即使图像是在不同的方向、大小、颜色和背景下拍摄的

在这个发明之后，Rosenblatt在人工智能领域引发了争议，他公开支持感知器，这是算法用于分类对象在他的电脑，将成为“胚胎的电子计算机”，“将能够走路，说话，看，写，复制自己，并意识到它的存在。“4 尽管遭到批评，罗森布拉特还是在1961年引入了“反向传播误差校正”这一术语，这是现代神经网络的一个关键理论基础，尽管他不知道如何在他的计算机中实现这一点

计算机技术和建模能力的承诺促使其他著名的研究人员效仿罗森布拉特的预测。1958年，政治学家赫伯特·西蒙(Herbert Simon)和计算机科学家艾伦·纽韦尔(Allen Newell)预测，“十年内，数字计算机将成为世界象棋冠军”，“十年内，一台数字计算机将发现并证明一个重要的新数学定理”。1965年不久，西蒙更进一步，支持“机器将在二十年内完成一个人所能做的任何工作。”5 1967年，著名的人工智能学者马文·明斯基预测，“在一代人之内。。。创造“人工智能”的问题将基本上得到解决。”6 随后，他在1970年的一次采访中表示：“三到八年后，我们将拥有一台具有人类平均智力的机器。”

在20世纪60年代末和70年代，人工智能领域经历了一系列挫折，这使得研究人员引入了术语“人工智能冬天”。1960年代的大部分工作都是围绕着军事和情报机构展开的，这些机构在冷战期间需要提高速度和决策的准确性。其中一项工作涉及将俄文文件自动翻译成英文。尽管最初对机器翻译持乐观态度，但在1966年，自动语言处理咨询委员会（ALPAC）得出结论，机器翻译速度更慢，比人类更昂贵和更不准确。8一些理论和实践问题导致该领域放弃了“联结主义”，它与神经网络和感知器有关，而在20世纪60年代后期支持符号推理。这种挫折在上世纪70年代仍在继续，英国议会的莱特希尔报告（Lighthill report）得出结论，人工智能未能实现其“宏伟目标”。在美国，转向以任务为导向的直接研究，而不是基础的非定向研究，导致了研究人员的进一步削减和失望

在20世纪80年代和90年代，该领域逐渐发展，产生了涵盖多种应用的新模型，其中包括用于手写和模式识别的新认知龙。（1980年），文本到音频转换的NetTalk（1987年），通过相机和激光的自主车辆导航的ALVINN（1988年）和作为神经网络研究的基础性突破的长短时间记忆（LSTM）（1991年）。尽管该领域在此期间经历了一个稳定的进展，但使用人工智能技术的大型生产系统很少明确提到它。牛津大学哲学教授尼克·博斯特罗姆（Nick Bostrom）在2006年表示：“许多尖端的人工智能已经渗透到一般应用中，往往不被称为人工智能，因为一旦某些东西变得足够有用和足够普遍，它就不再被称为人工智能了。由于这一进步，支持人工智能系统的计算资源保持了稳定的增长速度——从1952年到2010年，每21个月翻一番，并使该领域的进步与著名的摩尔定律保持一致，该定律以类似的速度测量半导体芯片中的晶体管密度（图8）。

通过分析用于训练来自时代人工智能的123个里程碑机器学习系统的计算资源的信息和研究人员进行的分析，我们发现计算资源的急剧不连续性出现在2010.9左右，2010年后使用的计算速度每六个月增加一倍(浮点运算每秒)，与前一时期18个月的翻倍相比增加了三倍。这一变化背后的原因很大程度上归因于自2010年以来向深度学习模型的过渡。这些模型通过其特征的分层组合，在其输入和输出之间构建复杂的非线性关系。与具有较浅架构的模型相比，结合较低层的特性带来了显著的性能改进。

深度学习革命的基础是连接主义模型（在20世纪60年代被抛弃）和一些同时引入的关键概念的成功实施，包括反向传播。核心投入的结合——包括人类的创造力、计算机、算法、数据数量和质量——导致了该领域的急剧转变。自2000年代后期以来，深度学习模型在多个机器学习竞赛中的表现都优于"浅层"模型。早在2011年，DanNet就已经是第一个在视觉模式识别方面实现超人表现的模型，其表现超过传统方法三倍。2012年，AlexNet在大规模ImageNet竞赛中以显著优势获胜。

2010年后的模型在性能上的大幅提升，导致企业在人工智能应用上投入巨资。这推动了一些最早的努力，使用人工智能，并在封闭世界的情况下（如围棋游戏）达到超人的结果。用于一些最先进的AlphaGo模型（Zero和Master）的训练计算资源直到五年后才与大型LLM匹配（如图9所示）。在此期间，一些重要的发现发生了。在2017年之前，自然语言处理（NLP）领域在其“人类水平”表现指标（图像和手写识别，图10）方面落后于计算机视觉。年6月，来自谷歌的研究人员发表了一篇突破性的论文，题目是“注意就是你所需要的一切，”这在使用注意力机制作为Transformer模型的主要改进方面引入了一个重要的进步。有了这个，用于翻译或预测下一个单词的长文本序列，将不依赖于编码器的最后一个状态，因为它通常是用RNNs（循环神经网络）完成的。而是从整个序列中提取信息。

包括BERT和GPT-2在内的几个重要的NLP模型使用了这些进步，使得阅读理解能力和语言理解能力迅速提高。（如图10所示）。Transformer模型也被用于其他应用，包括预测蛋白质折叠、文本到图像的模型（用于与内容交付网络（CDN）和扩散模型相结合的潜在扩散模型），并有可能成为支持大多数人工智能应用的通用机制。

随着基础模型的这些改进，人工智能公司增加了计算资源以提高其性能（图10），在大规模时代出现了一套新的模型，使用的资源是深度学习时代模型训练所用资源的100多倍。应用的广度是巨大的，包括超过围棋大师的模型，蛋白质折叠预测和大型语言模型。支撑这些模型的算法为术语生成式人工智能铺平了道路，允许出现大量的可能性。

生成式人工智能的前景

人工智能的最新发展已经吸引了许多公司的浓厚兴趣，这些公司旨在将内容生成和决策整合到他们的流程中。在2022年的人工智能报告中，IBM测量了已经部署和计划在未来一年使用人工智能的公司的比例。中国和印度在这些指标上处于领先地位，分别有58%和57%的企业已经部署了人工智能，紧随其后的是意大利和新加坡。10总体而言，报告发现绝大多数（>70%）的企业预计在未来几年使用人工智能（图11）。

纵观人工智能领先企业的市场表现，可以观察到，标准普尔500指数在2023年上半年的增长主要来自于生产人工智能技术核心组件的企业。在2023年上半年，标准普尔500指数的大部分回报来自于七只最大的股票，这是由对人工智能的乐观情绪驱动的。

除了通常的嫌疑人，如大型科技公司，提供必要的计算基础设施的设备供应商在这一时期表现优异，因为每个打算部署人工智能的公司都需要使用这些资源。人工智能市场分析师预计，人工智能市场将继续增长，因为应用的广度可能会刺激对更多、更快的图形处理单元（GPU）的需求。这些组件不仅用于推理目的（回答关于现有模型的问题），还用于模型的开发阶段（训练），并且这种需求与员工人数呈线性关系。因此，没有迹象表明我们在2023年遇到的GPU短缺将在不久的将来缓解

人工智能生产力的提升

人工智能能否解决一个紧迫的经济悖论？诺贝尔经济学奖得主保罗·克鲁格曼（Paul Krugman）有句名言：“生产率不是一切，但从长远来看，它几乎是一切”，这句话是每一项创新的核心。尽管人工智能非常重要，而且最近发生了令人印象深刻的技术变革，但几十年来发达经济体的生产率增长一直在放缓。12行业领袖和学者经常将人工智能技术的潜力视为结束这种下降趋势的一种方式，这并不奇怪。虽然仍然没有确定的答案，但几位研究人员认为，基于他们研究的初步结果，这一新的大型语言模型浪潮是非常有前途的。

在最近的一篇论文中，麻省理工学院的研究人员调查了ChatGPT在中级专业写作任务中的效果。他们发现，那些使用创成人工智能技术的人，完成时间减少了0.8标准差，产出质量提高了0.4标准差。工人之间的不平等也在减少，因为chatgpt使低能力工人受益更多，从而压缩了整个样本的生产力分布。作者指出，ChatGPT主要是代替工人的努力，而不是补充工人的技能，并将任务重组为思想的产生和编辑，而不是粗略的起草。除了硬数据之外，研究人员还发现，接触chatgpt可以提高工作满意度和自我效能，但也增加了对自动化技术的关注(图12)。

Erik Brynjolfsson在2023年发布的一篇论文研究了另一种类型的办公室工作人员，探讨了将生成式人工智能添加到客户支持代理的生产力结果。14本研究中使用的人工智能系统是基于一个GPT家族语言模型，该模型经过精细的调整，以关注客户服务交互。作者发现，通过每小时解决的问题数量来衡量，使用该工具的员工成功地将工作效率提高了14%。关于人工智能的分布影响的结果似乎与受过大学教育的专业人士的结果一致，因为该研究还发现，对生产力影响最大的是新手和低技能工人，对有经验和高技能工人的影响最小。作者发现，人工智能模型传播了更有能力的员工的潜在隐性知识，并帮助新员工降低了经验曲线。此外，他们还表明，人工智能辅助改善了客户情绪，减少了管理干预请求，并提高了员工保留率。

执行问题

虽然提高效率很重要，但大多数企业都是在传统基础架构上运行，需要多年的过渡，以整合下一代工具。许多企业希望将这些新工具与他们的数据集成在内部或域模型中，但这需要时间。人们还急于使用领先的人工智能提供商提供的高端计算、数据中心容量和时间。当然，所有这些都需要更多的资源，这往往涉及零和投资决策（即从其他领域拿走投资资金），这从来都不是一件容易的事。例如，微软最近宣布的Copilot人工智能产品的定价高于预期，虽然这可能突出了它提供的价值，但企业将不得不寻找资源来广泛部署产品。

随着公司不断试验、学习和迭代，变化通常是渐进的。企业开发流程和人员利用机会都需要时间。在人工智能的例子中，一些人可能害怕实施他们不信任或不理解的技术，更不用说可能取代他们角色的技术了。除了公司对负责任的人工智能的保护之外，许多行业都受到高度监管，人工智能工具需要有足够的风险管理、透明度或可解释性，以及及时的可审计性。例如，虽然在理论上，人工智能在医学上提供了重大的机会，但需要解释预后。因此，可能需要在回路中的人，如飞机自动驾驶仪或事实检查器所发生的那样，这反过来又会减慢执行速度。

生成AI接受与信任

ChatGPT已经成为历史上增长最快的消费者应用之一，这一事实说明消费者已经热情地接受了生成性人工智能。我们还认为，他们对基于人工智能的生成性互动有很高的信任度，并得到了多项研究的支持。Capgemini的一项这样的研究--基于对来自多个国家的8600名受访者的调查--表明73%的受访者相信生成型人工智能所写的内容。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）

本报告总计：57页。

受篇幅限制，仅列举部分内容！

报告来源公众号：【百家全行业报告】