(来源:MIT TR)
最近,当 Chad Syverson 在美国劳工统计局网站上搜索最新的生产力数据时,他带着一种多年来从未有过的乐观情绪。
由于各种金融和商业原因,过去一年左右的数字总体上很强劲,从疫情初期开始反弹。尽管季度数据显得非常“嘈杂和不一致”,但这位芝加哥大学经济学家正在仔细研究这些数据,以发现人工智能驱动的经济增长已经开始的任何早期线索。
他说,对当前统计数据的任何影响可能仍然很小,并且不会“改变世界”,所以他对人工智能影响的迹象尚未被发现并不感到惊讶。但他正在密切关注,希望在未来几年人工智能可以帮助扭转 20 年来生产力增长下滑的局面,这种下滑正在破坏大部分经济。Chad Syverson 说,“如果真的发生了,那么这将改变世界。”
最新的生成式人工智能令人眼花缭乱,拥有栩栩如生的视频、看似专业的内容以及其他过于人性化的行为。随着数十亿资金涌入初创公司,商业领袖们正在为如何重塑公司而烦恼,而大型人工智能企业正在创建更强大的模型。关于 ChatGPT 和越来越多的大型语言模型将如何改变我们工作和生活方式的预测比比皆是,提供从金融投资、到下个假期去哪里度假、以及如何到达那里等等各个方面的即时建议。
但对于像 Chad Syverson 这样的经济学家来说,围绕我们对人工智能的痴迷,最关键的问题是这项新兴技术将如何(或不会)提高整体生产力,如果会,需要多长时间。将其视为人工智能炒作机器的底线:该技术能否在经济增长多年停滞后带来新的繁荣?
生产力增长是一个国家变得更加富裕的途径。从技术上讲,劳动生产率是衡量工人平均生产多少的指标;创新和技术进步占其增长的大部分。随着工人和企业可以生产更多的东西并提供更多的服务,薪资和利润就会上涨,至少在理论层面是这样,并且如果利益能够公平分配的话。经济扩张,政府可以增加投资并更接近平衡预算。对于我们大多数人而言,这感觉就像是进步。这就是为什么直到过去几十年,大多数美国人都认为他们的生活水平和经济机会比他们的父母和祖父母更高。
图|自 2005 年左右以来美国劳动生产率增长一直低迷。一些经济学家预测 AI 可以恢复生产力并使经济回到繁荣时期(来源:MIT TR)
但当生产率增长持平或接近持平时,就不再增长。即使是每年 1% 的经济放缓或加速,也能说明经济是陷入困境还是繁荣发展。20 世纪 90 年代末和 21 世纪初,随着互联网时代的兴起,美国劳动生产率以每年近 3% 的健康速度增长。(在二战后的繁荣时期,增长速度甚至更快,远远超过 3%)。但自 2005 年左右以来,大多数发达经济体的生产率增长一直非常惨淡。
有各种可能的罪魁祸首,但有一个共同的主题:过去 20 年里发明的看似辉煌的技术,从 iPhone 到无处不在的搜索引擎,再到消费社交媒体,吸引了我们的注意力,但却未能带来大规模的经济繁荣。
早在 2016 年,我曾发表了一篇题为《亲爱的硅谷:忘掉飞行汽车,给我们经济增长》的文章。我认为,虽然大型科技公司取得了一个又一个突破,但它们在很大程度上忽视了制造业和材料等关键工业领域迫切需要的创新。在某些方面,这在财务上是完全合理的:当一家成功的社交媒体初创公司可以净赚数十亿美元时,为什么还要投资这些成熟的、有风险的企业呢?
然而,这种选择是以生产率增长缓慢为代价的。虽然硅谷和其他地方的一些人变得非常富有,但至少过去几十年来,一些发达经济体经历的政治混乱和社会动荡可以归咎于技术未能为许多工人和企业增加财务机会,未能在不同地区扩大重要的经济部门。
一些人鼓吹耐心:经济的突破需要时间才能发挥作用,但一旦实现,就要小心了!这可能是真的。但到目前为止,结果是,从硅谷散发出来的技术乐观主义和巨大的财富似乎只与少数人相关。
现在判断这一次情况会如何发展还为时过早。生成式人工智能是否真的是个百年一遇的突破,将刺激经济重回繁荣时期,或者它是否对创造真正的广泛繁荣没有多大作用。换句话说,它会像利用电力和发明电动机一样带来工业繁荣,还是更像智能手机和社交媒体一样消耗我们的集体意识,却没有带来显著的经济增长?
对于人工智能,特别是生成式人工智能来说,要比过去几十年的其他数字进步产生更大的经济影响,我们需要利用这项技术来改变整个经济的生产力,甚至在我们如何产生新想法方面。这是一项艰巨的任务,不可能一蹴而就,但我们正处于一个关键的转折点。我们是否开始走上这条通向广泛繁荣的道路,或者当今突破性人工智能的创造者是否继续忽视这项技术真正改善我们生活的巨大潜力?
对猜测泼冷水
去年的一系列研究表明,生成式人工智能如何提高从事各种工作人群的生产力。斯坦福大学和麻省理工学院的经济学家发现,呼叫中心工作人员在使用人工智能对话协助时的工作效率提高了 14%;值得注意的是,缺乏经验的工作人员的工作效率提高了 35%。另一项研究表明,在人工智能的帮助下,软件工程师的编码速度可以提高一倍。
去年,高盛计算出,生成式人工智能可能会推动发达国家的整体生产率每年提高 1.5 个百分点,并在 10 年内使全球 GDP 增加 7 万亿美元。有人预测,这些影响很快就会显现。
弗吉尼亚大学经济学家 Anton Korinek 表示,生产率数据中尚未显示出额外的增长,因为生成式人工智能在整个经济中扩散还需要一些时间。但他预计明年美国生产率将提高 1% 至 1.5%。他表示,如果生成式人工智能模型继续取得突破(比如 ChatGPT 5),最终的影响可能会“显著提高”。
并非所有人都持乐观态度。麻省理工学院经济学家 Daron Acemoglu 表示,他的计算“纠正了那些认为整个美国经济将在 5 年内发生转变的人”。在他看来,“生成式人工智能可能是一件大事。我们还不知道。但如果是这样,我们在 10 年内不会看到变革性的影响,现在还为时过早,毕竟这需要时间。”
图|麻省理工学院的 Daron Acemoglu 计算得出未来 10 年生成式人工智能带来的生产力增长将十分有限,并且远低于许多人的预测(来源:MIT TR)
今年 4 月,Daron Acemoglu 发表了一篇论文,预测生成式人工智能对全要素生产率(具体反映创新和新技术贡献的部分)的影响将在未来 10 年内达到 0.6% 左右,远低于高盛和其他公司的预期。几十年来,全要素生产率增长一直很缓慢,他认为生成式人工智能在显著扭转这一趋势方面收效甚微,至少在短期内是这样。
Daron Acemoglu 表示,他预计生成式人工智能的生产力提升相对较小,因为其大型科技创造者在很大程度上专注于使用人工智能以自动化取代人,并实现搜索和社交媒体的“在线货币化”。他认为,为了对生产力产生更大的影响,人工智能需要面向更广泛的劳动力群体,并与更多的经济领域相关。至关重要的一点是,它需要被用来创造新型就业机会,而不仅仅是取代工人。
他认为,生成式人工智能可以用来扩展工人的能力。例如,为多种类型的工作提供实时数据和可靠信息。想象一下,一个智能的人工智能体,它精通工厂车间生产的复杂性。然而,他写道,“除非(科技)行业发生根本性的重新定位,包括对最常见的生成式人工智能模型的架构进行重大改变,否则这些收益将仍然难以实现。”
人们很容易认为,也许这只是用适当的数据调整当今大型基础模型的问题,使它们广泛用于各个行业。但事实上,我们需要重新思考这些模型,以及如何在更广泛的用途中更有效地部署它们。
取得进展
以制造业为例。长期以来,它一直是美国经济生产率提高的重要来源之一。它仍然占美国研发的大部分。最近自动化程度的提高和工业机器人的使用可能表明制造业的生产力正在提升,但事实并非如此。由于某种神秘的原因,自 2005 年前后以来,美国制造业的生产率一直像是一场灾难,这在整体生产率放缓中发挥了巨大作用。
生成式人工智能在恢复生产力方面的前景是,它可以帮助整合从初始材料和设计选择,到来自生产设备中嵌入的传感器的实时数据的所有内容。多模态功能可以让工厂工人拍摄问题的照片,并根据图像、公司的操作手册、相关的监管指南以及来自工厂的大量实时数据,向人工智能模型寻求解决方案。
这就是我们的愿景,至少。
现实情况是,在设计和制造中部署当今基础模型的努力还处于早期阶段。麻省理工学院专门研究机器学习的机械工程师 Faez Ahmed 表示,到目前为止,人工智能的使用仅限于“狭窄的领域”,根据特定设备的数据来安排维护。相比之下,从理论上讲,生成式人工智能模型可以广泛用于从利用真实数据改进初始设计,到监控生产过程的步骤,再到分析工厂车间的性能数据等各个方面。
在 3 月份发布的一篇论文中,由麻省理工学院的经济学家和机械工程师(包括 Daron Acemoglu 和 Faez Ahmed)组成的团队确定了生成式人工智能在设计和制造中的大量机会,然后得出结论:“由于几个关键缺陷,当前的(生成式人工智能)解决方案无法实现这些目标。”ChatGPT 和其他人工智能模型的主要缺点是无法提供可靠的信息,缺乏“相关领域知识”,以及“不了解行业标准要求”。这些模型的设计也很糟糕,无法处理制造车间的空间问题以及生产设备(包括旧机器)创建的各种类型的数据。
Faez Ahmed 说,最大的困难是现有的生成式人工智能模型缺乏适当的数据,它们接受的训练是从互联网上抓取的数据。“这些更多的是关于猫、狗以及多媒体内容,而不是如何实际操作车床。这些模型在制造任务上表现相对较差的原因是,它们从未见过制造任务。”他指出。
图|反映创新和新技术的全要素生产率下降令许多经济学家感到困惑(来源:MIT TR)
获取此类数据非常棘手,因为其中大部分数据都是专有的。“有些人真的很害怕模型会拿走我的数据并‘逃跑’。一个相关的问题是,制造需要精确性,并且通常需要遵守严格的行业或政府指导方针,如果系统不精确、不可信,人们就不太可能使用它们。这是一个先有鸡还是先有蛋的问题:因为模型不精确,因为没有数据。”他说。
麻省理工学院的研究人员呼吁开发适合制造业的“下一代”人工智能模型。但存在一个问题:利用基础模型的力量创建与制造相关的人工智能需要行业和人工智能公司之间的密切合作,而这仍处于起步阶段。
微软研究院工业研究董事总经理 Ranveer Chandra 表示,迄今为止缺乏进展。“并不是因为人们不感兴趣,也不是因为他们看不到商业价值。阻碍在于寻找方法来保护数据,确保数据以有用的形式存在,并为特定的制造问题提供相关的答案。”
微软正在推行多种策略。一种是要求基础模型根据公司的专有数据(例如公司的操作手册和生产数据)来给出答案;一个更困难但更有吸引力的替代方案是微调模型的底层架构,以更好地适应制造业。还有另一种方法:所谓的小语言模型,它也可以专门根据公司的数据进行训练。由于它们比 GPT-4 等基础模型更小,因此需要更少的算力,并且可以更有针对性地完成特定的制造任务。
“但这只是目前的所有研究。”Ranveer Chandra 说,“我们解决了吗?还没有。”
新创意的金矿
从长远来看,利用人工智能促进科学发现和创新可能会对整体生产力产生最大的影响。经济学家长期以来一直认为新想法是长期增长的源泉,并希望新的人工智能工具能够加速对它们的搜索。虽然提高呼叫中心工作人员的效率可能意味着该企业生产力的一次跃升,但使用人工智能来改进发明新技术和业务实践的过程(创造有用的新想法)可能会带来持久的效益,经济增长率的提高,因为它重塑了创新过程和研究方式。
人工智能的潜力已经有了诱人的线索。
最值得注意的是,谷歌 DeepMind 将其使命定义为“解决我们这个时代一些最困难的科学和工程挑战”,并表示已有超过 200 万用户访问其深度学习人工智能系统来预测蛋白质折叠。许多药物都针对特定的蛋白质,而了解此类蛋白质的 3D 结构(传统上需要进行艰苦的实验室分析)可能是创造新药的宝贵一步。今年 5 月,谷歌发布了 AlphaFold 3,声称它“预测所有生命分子的结构和相互作用”,以帮助识别各种生物分子如何相互改变,为寻找新药提供更强大的指导。
包括 DeepMind 和微软研究院在内的人工智能模型创建者也在致力于解决生物学、基因组学和材料科学中的其他问题。人们希望生成式人工智能能够帮助科学家从这些领域常见的大量数据集中收集关键信息,从而更容易、更快速地发现新药物和新材料。
我们迫切需要这样的推动。几年前,一个由顶尖经济学家组成的团队写了一篇题为“创意越来越难找到了吗?”的论文,并发现需要越来越多的研究人员和资金来找到对维持技术进步至关重要的新创意。从技术角度来说,问题在于研究生产力正在迅速下降。换句话说,是的,创意越来越难找到。我们通常通过增加更多的研究人员并加大研发投资来跟上步伐,但美国整体研究生产力本身正在大幅下降。
摩尔定律预测,芯片上的晶体管数量大约每两年就会增加一倍,为了遵守该定律,半导体行业需要的研究人员数量是 20 世纪 70 年代初的 18 倍。同样,与几十年前相比,需要更多的科学家才能研制出大致相同数量的新药。
伦敦经济学院教授、该论文的作者之一 John Van Reenen 认为,现在要看到人工智能对生产力数据产生任何真正的变化还为时过早,但他表示,“希望它可以带来一些改变。AlphaFold 是人工智能如何改变科学的‘典范’,问题是这是否可以从轶事变成更系统的东西。”
我们的目标不仅是提供各种工具,让科学家的生活变得更轻松,比如自动文献搜索,而且是让人工智能本身提出原创且有用的科学想法。在这一愿景中,人工智能设计出比现有药物更有效、更安全的新化合物,以及扩展计算和清洁能源可能性的令人惊叹的材料。这个目标尤其引人注目,因为潜在分子的宇宙几乎是无限的,在这样一个几乎无限的空间中导航并探索大量的可能性是机器学习特别擅长的。
但不要屏住呼吸等待人工智能的爱迪生时刻。尽管 AlphaFold 再科学上的普及提高了人们对人工智能潜力的期望,但将研究成果转化为实际产品(无论是新药还是新材料)仍处于早期阶段。在最近的一项分析中,麻省理工学院的一组科学家这样说:“生成式人工智能无疑拓宽并加速了化学设计的早期阶段。然而,现实世界的成功发生在更下游,到目前为止,人工智能的影响有限。”
事实上,将人工智能的科学发现转化为实际有用东西的过程仍处于起步阶段。
这是一个物质世界
也许没有什么比经常被忽视的材料发现领域更令人兴奋的人工智能改变研究的潜力了。世界迫切需要更好的材料。我们需要它们来生产更便宜、更强大的电池和太阳能电池,以及使清洁工业过程成为可能的新型催化剂;我们需要实用的高温超导体来彻底改变我们的电力传输方式。
因此,当 DeepMind 表示它已经利用深度学习发现了约 220 万种无机晶体(其中包括约 38 万种预计是稳定且有希望用于实际合成的候选晶体)时,该报告引起了极大的兴奋,尤其是在人工智能界。材料革命!DeepMind 研究人员在《自然》杂志上写道,这似乎是一座新材料的金矿,“人类已知的稳定材料的数量级扩张。”据报道称,DeepMind 数据库名为 GNoME(“材料探索图网络”的缩写),相当于 800 年的知识积累。
但在论文发表后的几个月里,一些研究人员对这种炒作提出了质疑。加州大学圣塔芭芭拉分校的材料科学家发表了一篇论文,其中报告称,他们发现“很少证据”表明 DeepMind 数据库中的任何结构都满足“新颖性、可信度和实用性的三重要求”。
对于一些负责寻找新材料的人来说,可能的无机晶体的巨大数据库(其中许多可能不够稳定而无法实际存在)似乎是一种干扰。“如果你向我们发送 40 万种新材料,而我们甚至不知道其中哪一种是现实的,那么我们就不知道其中哪一种适合电池、催化剂或你想要制造的任何材料。那么这些信息就没有用了。”普林斯顿大学化学家 Leslie Schoop 说道。他参与撰写了一篇论文,批评了在自主实验室中使用机器人和机器学习来制造由 DeepMind 数据库预测的一些结构的努力。
需要明确的是,这并不意味着人工智能不会在材料科学和化学领域发挥重要作用。甚至批评人士也表示,他们对长期的可能性感到兴奋。但这些批评暗示我们在使用人工智能来解决材料发现的艰巨任务,并使其成为寻找比现有化合物更好的新化合物的可靠工具方面还为时过早。
制造和测试任何可能的新材料都非常昂贵且耗时的过程。工业研究人员真正需要的是可靠的线索,指出这些材料是可预测稳定的、可以合成的,并且可能具有特殊性能,包括制造成本低廉。
DeepMind 科学创建者表示,GNoME 数据库可能包含有趣的化合物。但他们承认,这只是展示人工智能如何帮助材料发现的第一步,要扩大其用途,还有许多工作要做。
谷歌研究科学家、《自然》论文的合著者 Ekin Dogus Cubuk 将其报告的工作描述为,基于量子力学计算预测大量可能在绝对零度下稳定的无机晶体的进步,在绝对零点,原子运动停止。这样的预测对于那些对新材料(材料发现的非常早期阶段)进行计算模拟的人来说可能很有用。
但是,他说,机器学习尚未用于预测在室温下稳定的晶体。实现这一目标后,我们的目标是使用人工智能来预测如何在实验室中合成结构,以及最终如何大规模地制造它们。他说,在机器学习真正改变新材料的漫长而昂贵的开发过程之前,必须完成所有这些工作。
对于那些希望人工智能模型能够通过改变科学来提高经济生产力的人来说,有一个教训是明确的:要有耐心。这样的科学进步总有一天会产生影响。但这需要时间,可能以几十年为单位。
索洛悖论
作为谷歌负责研究、技术和社会的高级副总裁,James Manyika 对人工智能改变经济的巨大潜力充满热情,这并不令人意外。但他不是一个毫不掩饰的“啦啦队长”,他牢记着自己多年来研究技术如何影响生产力所获得的经验教训。
在 2022 年加入谷歌之前,James Manyika 担任了数十年的顾问、研究员,最后担任这家咨询巨头的经济研究部门麦肯锡全球研究所的主席。在麦肯锡,他成为研究技术与经济增长之间联系的权威,他将麻省理工学院经济学家 Robert Solow 视为他的早期导师,他因解释技术进步如何成为生产力增长的主要来源而获得 1987 年诺贝尔奖。
Robert Solow 去年年底去世,享年 99 岁,他的教训之一是,即使是强大的技术也需要时间才能影响经济增长。1987 年,Robert Solow 打趣道:“除了生产力统计数据之外,你随处都可以看到计算机时代。”当时,信息技术正在经历一场革命,最明显的是个人计算机的推出。然而,经济学家衡量的生产力却很低。这被称为“索洛悖论”。直到 20 世纪 90 年代末,也就是计算机时代几十年后,生产力的增长才终于开始加速。
历史告诉 James Manyika,在预测整体经济如何以及何时感受到生成式人工智能的影响时要谨慎。“我没有时间框架。生产率提高的估计值通常非常大,但当谈到时间框架问题时,我会说‘这要看情况。’”他表示。
具体来说,他说这取决于经济学家所说的“扩散速度”。基本上,用户在行业内和跨行业接受技术的速度有多快。它还取决于各种用户,尤其是最大经济部门的企业“重组功能、任务和流程以利用技术”并提高其运营和工人生产力的能力。James Manyika 说,如果没有这些部分,我们将陷入“索洛悖论”。
“技术可以做任何技术想做的事情,从劳动生产率的角度来看,这并不重要,因为其劳动力相对较少。我们必须让最大的行业发生变化,才能开始在经济层面看到生产率的提高。”他说。
去年年底,James Manyika 在《外交事务》上参与合写了一篇题为“即将到来的人工智能经济革命;人工智能能否扭转生产率放缓的局面?”的文章,作者在文中给出了一个非常乐观但谨慎的答案。
他们写道:“到下一个十年之初,向人工智能的转变可能成为全球繁荣的主要推动力。”因为它有可能影响“人类和经济活动的几乎各个方面”。他们补充道:“如果这些创新能够得到利用,人工智能可以扭转许多发达经济体目前面临的生产率增长长期下降的局面。”但他们也承认,这是一个很大的假设,并表示这“不会自行发生”,并且需要“积极的政策来促进人工智能最具生产力的用途”。
图|谷歌的 James Manyika 表示,人工智能对经济的影响可能是巨大的,但这取决于企业用户采用和部署该技术的速度(来源:MIT TR)
政策的呼吁是对未来艰巨任务的认可,也是承认即使像谷歌这样的人工智能巨头也无法独自完成这一任务。这需要政府和企业对基础设施进行广泛投资并进行更多创新。
James Manyika 表示,从小型初创公司到大型企业,各种公司都需要采用基础模型(例如 Google 的 Gemini),并“在自己的环境、自己的领域中针对自己的应用程序进行定制。”他说,在某些情况下,谷歌做了一些定制,“因为这对我们来说很有趣。”
例如,谷歌于 5 月发布了 Med-Gemini,利用其基础模型的多模态功能来帮助完成广泛的医疗任务,包括根据成像、手术视频和电子健康记录中的信息做出诊断决策。James Manyika 说,“现在,医疗保健从业者和研究人员应该思考如何应用这一点,因为我们不是以这种方式从事医疗保健业务的。但是,这给了他们一个良好的开端。”
但如果人工智能要改变经济,这就是未来的巨大挑战。
尽管生成式人工智能大肆宣传,并且数十亿美元流向围绕该技术的初创公司,但其扩散到商业世界的速度并不那么令人鼓舞。美国人口普查局 3 月份发布的对数千家企业的调查显示,使用人工智能的企业比例从 2023 年 9 月的约 3.7% 上升到今年 2 月的 5.4%,预计年底将达到 6.6% 左右,其中大部分来自金融和技术等行业。建筑业和制造业等行业几乎没有受到影响。缺乏兴趣的主要原因是:大多数公司认为人工智能对其业务“不适用”。
对于许多公司,尤其是小公司来说,仍然需要巨大的信心来押注人工智能并投入资金和时间来围绕它重组业务功能。除了看不到该技术的任何价值之外,许多企业领导者还对生成式人工智能模型的可靠性存有疑问,幻觉在聊天室中是一回事,但在生产车间或医院急诊室中则完全是另外一回事。他们还担心数据隐私和专有信息的安全。如果没有更适合各种企业需求的人工智能模型,许多人可能会持观望态度。
与此同时,硅谷和大型科技公司痴迷于人工智能体和生成式人工智能制作的视频;随着智能手机和互联网搜索的飞速发展,个人和企业的财富正在积聚。与 2010 年代初期一样,经济的其他大部分都被排除在外。他们既没有从技术的经济回报中受益,也没有从技术扩大大型部门并提高生产力的能力中受益。
也许指望大型科技公司会发生改变、突然关心利用其巨大的力量造福制造业等行业似乎有些过分了。毕竟,大型科技公司做了它该做的事。
对于人工智能公司来说,重新思考针对此类现实问题的庞大基础模型并不容易。他们需要与来自各个领域的行业专家合作并满足他们的需求。但现实是,大型人工智能公司是唯一拥有运行当今基础模型的强大计算能力和发明下一代技术的人才的组织。
因此,无论你喜欢与否,在主导该领域的同时,他们也承担了其广泛适用性的责任。他们是否会为了我们所有的利益而承担这一责任,或者为了财富积累的诱惑而忽视这一责任,最终将揭晓,也许最初会在美国劳工统计局网站上那些常常几乎无法解读的季度数据中显现出来。
原文链接:
https://www.technologyreview.com/2024/08/20/1096733/how-to-fine-tune-ai-for-prosperity/