翻译: https://www.ben-evans.com/benedictevans/2023/7/2/working-with-ai
几乎科技界的每个人都同意,生成式AI、大型语言模型和 ChatGPT 是我们可以用软件做什么以及我们可以用软件自动化做什么的代际变化。 关于AI的其他方面还没有达成太多共识——事实上,我们仍在研究争论的焦点——但每个人都同意将会出现更多的自动化,以及全新类型的自动化。 自动化意味着就业和人员。
这种情况发生得也非常快:仅仅六个月后,ChatGPT 就拥有了(显然)超过 1 亿的用户,而来自 Productiv 的数据表明它已经是排名前十的“影子 IT”应用程序。 那么,这会夺走多少工作岗位,速度有多快,是否会有新的工作岗位来取代它们?
首先我们应该记住,我们已经实现工作自动化 200 年了。 每当我们经历一波自动化浪潮时,整个类别的工作都会消失,但新类别的工作就会被创造出来。 在这个过程中存在摩擦痛苦和错位,有时新的工作岗位会分配给不同地方的不同人,但随着时间的推移,工作岗位总数不会下降,我们都变得更加繁荣。
当这种情况发生在你们这一代人身上时,人们自然而然地会担心这一次不会再有新的工作岗位。 我们可以看到一些工作岗位正在消失,但我们无法预测新的工作岗位将会是什么,而且通常它们还不存在。 根据经验,我们知道(或应该知道),过去总是有这些新工作,而且它们也是不可预测的:1800 年没有人会预测到 1900 年有一百万美国人会在“铁路”工作 ” 在 1900 年,没有人会预见到“视频后期制作”或“软件工程师”会成为就业类别。 但仅仅因为过去总是这样,就相信这种情况现在会发生似乎还不够。 你怎么知道这次会发生呢? 这有什么不同吗?
在这一点上,任何一年级经济学学生都会告诉我们,除其他外,“劳动块”谬误可以回答这个问题。
劳动总量谬误是一种误解,认为需要完成的工作量是固定的,如果某些工作由机器承担,那么人们的工作就会减少。 但是,如果使用机器制造一双鞋变得更便宜,那么鞋子就会更便宜,更多的人可以购买鞋子,他们就有更多的钱可以花在其他东西上,我们会发现我们需要的新东西或 想要和新的工作。 有效收益并不局限于鞋子:一般来说,它会通过经济向外扩散,创造新的繁荣和新的就业机会。 所以,我们不知道新的工作岗位是什么,但我们有一个模型,它不仅说明总是有新的工作岗位,而且说明为什么这是这个过程中固有的。 不用担心AI!
我认为,今天这个模型面临的最根本的挑战是说不,过去 200 年的自动化真正发生的事情是我们一直在提高人类能力的规模。
我们从人类作为负重的野兽开始,然后向上发展:我们自动化了腿,然后是手臂,然后是手指,现在是大脑。 我们从农场工作到蓝领工作再到白领工作,现在我们将白领工作也自动化,就什么都没有了。 工厂被呼叫中心取代,但如果我们将呼叫中心自动化,那还有什么?
在这里,我认为了解另一段经济和科技史是有用的:杰文斯悖论。
19世纪的英国海军依靠煤炭运行。 英国拥有大量煤炭(它是蒸汽时代的沙特阿拉伯),但人们担心煤炭耗尽后会发生什么。 啊,工程师们说:别担心,因为蒸汽机的效率越来越高,所以我们会使用更少的煤炭。 不,杰文斯说:如果我们使蒸汽机更高效,那么它们的运行成本就会更低,我们将使用更多的蒸汽机并将它们用于新的和不同的事物,因此我们将使用更多的煤炭。 创新可以与价格弹性联系起来。
150 年来,我们一直将杰文斯悖论应用于白领工作。
很难想象未来的工作尚不存在,但也很难想象过去的一些工作已经被自动化取代。 1830 年代圣彼得堡果戈里的受压迫职员一生都在用手抄写文件,一次一份。 它们是人类复印机。 到了 1880 年代,打字机以每分钟两倍字数的速度打印出清晰易读的文本,而复写机也提供了六份免费副本。 打字机意味着一名职员的输出量可以提高 10 倍以上。 几十年后,像 Burroughs 这样的公司的加法机在簿记和会计方面也做了同样的事情:机器不再用笔来加列,而是在 20% 的时间内为您完成,而且不会出错。
这对文员就业有何影响? 人们雇佣了更多的职员。 自动化加上杰文斯悖论意味着更多的就业机会。
如果一名拥有一台机器的职员可以完成 10 名职员的工作,那么您的职员可能会减少,但您也可能会用他们做更多的事情。 杰文斯告诉我们,如果做某事变得更便宜、更高效,你可能会做更多的事情——你可能会做更多的分析或管理更多的库存。 您可能会建立一个不同的、更高效的业务,这之所以可能,是因为您可以使用打字机和加法机实现其管理自动化。
这个过程不断重复。 这是 1960 年《公寓》中杰克·莱蒙 (Jack Lemmon) 饰演的 CC Baxter,他使用的是 Friden 的机电加法机,五十年后,加法机才刚刚出现,令人兴奋。
该镜头中的每个人都是电子表格中的一个单元格,整个建筑物也是一个电子表格。 每周一次,顶层有人按 F9,他们会重新计算。 但他们已经有了计算机,并在 1965 年或 1970 年购买了一台大型机,并废弃了所有加法机。 白领就业崩溃了吗? 或者,正如 IBM 所宣传的那样,计算机是否可以为您带来 150 名额外的工程师? 25 年后,PC 革命和盒子里的会计部门对会计产生了什么影响?
Dan Bricklin 于 1979 年发明了计算机电子表格:在那之前,“电子表格”都是纸质的(您仍然可以在亚马逊上购买)。 他有一些关于早期使用的有趣故事:“人们会告诉我,‘我正在做所有这些工作,同事们认为我很棒。 但我真的很偷懒,因为只花了一个小时,然后我就休息了一天剩下的时间。 人们认为我是神童,但我正在使用这个工具。”
那么,Excel和PC对会计就业有何影响呢? 它上涨了。
40 年后,电子表格是否意味着您可以早点休息? 并不真地。
新技术通常会让做某事变得更便宜、更容易,但这可能意味着你用更少的人做同样的事情,或者你可能用同样的人做更多的事情。 它还往往意味着你改变你所做的事情。 首先,我们让新工具适应旧的工作方式,但随着时间的推移,我们改变工作方式以适应该工具。 当 CC Baxter 的公司购买大型机时,他们首先将现有的工作方式自动化,但随着时间的推移,新的业务运营方式成为可能。
因此,所有这一切都表明,默认情况下,我们应该期望AI能够像 SAP、Excel、大型机或打字机一样摧毁、取代、创造、加速和增加就业机会。 这只是更多的自动化。 机器可以让一个人完成十倍的工作,但你需要人。
我认为对此有两个反驳。
首先是说,是的,也许这确实与我们在互联网、个人电脑或电脑上看到的变化更为相似,也许它不会对净就业产生长期影响,但这一次 发生的速度会更快,因此摩擦疼痛会更大,调整起来也会更困难。
AI和 ChatGPT 的发展速度肯定比 iPhone、互联网,甚至个人电脑要快得多。 Apple II 于 1977 年上市,IBM PC 于 1981 年上市,Mac 于 1984 年上市,但直到 20 世纪 90 年代初,PC 的使用量才达到 1 亿台:仅仅六个月后,今天的 ChatGPT 用户就达到了 1 亿。 你不需要等待电信公司建立宽带网络,或者消费者购买新设备,生成式AI位于整个现有的云堆栈、分布式计算以及实际上构建的许多机器学习堆栈之上 在过去十年中。 对于用户来说,它只是一个网站。
然而,如果您再次考虑这些来自 Productiv 和 Okta(使用不同方法)的图表的含义,您的期望可能会有所不同。 他们报告说,他们的典型客户现在拥有数百种不同的软件应用程序,而企业客户则拥有近 500 种。
然而,企业云采用率仍仅占工作流程的四分之一。
这对于工作场所的生成式AI意味着什么? 无论你认为会发生什么,都需要几年而不是几周的时间。
人们用来完成工作的工具以及现在可能获得新的自动化层的任务非常复杂且非常专业,并且体现了大量的工作和机构知识。 很多人正在尝试 ChatGPT,看看它能做什么。 如果你正在读这篇文章,你可能也有。 这并不意味着 ChatGPT 已经取代了他们现有的工作流程,并且替换或自动化任何这些工具和任务并不是小事。
变革性技术的令人惊叹的演示与持有他人业务的大型复杂公司可以使用的东西之间存在巨大差异。 您很少可以去律师事务所并向他们出售 GCP 翻译或情绪分析的 API 密钥:您需要将其包装在控制、安全、版本控制、管理、客户权限以及只有合法软件公司知道的一大堆其他内容中 关于(在过去的十年里,有很多机器学习公司都认识到了这一点)。 公司通常买不到“技术”。 Everlaw 不卖翻译,People.ai 也不卖情感分析——他们卖工具和产品,而AI通常只是其中的一部分。 我不认为文本提示、“开始”按钮和黑盒、通用文本生成引擎构成了一个产品,而产品需要时间
与此同时,购买管理大型复杂事物的工具也需要时间,即使该工具已经构建并适合产品市场。 建立企业软件初创公司最基本的挑战之一是初创公司的融资周期为 18 个月,而许多企业的决策周期为 18 个月。 SaaS本身加速了这一点,因为你不需要进入企业数据中心部署计划,但你仍然需要购买、集成和培训,而拥有数百万客户和数万或数十万员工的公司有充分的理由不改变 事情突然发生。 未来需要一段时间,硅谷以外的世界很复杂。
第二个反驳是,ChatGPT 和 AI范式转变的一部分是抽象层的转变:这看起来像是一种更通用的技术。 确实,这就是它令人兴奋的原因。 我们被告知,它可以回答任何问题。 因此,您可以查看包含 473 个企业 SaaS 应用程序的图表,并说 ChatGPT 将颠覆这一现状,并将许多垂直应用程序折叠到一个提示框中。 这意味着它会移动得更快,并且自动化程度更高。
我认为这误解了问题。 如果律师事务所的合伙人想要论文的初稿,他们希望能够以与保险公司销售人员完全不同的方式来制定参数,以挑战索赔,可能使用不同的训练集,当然还有一堆 不同的工具。 Excel 也是“通用”,SQL 也是,但是有多少种不同的“数据库”呢? 这是我认为AI的未来将从提示框转向 GUI 和按钮的原因之一——我认为“提示工程”和“自然语言”是相互矛盾的。 但无论哪种方式,即使您可以在一个巨大的基础模型之上将所有内容作为薄包装器运行(并且对此还没有达成一致或明确),即使是这些包装器也需要时间。
事实上,虽然有人可能会建议AI将在一个轴上纳入许多应用程序,但我认为随着初创公司从 Word、Salesforce 和 SAP 中剥离出更多用例,它们同样有可能在其他轴上掀起一波全新的分拆浪潮。 并通过解决在AI让你解决之前没有人意识到的问题来建立一大堆更大的公司。 毕竟,这个过程解释了为什么大公司如今已经拥有 400 个 SaaS 应用程序。
当然,更根本的是错误率。 ChatGPT 可以尝试回答“任何问题”,但答案可能是错误的。 人们称之为幻觉、编造事实、撒谎或胡说八道——这就是“大学生过度自信”问题。 我认为这些都是无益的框架:我认为理解这一点的最好方法是,当您在提示中输入某些内容时,您实际上根本没有要求它回答问题。 相反,你问它“人们可能会对这样的问题给出什么样的答案?” 你要求它匹配一个模式。
因此,如果我让 ChatGPT4 写一篇我自己的传记,然后再问它,它会给出不同的答案。 这表明我去了剑桥、牛津或伦敦经济学院; 我的第一份工作是股票研究、咨询或财经新闻。 这些总是正确的模式:这是正确类型的大学和正确类型的工作(它从来没有说麻省理工学院然后是餐饮管理)。
它提供 100% 正确率