神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:就技术而言,ChatGPT并不算什么突破,其所使用的技术并不新鲜。让它成为有史以来增长最快的互联网产品的原因在于聊天界面。革命不一定源自技术突破,有时候也源自认知的转变。文章来自编译。
ChatGPT 的成功甚至让其创造者们都感到惊讶。这项技术本身并不新——只是呈现方式变了。在自己撰写的最新文章里,Rhea Purohit 探讨了心理因素,而非技术能力,才是驱动革命性技术被广泛采用的关键。她将 ChatGPT 的迅速崛起与 Macintosh 原先在普及个人计算中的角色进行了对比,揭示了理解人类心理学可能是释放 AI 真正潜能的关键。
——Kate Lee
大约两年前的 2022 年 11 月 20 日是ChatGPT 发布的日子。
发布之后这款应用迅速走红。
全世界感到兴奋、恐惧,甚至还有点怀疑。
但在最初的几个月里,OpenAI 的高管们却……有些困惑。
为什么?
从纯粹的技术角度看,ChatGPT 并不算前沿技术的巨大进步。事实上,它并不新鲜。OpenAI 的 GPT 模型自 2018 年就已问世,最初的 ChatGPT 是 GPT-3.5 的微调版本,其大部分技术在发布前早已通过 API 提供。然而,即便如此,ChatGPT 成为了互联网增长最快的应用之一,发布两个月后估计月活跃用户达到了 1 亿。
OpenAI 的高管们对此感到困惑。
当时负责 OpenAI 对齐团队的 Jan Leike 在发布后一次接受采访时说道,“我非常希望更好地理解是什么驱动了这一切——是什么驱动了这种病毒式传播……因为从根本上来说模型跟之前相比强大不到哪里去。”
后来Leike 自己回答了自己的问题:“我们让它更符合人类的使用需求。它以对话的方式与你交谈,通过聊天界面便捷访问,它试图提供帮助。这是巨大的进步,我认为人们意识到了这一点。”
ChatGPT 之所以走红,是因为它用大家熟悉的界面——聊天——来包装 AI 日益壮大的潜力。它并没有创造新的能力,而是以不同的方式呈现了已有功能。ChatGPT 重新定义了我们与 AI 的关系——推动变革的是我们对大语言模型思维方式的转变,而不是技术本身的原始力量。
推动 AI 进步的技术障碍固然有关系,但阻碍我们采用这些技术的心理障碍同样重要。如果出于深层次的人类原因,普通个人决定不使用它们的话,即便是最先进的模型也可能无法兑现 AI 的承诺。下面我们就更深入地审视一下,我们在心理上是如何接受作为一种文化的新技术的,以及看看它将如何影响我们开发和使用 AI 的方式,进而如何影响我们的工作与生活的。
革命有时候就源自认知的转变。这并不是什么新概念——十二年前,奥美集团的广告大师 Rory Sutherland 就表达过类似的观点:“下一次革命可能根本不是技术革命,而是心理革命——对人们的价值观、行为方式和选择有了更好理解,可能会带来与发明悬浮车或某种新型电子产品同等的经济价值。”他说道。
悬浮车还未出现,但如果你停下来想一想我们每天使用的设备,你会注意到其中很多都是因为我们的思维方式发生了转变,而不是技术变了。
就拿你是怎么看这篇文章来说吧。
无不管你是在手机上、笔记本电脑、收件箱还是到特定网站浏览这篇文章,你大概都是通过图形用户界面(GUI)与计算机互动的。
GUI 是通过直观的视觉元素(如按钮、图标和菜单)与计算机互动的一种手段。在 GUI 出现之前,使用 PC 意味着需要在黑色屏幕上键入一长串绿色的字母数字字符。GUI 与鼠标配合的点击视觉元素功能一起推动了个人计算机革命。而被认为普及了这种技术的计算机正是 Macintosh 的原型机,于 1984 年发布。
但第一种使用 GUI 的计算机并不是Macintosh。甚至连第二或第三名都不是(第二名是1981年的Xerox Star ,苹果1983年推出的Lisa 是第三名,它们都有 GUI 和点击设备)。Macintosh 之所以在历史上能占有一席之地,并不是因为技术规格窗户色——这款设备的特别之处在于它普及了对用户“友好”的计算机这个理念。这个理念甚至体现在 Macintosh 的设计上,让它看起来像一个对称的“人脸”。
磁盘驱动器被移到了右下方,让机器看起来像一张人脸。呃,一张奇怪的长脸。
Macintosh 并未给苹果带来显著收入。它跑得慢,不兼容多个应用,内存小得可笑。可是,它引领了个人计算机革命,因为它成功地兜售了“人人都可以——而且更重要的是,其实人人都想用计算机”的理念。在 Macintosh 出现之前,计算机大多被限制在后台,仅供少数懂得如何使用的人使用。Macintosh 将它们带进了客厅,让计算机——这种复杂且令人生畏的机器——变得更易于接近。它彻底改变了人们对既有技术的看法。这就是为什么我会认为下一次 AI 的重大突破与算法、数据或算力无关——而是与你有关。确切地说,与你的思维方式有关。
每次发布新版大语言模型时,我的 X 动态消息流上都会充斥着大量测量该模型技术能力变化的帖子。网上关于更强大模型将如何影响人类存亡的预测比比皆是。我们陷入了光靠技术进步来衡量进步的陷阱,感觉我们总是在焦急地等待着下一个突破。
AI 模型是有可能随着时间的推移而变得更好。不过,就像 ChatGPT 与 Macintosh 这些例子一样,从创新到产生影响之路并不平坦。我们的思维方式对于决定我们要不要使用一款产品起着重要作用。
我很好奇,究竟有哪些心理因素影响了新技术的采用。经过在 Perplexity 上进行一番研究,我找到了答案,也就是所谓的技术接受与使用统一理论(UTAUT)。顾名思义,UTAUT 整合了关于人类如何将新技术融入工作和生活的研究成果。该理论是 2003 年首次由包括弗吉尼亚理工大学的商业教授 Viswanath Venkatesh 博士在内的研究团队提出的。Venkatesh 博士研究了技术在各种环境下的实施。该团队最初研究的是员工如何采用办公技术,包括一种专有的会计软件和一个减少面对面会议需求的在线视频会议平台。Venkatesh 博士后来进行了一个实验,将 UTAUT 理论扩展到消费者购买新技术的情况。2021 年,他基于相同的原则总结出一个用于研究 AI 采用的框架。多年来,UTAUT 已成为理解不同背景下技术采用的重要框架。
UTAUT 基于四个主要变量来解释人类如何看待新技术的采用:表现预期、努力预期、社会影响和支持条件。每个变量都是审视AI产品开发、推广和使用的视角。
当 OpenAI 在 2024 年 9 月推出 o-1 模型时,该公司是通过一系列展示其卓越推理能力的视频来推广这一模型的。在视频中,它能破解韩语密码,可帮助一位遗传学家研究边缘病例疾病。由于大语言模型是一个具有广泛应用的多功能工具,这些视频向用户展示了该技术的实用性。如此一来,OpenAI 影响了用户对其表现的预期。
表现预期是用户对新技术对自己有用程度的看法。在专业环境里,这通常体现在用户效率的提高上,这是的这一指标成为外在动机的衡量标准——即由外部奖励或压力而非内部满足或享受驱动的行为。
想想 AI 在主流取得成功与加密货币普及较慢之间有何区别。一位 Reddit 用户指出,加密货币“复杂、繁琐,需要大量专注的知识才能避免亏损”。相比之下,大语言模型的对话界面使得上手 AI 很容易,让这一技术迅速走红。它对用户的努力预期产生了积极影响。
努力预期是指用户对使用一款产品的难易程度的看法。这个变量在使用初期尤为重要,随着时间的推移和使用的持续而逐渐减弱。
所有的大语言模型都能回答你提出的问题,但 Perplexity 致力于让你的好奇心长存。它的 CEO 经常在 X 上发布抽象、发人深省的图片, Perplexity 周边(如卫衣和帽子)的极简设计,还有网站精心选择的无衬线字体都能让人感受到这种氛围。该公司围绕激发好奇心建立了自己的品牌。
Perplexity 的品牌体验设计师 Phi Hoang 介绍了该公司品牌的起源,他解释说,他们会避免在信息传递时聚焦具体的 AI 模型,因为终端用户并不在意这些细节。就在 UTAUT 而言,Perplexity 在社会影响这个维度的得分很高,这帮助它积累了一群忠实的小众高级用户。
社会影响是用户认为其他人——特别是那些他们尊重的人——对新技术使用的看法。从某种程度来说,也就是用户是否认为使用它很“酷”。
想象一下,你正在跟联合创始人一起坐在咖啡馆里,自顾自地用 AI 代码编辑器 Cursor写代码。突然间,这款应用崩溃了。你沮丧地抱怨起来——就在此时,有人过来提议让他帮你一把,他修好了。后来,你意识到那个人其实是 Cursor 的联合创始人。
这种级别的客户服务或许难以推广,但 Cursor 在便利条件这个变量的得分肯定很高。
支持条件是指用户对有平台可以表达疑虑,并有资源帮助他们使用产品的认可程度。
在过去两年这段时间,Jan Leike 离开了 OpenAI,并开始在 Anthropic 工作。他或许已经不再对 LLM 的成功感到困惑。UTAUT 这个框架能够解答 Leike 关于 ChatGPT 为什么能取得病毒式成功的疑惑,而且学术界也已经发布一些早期研究,探讨这一理论如何适用于 AI 工具的采用,并提出增加新的变量,比方说个人对自主智能系统的信任程度及其对 AI 风险的态度。
我还看到这一理论的精髓被应用在 AI 新的用户交互功能之中。比方说 Claude 的“电脑操控”(Computer Use)功能可让模型执行任务,比如浏览网络、创建和编辑文件或运行代码等,这与对工具的努力预期是契合哦。ChatGPT 的“Canvas”功能可让用户在协作工作空间内使用 AI,而不是受限于聊天界面,这对表现预期也产生了积极影响。
在前沿的 AI 公司致力于突破技术极限的时候,我们,不管是作为开发者、领导者还是学习者,也可以通过理解驱动或抑制用户采用的心理因素,给自己创造下一个 AI 突破。AI 的未来不仅仅在于有更好的算法、数据或算力,更在于与技术有更好的关系。
译者:boxi。