当前位置:首页|资讯|人工智能

如何赢得人工智能产品的军备竞赛

作者:神译局发布时间:2023-06-12

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:本文探讨了如何做出大家真正想用的人工智能产品。关键是,要知道光靠人工智能并不能颠覆业务,而鉴于人工智能的发展太快,早期采用至关重要,而找到适合人工智能产品的市场需求需要评估。里面介绍了许多人工智能产品失败的原因,解释了人工智能产品的生存曲线以及如何克服人工智能的一些缺点。文章来自编译。

大概每隔十年,技术就会来一次巨大飞跃,旧规则被打破,我们的假设不再成立。互联网、移动、视频、区块链。就像上了发条一样,企业和创作者总是会开始疯狂竞赛,怀抱着从下一个重大革新当作赚得盆满钵满,并在此过程中消耗了大量现金。

除非你过去一年过的是不插电的生活,不然的话,你肯定知道者下一个重大革新当属人工智能 (AI)。 2023 年初,ChatGPT 成为了十分热门的工具。在 Twitter 上只需花几分钟,你会看到大家在滔滔不绝地讲着它的使用技巧:如何写剧本、调试代码或告诉你如何制作不含乳制品的通心粉和奶酪等。

让任何拥有 WiFi 的人都能根据需要大量炮制出(大部分)准确的信息,这是一项堪比科幻小说的壮举。但是,企业应该如何利用 GPT 背后的技术,以及一般的人工智能,来解决实质性问题并扩大产品与市场的契合度呢?

这是一个价值百万(甚至万亿)美元的问题。

如果你认为利用人工智能就像将聊天机器人部署到你的应用里面一样简单的话,你可能会被狠狠打脸。那么,怎么才能做出大家确实想用的人工智能产品呢?

在本文中,我们将通过深入研究来寻找这个问题的答案:

  • 为什么这么多人工智能产品会失败

  • 人工智能的生存曲线:赚钱的机会何在

  • 如何克服人工智能的劣势

  • 如何打造人大家真正想要的人工智能产品

在开始详细介绍之前,我们认为先讲清楚一些要点会比较好:

  1. 人工智能本身没法颠覆你的业务。

  2. 早期采用至关重要。

  3. 人工智能产品要想找到产品市场匹配需要评估。

以下我们会逐步详细说明的。

为什么这么多人工智能产品会失败

每次刷新新闻源时,似乎总会看到又有新的有可能改变人类的轨迹(并可能让你破产)的人工智能技术趋势或演示冒出来了。但是,一旦力量遭遇实践时,这些人工智能产品能为最终用户创造价值的寥寥无几——就算是由硅谷的皇室成员打造的也不行。

人工智能用例 1:亚马逊 Alexa

以 Amazon Alexa 为例,这是一款由对话式人工智能提供支持的个人助理。 2016 年,贝索斯提出“新的、更好的算法、超强的计算能力以及利用大量训练数据的能力,它们的结合……正在共同解决以前无法解决的问题。”

时间快进到五年后,光是 2022 年这一年Alexa就亏损了约 100 亿美元,成为亚马逊最大的亏钱大户。

人工智能用例 2:Google Duplex

然后是 Google Duplex:这款“跟人差不多”的人工智能聊天代理,其原本的用意是用于处理日常任务,比方说检查航班以及帮客户预订。三年后,谷歌已经让它下线了。

人工智能用例 3:自动驾驶

那么我们寄予厚望的那些自动驾驶汽车呢?如果福特关闭他们的自动驾驶技术部门算是迹象的话,那么在可预见的未来,你仍然需要坐在驾驶座上。

不幸的现实是,85% 的企业大数据和人工智能项目都失败了。

发生了什么?如果拥有数千名员工和数十亿美元资产的品牌不能用人工智能产品打出本垒打的话,你又怎么能行呢?

问题不在于裸技术是什么。你能用人工智能做到的一些事情堪称神奇,而且只会越来越好。问题在于弄清楚如何在正确的时间通过正确的渠道在正确的情况下应用人工智能,并在此过程中获利。

换句话说:找到人工智能产品的产品市场匹配。

当专家警告说,从医疗保健到法律甚至艺术,人工智能将颠覆几乎所有行业时,人们很容易按下恐慌按钮。但是在喧嚣中遗漏了一个关键的微妙之处。

单靠人工智能无法颠覆:机器学习阶段

诸如 ChatGPT、BERT 和 LaMBDA 之类的人工智能软件本身没法蚕食你的市场份额,取代你就更不用说了。不过,利用这些人工智能工具来扩展自身业务的竞争对手肯定会把你给颠覆掉。

为了理解其中的原因,我们来分解一下机器学习的两个主要阶段:训练和推理。

  • 机器学习训练是为模型提供精选数据的过程,这样就可以“学习”和建立模型。比方说,人类语言学家通过向 Grammarly 的人工智能提供有关逗号正确用法的高质量数据来教它。

  • 机器学习推理是用预训练好的算法实时回答问题的过程。比方说,Grammarly 提出建议,让用户的写作清晰明了且语法正确。

你给机器提供的数据质量越好,输出就越好。因此,拥有数据金矿(以及有用户不断产生更多数据)的公司比从头开始开发人工智能功能的初创企业更具优势。比方说,Talkspace 最适合用自己的数据创建心理健康机器人,而 Noom 最适合创建健康教练。

正如 Chamath Palihapitiya 在 All-In Podcast 中所指出那样,单一用途的人工智能模型将会被商品化:

“真正的价值在于找到不明显的来源来提供数据……这才是真正的军备竞赛所在。”

— Chamath Palihapitiya,风投家,工程师

人工智能的一个典型例子:Meta 的定向广告优于竞争对手,因为它们到处都有像素,从而能够访问最佳数据,进而收割了互联网广告收入的四分之一。换句话说,这与谁拥有蓝图无关——而与谁拥有土地有关。

人工智能生存曲线:获利机会在哪里

评估人工智能机会,释放人工智能优势最有效的方法是采用 Consideration(考虑因素) x Context(上下文) 框架。我们先定义一些基线。

Y 轴 = 考虑因素:做出决策需要哪些努力。

你做决定时考虑得越多,考虑因素就越高。比方说,对于大多数购物者来说,选择洗洁精的“考虑因素”不过,而购买汽车的“考虑因素”很多。考虑因素可以表示为吸引人的备选方案的数量以及利害关系(比方说,用户对错误的容忍度)的函数。

X 轴 = 上下文:人工智能需要知道的抽象概念的数量。

上下文是指模型需要知道多少抽象概念才能提供有用的响应。它只需要了解一小部分数据点(如产品目录),还是需要了解整个互联网(如 ChatGPT)?

人工智能生存曲线

人工智能的商业案例

如你所见,成功的人工智能产品都整整齐齐地落在了一条曲线之上,我们称之为“生存曲线”。我们不妨通过几个例子来仔细看看各种人工智能产品在这条曲线上的位置。

  • StitchFix:他们的模型利用了人工智能来增强人类,帮助你找到完美服装。这需要大量考虑(考虑因素多),但选项仅限于 StichFix 所在的时尚垂直领域,而不是整个购物中心(上下文少)。

  • Grammarly:这个由人工智能驱动的写作助手的利害关系适中,因为它可以为以写作为生的人提供巨大帮助。考虑到必须用正确语法进行训练,但不需要用所有已发布的内容,所以上下文也适中。

  • Walmart Text to Shop:这个工具可以帮助用户将家庭购物这件事情自动化。这里的利害关系并没有那么高,但它确实需要不少的上下文,即要与沃尔玛庞大的电子商务有关联,又要掌握超过 150 万个 SKU 的店内分类信息。

  • MyFitnessPal Meal Scan:只需要扫描盘子里的食物,就可以告诉人们他们消耗了多少卡路里。一图胜千言,但这里一张图片抵得上数百万个数据点。因此,这是典型的上下文要求高,但利害关系不大,因为错误的后果很小。

  • NotionAI:这个基于 GPT3 的工具需要的训练比其他任何东西都要多——需要整个互联网的数据!但是,它的风险很低;你总可以头脑风暴,自己写作,没有任何令人信服的选择。

  • 全自动驾驶汽车:高高挂在曲线的右上象限,因为这个需要大量的训练,再加上风险很高,需要在 100% 的时间内“正确”。

  • 亚马逊 Alexa:远离曲线位于左下象限,因为大多数用例都是低风险(看看天气、调低音量)和低上下文(可以订购达美乐披萨,但它没法替你向西雅图最好的深盘披萨店订块披萨)。

人工智能生存曲线告诉我们基于人工智能的解决方案是否能够满足当今用户的需求。随着风险和可选性的增加,模型需要人更多的注意力才能始终如一地找到最佳答案。

实现产品市场匹配的人工智能产品通过专注于高投资回报率的用例来实现,这些用例确保上下文成本不会涨到超出可交付给用户的范围。这样他们能就可以开启数据收集的良性循环,并随着技术的发展扩大其产品优势。

这个过程越早启动越好。否则,你可能会被远远抛在身后。

我们不妨进一步探讨一下为什么及早投资于人工智能很重要。

保护你的未来:尽早投资人工智能

随着人工智能的进步,生存曲线将向外移动。到 2030 年,我们今天觉得“令人兴奋”的应用可能就会被认为已经过时。GPT3 已经令人惊叹,但 GPT4 将接受数量 1000 倍以上数据点的训练——想象一下 GPT30 会变成什么样。

人工智能生存曲线:向未来转型

这种转变需要时间,也许、要几十年。但如果公司无视这些噪杂声,假装人工智能只是昙花一现的话,那将是最糟糕的事情。就像采用数字技术的公司最容易过渡到移动设备一样,较早采用人工智能的公司将为未来更高级的用例做好准备。

领导者有责任在当今的效率前沿中发现机会,这样才不会随着技术走向成熟而落在后面。但是,当然了,这条道路不会一帆风顺。

克服人工智能的缺点

为了进一步确保你能赢得人工智能的未来,了解其局限性非常重要,这样你才能更好地克服这些缺点。

当今人工智能的最大弱点:真相

人工智能现在存在一个致命弱点,那就是真相,这意味着它最大的限制是它不知道什么是 真的(True)。我们用大写“T”是因为说对博茨瓦纳首都的名字与正确预测 2030 年洗衣粉需求之间存在着很大差异。

去年 5 月,康奈尔大学开展了一项研究,其目标是评估人工智能语言模型的准确度,他们提出了 817 个健康、法律、金融和政治问题。最好的模型只答对了其中的 58% 的问题,而人类的这一比例为 94%。

这并不意味着人工智能就是“坏的”。相反,它正在做它应该做的事情:模仿工程师提供给它的任何数据。在这种情况下,该模型是用包含有流行的错误想法的数据进行训练的,训练出来的模型可能也会误导人类。

人工智能的真相鸿沟促使许多领导者停下了盲目采用的步伐。例比方说,编程问答网站 Stack Overflow 就禁止用户分享由 ChatGPT 生成的答案。

“主要的问题是,虽然 ChatGPT 生成的答案有很高的错误率,但往往看起来也许会不错,而且答案很容易产生成。”

—Stack Overflow网站

Reforge 专家,工程负责人 Louis Bennett 在视频采访中也跟我们谈到了人工智能,特别是 ChatGPT的局限性。

利用人工智能要把真相和训练放在首要位置

如果对很重要——如果你想让你的企业生存下来——解决方案之一是借鉴谷歌的经验,专注于特定的问题领域。借助 Pathways,谷歌通过缩小用例范围(医学),管理训练数据的质量,实现了接近人类水平的准确度(并且很快)。虽然谷歌的模式不像 ChatGPT 野心那么大,但它更适合创造企业价值。

总结:企业公司应该减少对绝对准确性的关注,多关注缩小人工智能与人类之间的准确性差距。这就是训练的用武之地——训练出真相。

用人工智能写篇文章或制作一份菠萝冰沙食谱是不错。不过,下一个重大飞跃是通过复杂、高风险的问题赢得用户的信任——而获得这种信任的唯一方法是通过训练。

不管是取消订阅还是挑选一条新的牛仔裤,我们大多数人更喜欢与真人而不是机器人交谈是有原因的。人类具备了两种智能:

  1. 流体智力:抽象思考解决新问题的能力

  2. 结晶智力:从先前的学习和经验中理解“好是什么样的”

大多数人工智能语言模型都具有惊人的流体智力,但在结晶智力方面却举步维艰。比方说,ChatGPT 可以按照昆汀·塔伦蒂诺的风格写出一个会说话的鲨鱼的剧本,但却没法伪造出自己在编剧室里待了 20 多年的经历。

要达到我们可以信任人工智能来解决实质性问题的地步,需要一种混合模型,一种人类与人工智能协同工作,不断教它什么是“好”的模型。这可能意味着向系统提供 10000 小时的客户服务电话或汇总 20 年的患者数据来预测健康问题。

从这个意义上讲,你可以将人工智能看作是你的实习生而不是你的老板;你的考虑因素越多,你的“实习生”需要的指导就越多。

将信任纳入生存曲线

让我们将信任重新纳入我们生存曲线的考虑因素这个轴。

考虑因素多的人工智能用例

对于考虑因素适中到多的用例,一切都与利用人力资源来训练人工智能,直到客户信任该工具来帮助他们做出高风险的决策有关。想象一下 Best Buy 的“超级销售机器人”,这个机器人可以整合最佳销售代表的技能和知识,帮助客户挑选电视、计算机或音响系统。

如下所示,这可以表示为一个自我强化的循环,信任引发互动形成一个良性循环。造型师作为“循环当中的人”发挥着关键作用,为核心客户习惯循环的形成提供支持,同时还训练人工智能奖赏预测器。这个模型汇集了造型师的具体时尚经验,通过所谓的人类反馈强化学习 (RLHF,ChatGPT背后也采用了这种技术) 过程来训练“超级造型师”。

考虑因素多的人工智能用例:Stitch Fix

考虑因素少的人工智能用例

不过,说道考虑因素少的用例时,这个循环当中的人就是客户。目标是自动化用户旅程的关键步骤,同时精准地触达用户注意力所在的任何地方。自动化程度越高越好。但是,不需要完全自动化;聪明的用户体验就可以取得很好的效果。

比方说,我们团队就推出了沃尔玛的文字购物助手(text shopping assistant),里面有一项叫做“主动重新订购”的功能。用户会收到一条文本,上面列出了他们家庭本周所需的物品清单,只需轻点几下即可对其进行调整,并在几秒钟内结帐。这样以来,原本通过电子商务渠道购买日用杂货的繁琐过程就被简化为无缝体验,从而在每次交互中可以形成更智能的算法。

考虑因素少的人工智能用例:沃尔玛:沃尔玛的个性化文本购物助手让感恩节变得轻而易举

现在我们对人工智能的机会在哪里有了更清晰的认识,让我们开始开发吧。

如何打造大家真正想要的人工智能产品

用人工智能来扩大产品价值可能会让人望而生畏。最近的淘金热让无数团队把没解决的问题、赚不到钱的东西或者两者兼而有之的产品跟人工智能拼凑在一起。

为了降低人工智能产品的风险,并提高找到产品市场匹配的机率,我们来分解一个有5个步骤的流程。

第 1 步:定义用例并确定其优先级

产品是满足用例的一组功能:用例直指大家选择你的产品的核心原因。用例由五个问题组成:

  • 你要解决什么问题?

  • 谁会用你的产品?

  • 他们为什么要用?

  • 还有其他选择吗?

  • 他们多久用一次?

我们以 Amazon Fresh 的一支产品团队为例:这支团队通过用户研究发现,客户花费了太多的时间用在为家里同样的物品补货上,可总结为下面的“补货”用例。

如何开发出大家想要的人工智能产品:Amazon Fresh 用例

大多数产品都有多个用例。但是,当说到用人工智能进行扩展,根据使用最频繁对用户最重要的用例来确定用例优先级是已经过验证的做法,可以解决冷启动问题,防止人工智能模型得不到高质量数据训练的充分“预热”,因为这样才能为用户提供好的结果。

第 2 步:做出 10 倍规模的产品假设

确定了用例的优先级后,需要思考如何利用人工智能来推动阶跃式的改进。以下是一些支持 人工智能的价值主张类别:

  • 主动性:你能预测客户的需求吗?

  • 个人化(Personalization):你能提供相关信息吗?

  • 个性化(Personality):你能为品牌互动注入生命力?

  • 自动化:你能压缩时间并减少工作量吗?

  • 可访问性:你能实现无缝的多模式交互吗?

其目标是确定相对于现状有显著改进(而不是渐进)的解决方案,这样才能克服促进习惯形成所需的切换成本。

亚马逊团队针对补货用例提出了几个假设:

“我们相信,如果续订率提高100%的话

  • ……用户就可以享受到订阅带来的便利和成本节约,又不会觉得他们会失去控制,买了太多的东西。

  • ......主动提示用户续订经常购买的商品,并预测一年可以节约多少成本。”

第 3 步:检查风险最大的假设

在开发任何东西之前,收集用户对产品假设的反馈是很重要的。这应该是客户洞察(定性数据)于实际客户行为(定量数据)的结合。总之,这些可以让你了解自己的想法是不是可以为真实的人解决实际问题。

人工智能用例:Amazon Fresh

继续 Amazon Fresh 的那个例子,他们的团队假设预测性的订阅功能可增加收入并让客户的生活变得更轻松。但团队需要先验证一下这些假设。他们的研究过程证实,大多数人都不愿意自动续订洗衣粉,因为担心到头来可能会买得太多。

人工智能产品对三种类型的风险有特殊考虑:

  • 客户风险:你是否在解决真正的问题?

这项功能是否提供了明显更好的解决方案,或者从技术上讲它是件很酷的事情?

偏见有没有可能影响某些用户的体验?

  • 商业风险:这能赚钱吗?

这项功能是不是建立在你组织的专有数据集之上,并起到增强作用?

你有没有为(标注和再训练)的前期和持续成本做好了准备?

  • 技术风险:这在软件和硬件方面是否可行?

你有没有足够广泛的训练数据集来进行模型推理?

你能不能根据自己的用例需求提供预测性能?

第 4 步:通过快速原型制作验证你押注的东西

是时候用原型或最小可行产品来实现你的想法了。这里不是要为《纽约时报》的封面文章做准备——你只需要找到掌握“实际情况”或向现实世界的人类行为学习的最快途径。这意味着要紧凑,要让学习循环周期尽可能短,这通常是通过做一些无法扩展的事情来做到的。

人工智能产品的快速原型制作

如此循环反复,直到你开始聚焦到 Tom Chi 所谓的“眼前一亮的时刻”,也就是用户真正感受到与产品核心价值相关的那个愉悦时刻。想想你在狂风暴雨的日子里第一次拿到 DoorDash 送过来的外卖是什么感受。

就 Amazon Fresh 而言,我们可以制作一个订阅机器人的原型,可以弄一些客服代理,跟小范围的试点客户合作,让他们作为我们在第一步确定的早期采用者的代表,试用这个人工智能产品。

该团队通过这样获得了两条重要的经验教训:

  1. 机器人在发货前提供的双重检查,试点组有 37% 的用户对此感到非常高兴。

  2. 21% 的用户在机器人提示他们要不要要续订经常购买的商品时选择了续订。

看起来团队正在走上产品用户匹配的正确道路上,对为合适的用户提供合适的产品有了敏锐的理解,所有这些都不需要设置复杂的人工智能基础设施。

第 5 步:推出你的最小可爱产品

Minimum Lovable Product (MLP,最小可爱产品) 这个词是亚马逊发明的,指的提供的功能特性正好能让早期采用者爱上,而不是刚好能容忍的产品。这是相对最小可行产品(MVP)而言,后者聚焦的是用最小的代价收集经验。

几十年前,要做 MLP 需要大量资源和时间。不过,现如今,产品开发团队可以用 Quiq、spaCy 以及 Labelbox 等现成工具在很短的时间内推出 MLP。

人工智能用例:Notion AI

笔记公司 Notion AI 集成了 GPT-3,以帮助用户简化原本繁琐的任务,比方说创建会议议程和撰写岗位描述——所有这些都是在用户熟悉和喜爱的 Notion 平台上进行的。

人工智能用例:Amazon Fresh

总结一下那个亚马逊的示例——原型设计阶段的任务是获得关键知识,要了解完全自动化的 MLP 在特定用例当中需要是什么样子的。基于此,亚马逊可以开发一个利用 SaaS 产品(比方说 AWS Lex)的 MLP,对相关体验进行更大范围的测试。这一步会启动训练和数据收集的过程,好让团队逐步对产品进行改进。

开发出令人难以置信的人工智能产品或体验对实现产品市场匹配来说是不容商量的。

最后思考:集成你的人工智能产品

人工智能与其他范式转变创新之间的区别在于,其进入门槛非常低。在互联网的早期,建立网站是项艰巨任务,只有大型技术团队才能完成。相比之下,几乎任何具有互联网连接的人都可以用开源模型开发人工智能应用。

从可访问性的角度来看,这很棒。但正如 Allen Cheng 所指出那样,产品团队受益于制造了竞争优势的“护城河”,但 OpenAI 等资源将这道护城河变成了一个浅水坑。因此,真正的价值在于将人工智能集成到现有系统,去增强它们——而不是部署机器人就完事儿了。

这篇文章讲了很多东西,最后在了解了相关背景信息后我们再概括一下一开始介绍的关键要点:

  1. 人工智能本身没法颠覆你的业务,但利用了人工智能的竞争对手绝对可以颠覆你。

  2. 人工智能每年都会呈指数级发展,因此尽早采用至关重要。

  3. 为人工智能产品找到产品市场匹配需要评估你的产品位于生存曲线的什么位置。

译者:boxi。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1