现在是成为一家搜索初创公司的好时机。上周,当我和 You.com 的 CEO 理查德·索彻(Richard Socher)交谈时,他大声说:“天哪,多么令人兴奋的一天——对我们来说是一个新的记录,”他惊呼道,“从来没有这么多的用户。这简直是一阵旋风。”
上周,微软和谷歌连续公布了它们各自对搜索引擎未来的看法,展示了可以用流畅的句子而不是链接列表来回答查询的聊天机器人。
微软升级了其搜索引擎必应,推出了 ChatGPT,这是 2022 年由美国旧金山公司 OpenAI 发布的一款流行的聊天机器人;谷歌则正在开发一个名为 Bard 的产品,以作为 ChatGPT 的的竞争对手。
(来源:STEPHANIE ARNETT/MITTR | DEGROOTE STOCK/ENVATO)
虽然这些公告让我们获悉了搜索引擎的下一步发展目标,但要想全面了解搜索内容,就得超越微软和谷歌之外来看待。尽管这些巨头将继续占据主导地位,但对于任何想要寻找其他选择的人来说,搜索领域将会涌入更多的参与者,并变得更加多样化。
这是因为在这种大背景下,数月以来涌现的一大波初创公司,已经开发了类似的聊天机器人辅助搜索工具。
You.com 早在 2022 年 12 月就推出了一款搜索聊天机器人,此后一直在推出更新的功能。许多其他公司比如 Perplexity、Andi 和 Metaphor,也在将聊天机器人应用与其他功能结合起来,例如图像搜索、社交信息保存或搜索、以及快速搜索信息等。
ChatGPT 的成功引发了一场热潮,因为科技巨头和初创公司都在试图找出答案——如何以人们意想不到的方式给他们想要的东西。
旧的守卫,新的想法
谷歌多年来一直主导着搜索引擎市场。在美国华盛顿大学研究搜索技术的奇拉格·沙阿(Chirag Shah)说:“这种局面已经持续了很长时间了。”“尽管有很多创新,但情况并没有发生太大的变化。”
随着 2022 年 11 月 ChatGPT 的推出,情况发生了改变。突然间,通过输入一串不连贯的单词来搜索目标的想法已经变得过时了,为什么不直接问你想要什么呢?
伊多·李博特(Edo Liberty)曾领导过亚马逊的人工智能实验室,现在是一家制作搜索引擎数据库公司 Pinecone 的 CEO,他说:“这才是一种正确的组合,就像花生酱和果冻一样。”他说现在有几家小公司在与大公司竞争。“在五年前,这将是徒劳的事,”其表示,“头脑正常的人不会撞南墙。”
谷歌探索大型语言模型(例如 ChatGPT 和 Bard 等聊天机器人背后的技术)的用途已经有一段时间了。当 ChatGPT 成为主流热门产品时,谷歌和微软立即采取了行动,其他人也是如此。
暴风雨的城堡
如今,现成的软件使得构建一个搜索引擎,并结合一个大型语言模型比以往任何时候都更容易。李博特说:“现在,你可以依靠少数几个工程师在几个月内大肆开发由数千名工程师在十余年间开发的技术库。”
以下是索彻的经历。2020 年,他辞去了 Salesforce 公司首席人工智能科学家的职务,共同创立了 You.com。该网站为寻找 Google 替代品的网络搜索高级用户提供一站式服务,它旨在为人们提供各种格式的不同类型的答案,比如从电影推荐到代码片段等。
上周它引入了多模式搜索——它的聊天机器人可以使用来自附属应用程序的图像或嵌入式小部件而不是文本来响应查询,其还具备一项让人们与聊天机器人分享交流内容的功能。
本周,You.com 推出了一项升级计划,以解决有关现场体育赛事的问题,比如老鹰队是否能在比赛还剩 8 分钟的时间里赢得超级碗。
Perplexity 是一家由 OpenAI、Meta 和 Quora 的前员工建立的公司,借助该公司的产品,用户可以询问和回答彼此的问题——这将引领搜索引擎向一个不同的方向发展。这家初创公司将 OpenAI 的大型语言模型 GPT-3 与必应,结合在一起并于 2022 年 12 月推出了搜索聊天机器人,他们号称目前为止已有大约 100 万人尝试过这个聊天机器人,其设想是要抓住人们的兴趣,并围绕着它建立一个社区。
这家公司希望重新创建基于社区的信息存储库,如 Quora 或维基百科,使用聊天机器人来生成条目,而不是人们自行编辑。当人们问 Perplexity 的聊天机器人问题时,问答环节会被保存下来,并可以被其他人浏览。用户还可以对聊天机器人生成的响应投赞成票或反对票,并添加自己的见解到正在进行的线程中。这就像 Reddit 一样,不过是人类在提问、人工智能做回答。
上周,当谷歌尚未发布的聊天机器人 Bard 被发现在一个匆忙发布的宣传片中给出了错误答案的第二天(一个可能让公司损失数十亿美元的错误),Perplexity 宣布了一个新的插件,它可以结合谷歌的网络浏览器 Chrome。对于相同的问题,后者给出了正确答案。
总部位于美国迈阿密的搜索公司 Andi 的 CEO 兼联合创始人安吉拉·胡佛(Angela Hoover)一年前成立了自己的公司,此前她对不得不筛选广告和垃圾邮件以在 Google 中找到相关链接感到沮丧。与许多玩过 ChatGPT 等聊天机器人的人一样,她的搜索灵感受到科幻小说中“万事通”之类的角色的启发,例如《钢铁侠》中的贾维斯或《她》中的萨曼莎。当然,我们还没有这样的东西。“我们不认为 Andi 什么都知道,”她说,“Andi 只是在寻找人们放在互联网上的信息,然后以一种漂亮的、包装好的形式带给你。”Andi 在搜索方面的创新,涉及到使用大型语言模型来选择最佳结果并进行总结。她表示,她让模型学习了从普利策获奖文章到 SEO 垃圾邮件的所有内容,以让搜索引擎更好地支持一些结果。
最终,搜索之战将不仅仅局限于网络——我们还需要使用工具来搜索更多的个人信息,比如电子邮件和短信。“与世界上其他数据相比,网络很小,”李博特说。据他表示,有大量使用聊天机器人进行搜索的公司,并未与微软和谷歌竞争。他的公司 Pinecone 提供的软件可以方便地将大型语言模型与小型的、定制的搜索引擎相结合。
通过使用 Pinecone,可以为用户手册、医疗数据库和播客文本构建定制的搜索工具。
“他们只是编造东西”
但很多人认为用聊天机器人进行搜索是一个糟糕的想法。驱动它们的大型语言模型充斥着偏见、偏见和错误信息。胡佛同意这一点。“大型语言模型本身是绝对不够的,”她说,“它们是填补空白的机器——它们只是编造一些东西。”
为搜索开发聊天机器人的公司,试图通过将大型语言模型嵌入现有的搜索引擎,让它们总结相关结果,而不是从零开始创造句子来回答问题。大多数人还会让聊天机器人引用它们正在总结的网页或文件。
但这些策略并非是万无一失的。自从微软向一些试用用户开放新版必应以来,社交媒体上充斥着一些截图,显示聊天机器人在人们想方设法引发无意义或冒犯性反应时,它们会偏离正轨。据从事人工智能和搜索工作的软件工程师德米特里·布雷雷顿(Dmitri Brereton)说,微软流畅的必应聊天演示也是错误百出的。
胡佛怀疑微软和谷歌的聊天机器人可能会产生错误的反应,因为它们将搜索结果中的片段拼接在一起,而这本身可能是不准确的。“这是一个糟糕的做法,”她说,“它看起来令人印象深刻,但它产生的答案是可疑的。”她说,而 Andi 避免简单地重复搜索结果中的文本。“它不像其他聊天机器人那样编造东西,”她说。人们可以自己决定这是否属实,在收集了过去一年的用户反馈之后,该公司的聊天机器人有时会坦言对于某些答案没有信心。“它会说,‘我不确定,但根据维基百科……’”她说。无论哪种方式,这个新的搜索时代可能都不会完全地放弃链接列表。“当我想到五年后的搜索时,我们仍然有能力查看结果,”她说,“我认为这是网络的重要组成部分。”
但随着聊天机器人变得越来越有说服力,我们是否会越来越不愿意核实它们的答案?“值得注意的不是大型语言模型会产生虚假信息,而是它们正在关闭人们的批判性推理能力。”Diffbot 的 CEO Mike Tung说,这家公司正在开发软件以从网络中提取数据。
华盛顿大学的沙阿也有同样的担忧,在微软必应的聊天演示中,该公司强调使用聊天机器人进行搜索可以节省时间。但他指出,多年来微软一直在做的一个鲜为人知的项目叫“搜索教练”,旨在引导人们停下来思考。“搜索教练是‘带训练轮的搜索引擎’,搜索教练帮助人们特别是帮助学生和老师学习有效地编写搜索问题,并识别消息源是否可靠。与 ChatGPT 相比,‘搜索教练’鼓励人们放慢时间,而不是节省时间。”他说。
像 Andi、Perplexity 和 You.com 这样的公司很高兴地承认,他们仍在研究搜索可能是什么。但事实是,它可以有很多样子。
支持:邹名之
原文:
https://www.technologyreview.com/2023/02/16/1068695/chatgpt-chatbot-battle-search-microsoft-bing-google/