这一轮生成式 AI 引发的浪潮可以说愈演愈烈,几乎每隔一段时间就会有新的 AI 公司和 AI 产品出现在我们的面前,也能看到很多已经功成名就的人选择投身 AI 创业热潮。
就在昨天,前小度 CEO 景鲲公布了离职百度后的新动态,宣布和前小度 CTO 朱凯华联合创立了 AI 创新产品公司 MainFunc,旗下首款 AI Agent 搜索产品 Genspark 已经 Beta 上线。
图/ Genspark
此外,MainFunc 还拿到了 6000 万美元(约合人民币 4.35 亿元)的种子轮融资,投后估值直接来到了 2.6 亿美元(约合人民币 18.87 亿元)。
此时距离他辞任百度集团副总裁和小度 CEO,刚刚过去 8 个月。耐人寻味地是,他在离开百度后选择的领域恰恰是百度的核心业务——搜索。
不留在百度的体系内做 AI 搜索,而是选择和前小度 CTO 一起自己做,这在一定程度上说明了百度面对 AI 搜索这个全新领域存在一些问题。但更重要的可能还是,景鲲的选择再次证明了很多人相信的一点:
AI 搜索,大有前途。
但这种「前途」会彻底改变我们获取信息的方式吗?又会打破现有的搜索市场格局吗?
和所有 AI 搜索一样,Genspark 也采用了以对话为主要交互方式的设计,用户提出问题后,Genspark 会生成相关的简短回答,直接给你你可能需要的信息,而不是给你你可能需要点击、浏览、判断的「十个蓝色链接」。
此外,MainFunc 官方相信,Genspark 可以提供更高质量的搜索结果——也是回答。按照官方的说法,Genspark 使用多个专门的人工智能模型,每个模型都旨在处理特定类型的查询。
在底层,Genspark 依靠内部训练的模型以及来自 OpenAI、Anthropic 等的第三方模型来对用户的搜索查询进行分类,并确定如何组织和呈现结果。比如我们搜索「OpenAI 什么时候推出的 AI 搜索?」(实际没有推出):
图/ Genspark
Genspark 的每个搜索结果页面首先会呈现 AI 生成的结果摘要,后面是指向更详细的 Sparkpage 的链接,基本上可以理解为针对问题生成的一篇完整回答。最后还有一些推荐链接,这部分就相当于传统搜索引擎的结果页面。
而 Sparkpage,也是 Genspark 区别于其他任何 AI 搜索的独特性交互设计。除了生成一个类似维基百科的详细回答,用户还可以在 Sparkpage 右侧的对话窗口,继续与 AI 进行对话,不管是针对回答的疑惑进行展开,还是针对部分内容进行深入。
图/ Genspark
针对大模型的「幻觉」问题,AI 搜索一般都采用 RAG(检索增强生成)技术降低「幻觉」的出现概率。景鲲则在 TechCrunch 的采访中另外表示,Genspark 的 AI 模型偏爱具有高权威性和流行度的网页,对过滤掉更多「外面」的信息有很大帮助。
「我们非常重视数据质量,我们相信数据质量是赢得这场比赛的关键,」景鲲强调。但现实是,在这场 AI 搜索的比赛中,重视数据质量的不仅是他们,参加比赛的对手也是层出不穷。
曾几何时,以谷歌和百度为代表的搜索引擎可以说是整个互联网最重要的「入口」,基于搜索引擎,谷歌一直以来的使命就是:「整合全球信息,供大众使用,让人人受益。」
但在很长的时间内,搜索引擎的产品形态和商业模式并没有发生质的变化,甚至体验还有所退步。
在传统的搜索体验中,用户通常是脑中存在一个或模糊或清晰的问题和需求,然后需要将这种需求转化成一个或几个相关的关键词。
接着,搜索引擎根据关键词、索引库找出相关的网页链接,再通过算法排序的方式呈现相关程度最高的网页链接。同时,在搜索结果中还往往穿插着几个「伪装成搜索结果」的广告。
图/百度
与之相对的,得益于大语言模型实现了强大的自然语言理解能力,用户可以用最自然的自然语言进行搜索,AI 搜索也能够更准确地理解用户的提问意图。
此外,虽然 AI 搜索同样需要匹配超大规模的索引库来找到相关的网页,但在呈现上彻底改变了过去信息的组织和设计,没有「信息排序」,直接给出答案,不需要用户点击排在前的最相关链接,再找出自己真正需要的信息。
简而言之,相比传统的搜索体验,AI 搜索是一种交互和效率上质的变化,也被很多人视为搜索的未来。所以即便 AI 搜索严重挑战了现有的搜索广告商业模式,谷歌也还是推出了 AI 搜索。
今年 5 月 15 日,谷歌在 Google I/O 开发者大会上宣布将在谷歌搜索上线基于 Gemini 大模型的 AI Overviews 功能,简单来说,就是根据用户问题在搜索结果页直接生成一个简短的回答,然后才是以网页链接为主的传统搜索结果。
图/谷歌
用过 New Bing 的读者一定不陌生这种形式,事实上这也意外着谷歌搜索终于也迈出了通往「AI 搜索」的一步。
相比之下,作为全球第一大中文搜索引擎,百度同时还是国内最早推出自主训练大模型,虽然旗下也有主打 AI 搜索的「简单搜索」,但百度搜索却取消了 AI 搜索功能(文心一言推出早期有上线过)。
而与此同时,由前 OpenAI 研究科学家 Aravind Srinivas 联合几位合伙人共同创办的 Perplexity,已然成为了当下最具代表性和影响力的 AI 搜索。截至今年 1 月,Perplexity 的月活跃用户就超过了 1000 万,访问量超过 4500 万次,总搜索量超 5 亿次。
加上转型 AI 搜索的传统搜索公司,以及一大批新涌现的 AI 搜索初创公司,AI 搜索似乎已经到了「万马奔腾」,一举取代传统搜索的局面。
但 AI 搜索已经到了取代传统搜索的阶段吗?可能还为时尚早。
坦白讲,从去年开始小雷就尝试过将浏览器的默认搜索引擎换成「AI 搜索」,主要是用连英伟达 CEO 黄仁勋都在用的 Perplexity,今年还尝试过将之前中文搜索体验还不错的秘塔 AI 搜索设置成默认搜索引擎。
但现实是,我其实都用不了多久就会换回谷歌,理由并不复杂,核心是 Perplexity、秘塔 AI 搜索以及其他 AI 搜索都:
不可靠。
比如刚刚问到的回答,图/ Genspark
作为科技编辑,小雷几乎每天都需要使用搜索引擎,也严重依赖通过搜索来获取信息,同时信息的准确性也非常重要。这一点应该很好理解。
但 AI 搜索本质上是能联网的 AI,同时基于 RAG 技术,大模型会结合用户提问和相关检索信息作为 Prompt 输出回答。虽然不少观点认为 RAG 技术是当下缓解大模型幻觉的最佳解决方案,但不仅远谈不上解决,实际缓解的效果也有限。
具体到 AI 搜索体验中,小雷看到有些回答会明显怀疑一些信息的真实性,这个时候又不得不需要通过谷歌等传统搜索引擎进行检索、查证,因为 AI 搜索的来源链接也充满了幻觉。
但我又不可能每个信息都重新进行搜索、查证,否则就与「使用 AI 搜索提高搜索效率的初衷」背道而驰了。
更大的问题是,如果一些信息错得并不离谱,我对一些特定领域也并不了解,很可能不会意识到错误,甚至会直接使用了错误的信息,从而产生错误的理解和观点。
简单来讲,作为能联网的大模型,目前的 AI 搜索很多时候是存在幻觉的黑箱,我很难信任 AI 回答里面的各种信息,所以宁愿退回传统的搜索体验,使用关键词找到相关的网页,再人工寻找和判断我需要的信息。
但这不意味着我会放弃使用 AI 搜索。
首先,大模型的流行注定会改变互联网的内容生态,我们很早就在文章中表达过对生成式 AI 内容充斥互联网的担忧,今年你甚至还可以看到字节跳动、掘金等公司通过 AI 生成了海量中文网页「污染」搜索引擎。
豆包生成的就有 1560 万条,图/谷歌
而不同于传统搜索引擎的机制和交互方式,AI 搜索理论上相对更容易绕开这种「污染」,同时对话式的交互也能避免了大量无价值内容,提高效率。
其次是在「What」之外,我们经常需要向搜索引擎提出的问题还有「Why」和「How」,这方面对信息的准确性要求较低,更强调整合梳理能力,而这恰恰是大模型极其擅长的,这是小雷需要的。
同时从更长远的角度来看,大模型和生成式 AI 技术还处在快速发展的阶段,当下幻觉的问题并不意味着在不远的将来会有更好的解决方案。
AI 搜索不是救世主。
AI 搜索的出现无疑给我们提供了一种全新的信息获取方式,也带来了不少新的思考和挑战。但在使用 AI 搜索过程中,我们能明显发现了其在准确性和可靠性上的不足带来的困扰。但这并不意味着 AI 搜索毫无价值。
相反,AI 搜索在整合信息、提升搜索效率以及避免无价值内容方面展示了巨大的潜力。随着技术的进步,生成式 AI 的能力将会更加完善,或许就能解决当前存在的问题。
所以比起一种取代传统搜索的「救世主」,我更愿意把 AI 搜索看作一种新的选择。我们在使用中需要不断探索和适应,找到最适合自己的使用方式。在这个过程中,传统搜索引擎和 AI 搜索并不是互相排斥的,而是可以相辅相成,共同改进我们的搜索体验。
或许在不久的将来,AI 搜索能够解决目前的不足,比传统的搜索方式更能「整合全球信息,供大众使用,让人人受益」,成为人类获取信息的主要方式。