【环球时报记者丁雅栀环球时报驻美国特约记者 冯亚仁】编者的话:过去几十年,网络搜索引擎协助用户在浩如烟海的网络信息世界中找寻答案。但自2023年初,美国初创企业OpenAI推出ChatGPT聊天机器人以来,业界对于利用人工智能(AI)技术生成答案的兴趣愈发浓厚。众多科技界领袖、分析师和投资者纷纷指出,这一创新可能对传统搜索业务构成严峻挑战。不断优化的生成式AI工具不仅能够针对用户提问予以更完整连贯的回复,还能基于用户的偏好和行为习惯提供个性化的解决方案。有一种声音称,这些趋势将颠覆整个传统网络搜索业务,AI也终将成为搜索引擎的“掘墓人”;但另一些专业人士认为,AI与搜索引擎的整合将带动搜索行业向更高级别的智能化迈进,使其能够更好地满足用户的复杂需求。传统与变革之间,行业将走向何方?
平价大模型来了,传统搜索要“凉”?
近日,包括字节、阿里、百度、腾讯、科大讯飞在内的多家企业大模型开启降价、免费模式。尽管其调价幅度、开放范围、产品类型、目标用户各有不同,但抓紧时机抢占用户、抢占市场无疑是各企业参与本轮竞价的核心目标。全球范围,大模型的降价风潮同样汹涌,据有关媒体统计,OpenAI已在过去的一年中进行了4次降价调整。
降价意味着使用门槛的进一步降低,同样意味着AI将在提供信息和内容方面扮演越来越重要的角色。事实上,对很多人来说,搜索引擎早已不是他们搜寻信息的“首选”。《环球时报》记者在美国了解到,许多用户对搜索引擎的使用结果颇有抱怨,称搜索结果经常被低相关度、低质量的链接所“霸屏”,不少人已经开始放弃使用谷歌搜索,转而在诸如Reddit、YouTube、TikTok等社交媒体或视频网站上来寻找答案。
随着AI产业的飞速发展,调用AI大模型来获取信息或将进一步改变用户使用习惯,并对传统搜索引擎产业形成冲击。《环球时报》记者了解到,传统搜索引擎严重依赖算法,这些算法根据与用户查询的相关性对网页进行排名。“传统搜索引擎依赖爬虫技术,抓取互联网上的网页,然后进行清洗和排序。当用户输入查询词时,搜索引擎会根据其算法对网页进行排序,并将结果展示给用户。用户需要自行选择并点击网页,然后阅读内容,这一过程往往耗时较长,需要用户自己去总结信息。”昆仑万维董事长兼CEO方汉表示。相比之下,引入AI可以帮助理解上下文,从用户行为中学习,并提供更个性化和准确的结果,问答的文本也更加简单直接,而不是简单地对网页进行索引和排名。
传统搜索引擎在语音搜索方面也同样面对来自AI的挑战,越来越多用户转向谷歌助理和苹果的Siri等虚拟助理。相比之下,语音查询比键入式搜索更具有对话性。
“新技术、新形态之下,传统的搜索引擎可能会逐渐消失。”清华大学新闻学院新媒体研究中心主任、跨学科知名学者沈阳5月30日告诉《环球时报》记者,随着AI“幻觉”率(指AI会生成貌似合理连贯,但与现实或已知数据不符合或无法验证的内容)和推理费用的降低,搜索操作系统呈现出“AI化”的趋势。此外,基础软件,如微信等社交应用,一旦加入AI功能,就可能替代传统搜索功能。
对此工信部信息通信经济专家委员会委员盘和林则认为,传统搜索引擎大可放心,“因为AI大模型背后的数据也是来自于传统搜索引擎,举例来说,百度和谷歌都已借助大模型优化搜索流程,有了AI大模型的加持,用户搜索效率会不断提升。”盘和林称,AI应用虽然可以改变原有互联网生态,但很难成为“鲶鱼”。
向AI搜索引擎“迁徙”
《环球时报》记者一些在美国科技领域从业的朋友称,目前他们已在减少使用传统搜索引擎的频率,转而使用一款名为Perplexity AI的AI聊天机器人。这款应用推出于2022年,其创始人曾在OpenAI和Meta从事AI研究。不同于传统搜索引擎,Perplexity AI以互动式搜索为驱动,可使用自然语言预测文本回答查询,使用网络来源生成答案。当用户提出问题时,它不会只给你提供链接列表,而是找到最贴近需求的链接并使用AI编写内容摘要。此外,Perplexity平台上用户体验感较好的功能叫“Copilot”,它通过询问细节问题来帮助用户缩小查询范围。例如,当用户询问在哪里为孩子举办生日派对时,Copilot会询问是否需要户外空间、室内空间还是兼顾两者的建议,当用户做出选择时,它会继续询问派对的大致预算,最后通过算法,提供一系列复合需求的场地列表。
多名采访对象都认为,AI对搜索引擎的最重要影响之一是个性化程度的提高。传统搜索引擎提供基于关键字的通用结果,但AI可以根据个人用户量身定制结果,通过分析搜索历史记录、位置和行为,AI可以预测用户正在寻找什么。这种级别的个性化对传统搜索引擎来说的确是一个挑战。为了应对挑战,全球科技巨头如微软、谷歌、百度等已经开始探索AI在搜索领域的应用前景。
美国的谷歌和必应等搜索引擎巨头正在调整其产品的角色和策略,转而向AI搜索“迁徙”。2023年初,ChatGPT刚刚崭露头角时,微软就宣布与OpenAI合作,推出了由AI驱动的Bing搜索引擎和Edge浏览器。5月中旬,谷歌推出由生成式AI驱动的搜索引擎。该公司称,将向用户提供其“AI概述功能”,该功能可直接在谷歌搜索的页面顶部总结提炼所查询的答案概要。谷歌方面称,这是谷歌搜索引擎多年来最大规模的一次革新。
国内方面,昆仑万维、百度等也纷纷向AI搜索引擎“迁徙”。2023年8月,昆仑万维推出了国内第一款融入大语言模型的搜索引擎——天工AI搜索;2个月后,百度将旗下的简单搜索升级为AI互动式搜索引擎,在搜索页面内置文心一言大模型技术。
虽然搜索引擎的本质都是基于用户输入的内容“推荐”结果,但从目前推出的AI搜索产品来看,AI搜索引擎与传统搜索引擎在工作方式上有显著的区别。方汉认为,与传统搜索引擎相比,AI搜索引擎能够显著降低用户的搜索时间,直接为用户提供对网页内容的总结,省去用户选择、点击和阅读网页的过程。“如果说传统搜索引擎像一个图书馆的目录卡,用户需要知道自己想找的书的确切书名或者作者,才能通过目录卡找到书的位置,那么AI搜索引擎则像一个图书管理员,只需要告诉它感兴趣的主题或大概想法,它就能找到相关的书,并总结书中的主要内容。”方汉说。
警惕“胡言乱语”和“数据退化”
不论是对AI企业还是搜索引擎企业来说,打造AI搜索引擎都不是件易事。沈阳告诉《环球时报》记者,首先,获取全网数据需要成本。以中文为例,每天公开数据大概在3亿条到5亿条,AI搜索引擎要接入这些数据是有成本的。其次,AI搜索引擎需要处理大量的实时数据。AI发展到一定阶段,才会把原始语料库之外的数据作为新的增长点,在这一基础上,AI搜索引擎还需要实时化数据检索。最后,AI搜索引擎盈利模式尚不明确,只有资金充足的企业才能发展起来。
“AI搜索引擎的构建需要高昂的成本,特别是自建搜索引擎索引库,这对于小创业者来说几乎是不可能完成的任务。如果没有自己的爬虫集群,就需要购买第三方服务,如Google或Bing的索引库,这将消耗掉所有的利润,这是一项巨大的成本。”方汉表示。
然而,AI搜索引擎真的能够达到预期中的效果吗?近日,刚上线不久的谷歌 AI概述就闹了不少笑话。很多用户反映,AI搜索概述“胡言乱语”。比如,当输入“奶酪不粘在披萨上”时,AI搜索给出的答案是“酱汁中加入大约 1/8 杯无毒胶水”;而当用户提问“我每天应该吃多少块石头”时,该工具的回答为“根据加州大学伯克利分校地质学家的说法,人们每天应该至少吃一块小石头”,同时列出了其维生素和消化益处。
诺贝尔经济学奖得主保罗·克鲁格曼近日也在社交媒体上表达了他对AI驱动的搜索工具的担忧,称“有很多关于谷歌和其他搜索引擎退化的消息。这是真的,让我的工作变得困难”。他还批评了人工智能,称它“比没用还糟糕”。
“几乎所有的AI搜索引擎都会出错。”沈阳以他的亲身体验为例,告诉《环球时报》记者,尽管AI团队致力于降低推理成本和减少幻觉,但作为概率模型的AI不可避免会出错。沈阳称,AI的广泛使用使AI生成内容急剧增加,大量自媒体文章的内容由AI自动生成,而AI幻觉产生的错误就夹杂在这些文章当中,这也会造成整个互联网的内容质量进一步下降,导致数据质量的整体下降。这种现象被称为“数据退化”。AI的检索内容也来自于这些退化的数据,形成恶性循环。
盘和林在接受《环球时报》采访时也表示,就像人会犯错一样,AI也会犯错,只不过方式和人类不太一样,因为AI成长的路径和人类有区别。但现阶段,搜索结果的有效性依赖于搜索算法,有些事通过谷歌和百度也找不到想要的答案,但通过AI的确能够提高效率。所以,尽管答案不匹配,但用AI提高搜索效率是必经之路。
如何提升AI搜索引擎的准确性呢?在沈阳看来,这是一个渐进的过程,需要采取两个主要措施:一是尽可能选取权威信息源,二是采取一切手段降低AI的幻觉率,比如“双AI碰撞”方案,即让两个AI对同一个问题进行分析,以减少错误信息的产生概率。“错误信息,即使是小比例的,也可能在关键时刻造成严重后果。”他说。