业务能力还不行。
撰文:冯诺编辑:龚正
来源:真故研究室(ID:zhengulab)
「体验完这个国产AI搜索,我想说传统搜索引擎可以靠边了」
「AI搜索,革了旧引擎的命」
「搜索引擎要变天了」
「首款国产AI搜索引擎横空出世,革了传统搜索引擎的命!无限追问,告别广告」
这是几则近期的文章标题。不用看全文,就已经感觉到AI搜索扑面而来的杀气——传统搜索引擎,似乎就要成为生成式AI的下一个刀下之鬼了。
毫无疑问,2024年最热门的科技赛道,AI搜索一定是排名靠前的。自2022年末的生成式AI大爆炸以来,这条赛道就一直络绎不绝,人满为患。
7月25日,曾经跳票过的OpenAI终于宣布开放自家AI搜索引擎SearchGPT的内测。
而仅在国内,近一个月就有两个新玩家涌入。6月30日,知乎宣布推出AI搜索产品「知乎直答」,宣称要探索提问的全新形态,帮助用户“用提问发现世界”;7月10日,阿里旗下的夸克也推出了AI搜索,主打一个“能搜索、能创作、能总结的超级搜索框”概念。
加上之前已经入局的秘塔AI搜索、KIMI、360AI搜索、昆仑万维的天工AI、Genspark等等,AI搜索进入战国时代。
事实上,AI搜索听起来高精尖,但是门槛并不高,不仅大厂和初创企业染指,连个人开发者也能挤进来。
据报道,阿里前高管贾扬清用500行代码就写了一个AI搜索引擎;独立开发者「艾逗笔」花了一个周末就写了AI搜索ThinkAny,三个月时间做到了月访问量60万。
但这么低的门槛,钱景却无限。进入2024年,此中翘楚Perplexity的估值连连跳涨,从1月份的5亿美元,暴增到30亿美元。
但是,AI搜索,真的会革掉传统搜索引擎的命吗?
答案是,还早着呢。
业内最早布局AI搜索的微软必应,从去年二月推出New Bing以来,到2024年1月整整一年的时间,Bing的全球市场份额从2.81%上升到3.43%,增长只有0.62%。AI没帮到一点,一开始紧张不已的谷歌,也松了一口气。
投资了秘塔AI搜索的猎豹移动董事长傅盛在一次专访中坦言,“只要大厂不犯重大错误,大搜索格局上,很难有大的变化。”
傅盛的断言并非信口开河。AI搜索至少要越过三个坎——足够高的准确性、足够低的成本和足够成熟的商业模式,才能勉强跟传统搜索引擎掰掰手腕。
目前,我们所说的AI搜索主要有三类产品形态。一类是具备检索增强生成(RAG)能力的聊天机器人,比如ChatGPT、文心一言、Kimi等。
第二类是专门做 AI 搜索的产品,有搜索框和搜索详情页,比如 Perplexity、秘塔AI搜索。
还有一类是将传统搜索和AI结合在一起,主要形式是在搜索结果页首条加上AI生成的答案,比如谷歌的AI Overview和百度的AI智能回答。
本文探讨的主要是后两种。
01
AI搜索的嘴,骗人的鬼
今年5月,谷歌推出了自家的AI Overviews,也就是在谷歌搜索结果页的首条,展现由谷歌大语言模型Gemini生成的答案。
但刚推出就翻车了,网友发现谷歌的AI答案常常不着边际。
网友问披萨上的芝士容易脱落怎么办,谷歌AI的回答是“要加上八分之一杯的胶水”;网友问每天应该吃多少石头时,谷歌AI给出建议“每天至少吃一块小石头”;网友表示自己心情沮丧,谷歌AI建议从金门大桥上跳下去。
不靠谱的AI答案立刻引起了媒体的群嘲,下面的截图展现了各大媒体疯狂吐槽的热闹景象。
即便是强如OpenAI,也堵不住SearchGPT的胡说八道。官方演示视频里,在回答某音乐节的相关问题时,SearchGPT给出了错误的购票日期,OpenAI官方已承认了这个错误,并表示“这只是初始的原型,我们会不断改进。”
业界领头羊尚且如此,国内众多AI搜索更不用说。往往只需要略施小计,就能让AI搜索犯错。
《真故研究室》在测试天工AI搜索时中,故意把美国畅销小说作家史蒂芬・金的国籍说成英国,天工AI便不假思索给史蒂芬・金办了移民。
而昆仑万维董事长兼CEO方汉就在前不久的一次访谈中直言不讳称:“我认为 AI 搜索首先是没有幻觉问题的,因为从技术原理上来说,它是先搜索再总结,然后再通过智能体去处理。在这个流程过程中,我们从源头杜绝了这个欺诈的问题。”
但是,他旗下的天工AI搜索,却在显著位置标注了“内容由AI生成,不能保证真实”的字样。
AI搜索的很多错误,有的很明显,但最糟糕的是有的深埋在文案中,防不胜防。
《真故研究室》在百度上随意搜了一个词条,看似没有问题,但AI答案说梅西获得了七次金球奖,事实上梅西2023年获得了第八座金球奖。
AI搜索界的头号种子选手 Perplexity,胡说八道的概率也不低。在《真故研究室》提出的一个问题里,它连普通人百度一下就能搜到的百度财报数据也无法提供。
美国科技杂志《连线》(Wired)也进行了测试,也发现Perplexity是说谎惯犯。
记者临时新建了一个网页,上面只有一句话「我是《连线》杂志记者」,然后让Perplexity总结网页内容。
结果Perplexity“脑洞大开”,直接编了一个童话故事。此外,针对各类新闻事件,Perplexity也常常张冠李戴无中生有,比如让一名加州警察蒙冤犯了罪,给人物编造直接引语等等。
统计学的结果,也与经验相吻合。一篇论文发现,AI搜索看上去富含信息量,但常常掺杂没有论据的观点和不正确的引用。在Perplexity等AI搜索中,AI生成的论点,仅有51.5%有参考链接支持,援引的参考链接,只有74.5%支持其论点。
也就是说,AI搜索结果的正确性,充其量也就5到7成而已。你搜索十次,可能有五次的结果都有问题。这么高的错误率,让人不得不挨个点击链接,复查结果的准确性。但我既然都要一个个点开链接了,跟传统的搜索又有什么区别呢。
02
幻觉是大语言模型的劣根性
AI搜索产生的错误,在业内被称为“幻觉”。幻觉是大语言模型的劣根性,就像说谎是男人的劣根性,甚至有学者和业内人士悲观地表示,或许大模型永远也解决不了幻觉问题。
这与大语言模型的原理有关。大模型并不理解人类和事物,它的核心运行法则是通过预测下一个字词的出现概率而生成文本。
直白点说,大模型就是台概率机器,并不关注真相或事实,本质上是一只模仿能力极强的鹦鹉,可以模仿人类的说话方式,但并不理解人类说的是什么。
正如知识计算引擎Wolfram Alpha的主要设计师、科学家斯蒂芬・沃尔夫拉姆所言,大语言模型本质上是就文本生成“合理的延续”,所谓“合理”是指,“人们在看到诸如数十亿个网页上的内容后,可能期待别人会这样写”,而不是事实,就像很多人只是想活成别人期待的样子,但那并不一定是真实的自己。
为了解决大模型“幻觉”,AI搜索引入了检索增强生成(Retrieval-augmented Generation,简称RAG)技术:在回答问题之前,先从网络或资料库检索相关信息,然后结合检索到的信息生成文本,提高内容的准确性。
这样的手段确实可以一定程度上减轻大语言模型的幻觉,但效果并没有传说中的那么好。比如有研究发现,即使是接入了计算引擎 Wolfram Alpha,ChatGPT的数学能力也只是稍微增强,出错依然是常态;ChatGPT在使用接入了医学资料库后,还是常常捏造信息。
从某种程度上,RAG反而增加了人类辨别真伪的难度。接入数据库,只是让大模型看起来更专业,模仿得更像数据库里的内容。
RAG加持的AI搜索,还面临一个要命的问题,无法辨别信源的优劣真伪。
谷歌的AI Overviews之所以出现这么多啼笑皆非的答案,一部分原因就是分不清来源的真假,比如谷歌AI让网友用胶水涂在披萨上的建议,就是从10多年前美国贴吧Reddit上的一则评论学来的,那条评论显然是在开玩笑。
不仅无法判定真伪,AI搜索甚至无法判定信息源是不是AI内容。
有人做了一个实验,从Perplexity的推荐条目、旅游、科技AI三个领域各抽取五条搜索提示词,每次输入搜索提示词后,就点击“相关推荐”栏的内容,直到参考链接里出现AI文章为止。结果是:在科技AI领域,只需要一次搜索就准能碰到参考链接出现AI文章,其他两类普遍也是在1到3次就会出现引用AI文章的情况。
用AI文章,生成AI答案,AI形成了自产自销的内容闭环。《福布斯》杂志不客气地将这种现象称为“垃圾进,垃圾出”(Garbage In, Garbage Out)。
03
先驯服大模型这头吞金兽
大模型是头吞金兽,已经是业内的共识。挑战传统搜索,得先把自己的成本打下来。
谷歌母公司Alphabet的董事会主席约翰・轩尼诗在去年初表示,大语言模型每一次互动的成本可能比传统搜索要高10倍。
摩根士丹利的分析师估计,如果AI为谷歌50%的搜索关键词生成50字的答案,每年可能会让谷歌多付出60亿美元的成本。
有数据显示,传统搜索的成本是0.2美分左右。OpenAI的CEO山姆·阿尔特曼2022年底曾在社交网站X上透露,ChatGPT平均每次对话的计算成本在10美分以内。也有数据表明,AI搜索成本介于3至30美分之间。
成本高可能是谷歌和百度在AI搜索上步子不敢迈得太大的原因之一,另一个原因是传统搜索引擎赚钱太容易了,轻易不敢让商业化前景并不明朗的AI搜索,影响主业的收入。
搜索引擎带来的广告收入始终是两大搜索巨头的主要收入来源。广告占谷歌总收入的一半以上;近年来迟迟没找到第二曲线的百度则更高,2024年第一季度的在线营销(基本可等同于搜索引擎广告)收入占其核心收入达71%。
所以,谷歌直到今年5月才正式在搜索中加入生成式AI,起初官宣的范围是15%的搜索结果,但到了7月,下降到了7%。
大洋这一侧的百度也差不多,虽然在2023年的百度世界大会上,李彦宏高调喊出“百度新搜索”,但实际落地则保守很多。
“百度新搜索”并没有在百度APP中大规模上线。可能是为了配合老板的PR,百度业务部门只在旗下的“简单搜索”App上推出了完整功能。
“简单搜索”是无广告版百度搜索,使用量级很小,除了大会宣传期外,“简单搜索”鲜少出现在百度的官方传播物料里。
这说明,在没有找到合适的商业化路径之前,百度不敢破釜沉舟,砸掉自己本就日益缩小的饭碗。因此,百度的AI搜索,也主要是在搜索结果的首条加入生成式AI。
近期百度还推出了聊天模式的AI助手,但只是作为百度搜索的补充,在不破坏基本的商业模式下,有限地尝试。
在今年一季度的财报电话会上,李彦宏表示:“大约11%的搜索结果是利用生成式人工智能技术来推算的,但我们目前还没有对这部分生成式人工智能的结果进行商业变现,所以相关营收的对应增长要等一段时间。”
04
AI搜索,不能只用爱发电
传统的搜索引擎是台印钞机,商业模式简单却高效,搜索引擎通过关键词,列出一条条网站链接,网站通过用户的点击获得流量收入,搜索引擎通过展示广告赚钱,双方互相成就。
但AI搜索打破了这个利益链条。借用Perplexity的官方话术,AI搜索与其说是“搜索引擎”,不如说是“答案引擎”,是“维基百科和ChatGPT生的孩子”,免去了点开链接的烦恼,直接生成答案,把饭喂到用户嘴边。原本站在C位的链接们,只能作为注脚,出现在不起眼的角落里。大部分链接甚至连注脚也挤不进去。
答案引擎只给答案,而不是列出链接,相当于把所有的流量截留在自己的界面。用户是方便了,但那些靠搜索引擎流量过活的网站,一下子被断了生路。
但AI搜索生成的内容,却恰恰来自被剥夺了流量的网站。你用着我的内容,还夺走了我的流量,这谁受得了。
据报道,美国已经有88%的顶尖新闻机构禁止AI爬虫爬取网站内容。美国贴吧Reddit,已经在加强措施限制各类大模型的爬虫爬取自己的公开内容。
对于AI搜索,他们也是加倍防范。《福布斯》、《连线》等新闻机构发现,Perplexity在搜索的时候,会偷偷绕过付费墙,抓取只有付费会员才能看到的内容,而且还剽窃记者辛辛苦苦花了几个月写成的文章。
Perplexity这种违反了无视网络爬虫排除标准(Robots Exclusion Protocol)的行为,引发了多家媒体机构的不满。《福布斯》已经向Perplexity发函,要求Perplexity删除相关内容,并赔偿福布斯损失的收益。
AI搜索打破了网站与搜索引擎之间的互惠互利,但还未建立新的商业模式。
AI搜索商业化的艰难,还体现在整个市场的变化上。投资者从OpenAI刚刚推出的兴奋,慢慢回归冷静,甚至开始失去耐心。
高盛收集了一波可能因AI而受益的公司股票,组成股票指数,发现自2022年底以来,这些公司的股价并没有跑赢标普500指数。这说明整个投资市场,并没有太看好AI的商业前景。
所以,现在AI搜索能否取代还言之过早。事实上,很多业内人士都认为,两者的关系是互补,而非取代。
AI搜索更容易满足在特定细分领域的搜索需求,比如知识类的分析与调查。而很多搜索行为,并不只是为了研究“第二次世界大战爆发的原因”,可能只是想通过搜索去另一个网址,或者获得两三句话就能讲清楚的简单信息,不需要附着十几条参考链接的长篇大论,在这些方面,传统引擎显然更合适。
至少到目前为止,这股淘金热,还没出现赢家,最大的受益者,反而是卖铲子的英伟达。
横店,到底相不相信AI?
*免责声明:本文章为作者独立观点,不代表i黑马立场。
加入科技交流群
↓↓↓
加入“AI应用伙伴计划”
成为 AI 产业新力量
立即报名
↓↓↓
联系我们
转载开白或商务合作:15222191516
与主编交流沟通:chenfu3721
i黑马,创业黑马旗下媒体,让创业者不再孤独。