当前位置:首页|资讯|百度|搜索引擎|文心一言

中国搜索等到一个新故事

作者:昆仑万维集团发布时间:2024-05-14

原标题:中国搜索等到一个新故事

AI的春天,搜索战火重燃。

AI芯片巨头黄仁勋偏爱哪款搜索引擎?答案不是谷歌,也不是必应。

“我一般用Perplexity,且几乎每天在用。”近期,英伟达黄仁勋接受媒体采访时,给出了出人意料的答案。

主打AI搜索的Perplexity,是2023年搜索赛道最为炙手可热的“黑马”。不仅黄仁勋对其青睐有加,Perplexity成立一年半以来,其MAU已经达到了1000万。2024年开年,这家年轻的创业公司一举拿下7360万美元的融资,投资者包括IVP、亚马逊创始人杰夫·贝索斯,以及英伟达。

截至目前,Perplexity 的累计融资额超过了1亿美元,估值更是高达5.2亿美元,创下了近年搜索领域初创公司的融资金额纪录。不少网友在Perplexity CEO的推特下评论:

“干翻谷歌!”

就像在平静多年的水面,投下了一颗石子——谷歌、百度等巨头瓜分搜索赛道的格局,固化已久,Perplexity的全球瞩目,出人意料,却也在情理之中,

让一切变合理的,来源于重塑搜索赛道的一项技术:AI。

在AI的助推下,如今的搜索赛道重燃战火。从2022年11月ChatGPT发布以来,国内外巨头动作频频——在国外,微软Bing火速接入了ChatGPT,而谷歌也不甘示弱,在几乎同时期推出了Bard。在国内,百度将AI视为重返互联网第一梯队的关键,立下研发文心一言的军令状,并且接入了百度搜索。

传统搜索时代的老兵,也重新回到舞台中央。事实上,推出中国市场的第一款AI搜索不是百度、不是搜狗、不是360、甚至不是Bing中国,而是昆仑万维。早在2023年8月23日,昆仑万维就推出了国内第一款AI搜索产品“天工AI搜索”。

中国最早一批浏览器3721和360的缔造者,周鸿祎,携着360 AI搜索,在2024年开年回到老本行。搜狗的创始人王小川,带着50人的精锐部队,在一年间做出了一家AI独角兽“百川智能”。

不少搜索老兵站在如今的AI风口中,多少都会和王小川感同身受:“我问ChatGPT一个问题,里面很多有歧义的、复杂的语法,它能读懂你在问什么,完全知道你说的内容,你还能追问——对做搜索的人来说,这就是基础技术的突破,到了一个实用阶段。”

而中国的搜索赛道,等来AI的春风,用了几近7年的时光。

中国搜索,需要一个新故事

2004年春天,一群来自谷歌的小分队来到中国,带头人是时任全球公共政策主管的安德鲁·麦克劳林。他们此行的目的,是考察谷歌是否能在北京设立一个工程中心。

中国市场的潜力,谷歌早已目睹。2000年,谷歌搜索中文版一经推出,就快速收获了25%的市场份额。2002年9月,有了政策解禁的助推,吃下中国市场这一目标才正式提上谷歌的日程。

此时的中国搜索,群雄盘踞,大战一触即发:前有周鸿祎创立的3721,以开创“弹窗广告”的盈利先河加入搜索混战;后有雅虎手握电邮、搜索全力本地化,市场份额一度全面领先;中间夹着谷歌中国日后最大的敌人,百度,和它的“竞价排名”。

企业们为了自己的名字能出现在搜索结果中,心甘情愿付出金钱的代价。2003年百度一跃成为中国第一大中文搜索引擎。

谷歌坐不住了。

2005年,谷歌用一个篮球、一把椅子、一个印有谷歌Logo的投币口香糖机,请来了时任微软中国研究院院长、全球副总裁的李开复,全面狠抓中文短板。2007年,谷歌的中国网页索引数量暴增一倍,并获得ICP牌照,域名为google.cn的服务器进入了中国;2009年,谷歌搜索的中文市场份额从2006年的16.1%提高到了31.0%。

百度也不甘示弱。彼时的百度,已经有了MP3、图片、新闻、贴吧等一系列围绕搜索的产品矩阵,2004年更是通过收购hao123获取了大量流量。2009年,在谷歌好不容易超越雅虎,坐上第二的位置时,百度已经以63.1%的市场份额遥遥领先。

这场鏖战的结局,大家也都有目共睹——2010年2月23日,谷歌宣布退出中国内地市场。

很多人将谷歌的落败,归结为李开复的离职和信息监管的收紧,但谷歌在中国市场的绊脚石,恰恰与其开创先河的搜索算法PageRank息息相关。

PageRank靠关键词匹配程度成列搜索结果,这项技术基于一种朴素的思想:被用户访问越多的网页,质量就可能越高。这也意味着PageRank显灵的程度,极其依赖于靠先发优势,培养出的用户黏性——使用搜索的用户越多,PageRank越精准。

进入中国,谷歌已经晚了百度整整5年。即便后续奋起直追,胜负似乎在起跑线上,就已经写好了结局。

同样的结局,在随后试图对百度发起攻顶之战的搜索公司上重复上演。

2012年,“3SB大战”(360、搜狗、百度)打响,周鸿祎、王小川对百度搜索发起了猛烈的攻势,竟在短时间内拿下了超过十分之一的市场份额,几乎就在一夜之间冲到全国第二。

然而,搜索公司们像西西弗斯一般不断推动攻顶的滚石,但又一次次落败。在PageRank技术思维的主导下,百度一家独大的市场格局固化至今。

竞争格局的固化,意味着行业走向成熟,却也意味着衰老、陈旧、难以自我颠覆。

自2015年起,百度的收入逐渐呈下降趋势,2016年的增速更是从近40%骤降至6%,暴露出竞价排名广告的重大缺陷。2021年9月,腾讯完成对搜狗的全资收购。在此期间,微信、微博、今日头条、抖音、快手、小红书等陆续崛起,越来越多互联网生态不再与百度PageRank兼容。

用户逐渐发现,在搜索引擎上越来越难找到想要的内容,“想要的找不到,找到的是广告”。

“3SB大战”后的十一年里,搜索引擎行业如有如陷入僵局,没有硝烟,没有革命,也没有新故事。

问题出在什么地方?

向来如此,便对吗?

搜索引擎赛道之所以陷入多年的僵局,其核心逻辑在于,搜索引擎作为信息门户,需要不断汲取大量数据来提升搜索结果的质量,再通过PageRank体系向用户罗列呈现。多年的先发优势往往能为用户留存构起一道高墙。

高墙之下,就是竞价排名广告的主场。

一直以来,无论是先发玩家还是后来的挑战者,沿用的都是PageRank这套思路。

但向来如此,便对吗?

以PageRank为主流技术范式的传统搜索,解决的是搜索“从0到1”的问题。其针对的痛点,是在一个信息获取渠道稀缺的时代,用户从“找不到信息”,到“能找到信息”的问题。

但在这个信息爆炸的时代,它绝不是搜索的最佳故事版本。

网络技术、通信技术的普及,让互联网信息爆炸式增长。据国家互联网信息办公室统计,自2012年12月至2023年6月,中国网民规模从5.64亿增加到了10.79亿,互联网普及率从42.1%提升至76.4%。据IDC预测,2025年,全世界每个网民平均一天将有4909次数据互动,相当于每18秒产生一次。

用户的痛点,已经从找不到信息,变为了信息过载;用户对搜索引擎的需求,也从暴力罗列搜索结果,变为了精准定位最佳答案。

然而,在以“关键词”主导的PageRank搜索范式下,用户接触到的是含有大量广告竞价内容的搜索结果。

2018年,新华社记者在调查中发现,在不少搜索引擎中输入关键词“头痛”和“骨髓瘤”,被置顶在搜索结果前列的网页,通向的是标着“饿死肿瘤”“不化疗”等宣传字眼的“专科医院”和“新型疗法”。只有仔细观察,才能看到这些链接的浅灰色底色——这是专属于广告的区分标志。

与此同时,另一记重压,则来自信息提供方。

人人都想做生态,面对增长的瓶颈,微信、微博、抖音、小红书等新兴平台纷纷构筑信息墙,建立自己的流量池。2020年,抖音直播全面封杀了第三方的平台链接。更早之前,微信也关闭了直接跳转到淘宝等平台的通道。

信息的高墙,让部分搜索引擎抓取不到小红书、知乎、微博、抖音上的内容。但这些平台,恰恰是当代UGC的主要信息来源。

如此种种,传统搜索范式导致的结果是:搜出来的信息一大堆,但找不到有用的东西。

英国作家尼尔·盖曼认为:“谷歌可以给你10万个答案,但是一个图书管理员可以给你最为精准的答案。”

AI大模型,正是大众苦苦等待的那个“赛博图书管理员”。

AI的春天,搜索战火重燃

在太平洋东岸,一场风暴正在悄然酝酿。

2022年11月30日,一条名为“OpenAI”的鲶鱼,带着名为ChatGPT的AI大语言模型,跃入了时代的洪流,几乎瞬间引发了全球轰动。

上线仅两个月,ChatGPT的月活用户就突破上亿——达到上亿的月活,Tik Tok用了整整九个月,抖音用了近两年。令人咋舌的,还有ChatGPT的商业化潜力,付费功能开启短短五天,付费用户也破了百万。几乎整个世界都意识到,一个全新的人工智能时代到来了。

但深耕科技赛道的“老兵”们,更早地预见到了这一时刻。

两年半前的2020年3月,在ChatGPT的上一代大模型GPT-3之际,昆仑万维创始人周亚辉就开始密切地追踪大模型技术。

“当时是极客的朋友圈有人转GPT-3比GPT-2有个很大的飞跃,那个时候感觉到GPT有可能真正的能实现通用人工智能。”周亚辉曾在媒体采访中透露。

凭借敏锐的技术嗅觉,周亚辉立刻判断,人工智能将掀起一场极大的产业变革。

昆仑万维是科技互联网行业的“老兵”了。这是一家成立于2008年,业务覆盖全球一百多个国家和地区,全球平均月活跃用户近4亿,手握AGI与AIGC、信息分发、社交娱乐及游戏等大量应用场景的上市公司,也是中国科技企业出海的先行玩家。

从2016年起,昆仑万维就拥有一支AI算法团队——来自Opera News

昆仑万维2016年从挪威收购浏览器Opera时,浏览器引擎早已在发达市场卷成了红海。昆仑万维的决策是:果断战略性放弃中国市场,去遥远的非洲和东南亚等新兴市场拓荒。

这一战略经受住了时间的考验。推荐算法,对非洲这类新兴市场而言仍然是新事物。短短两年间,基于Opera的两款产品Opera News和游戏浏览器Opera GX,风靡海外——前者完全由AI算法驱动,自然语言处理(NLP)技术是其最核心的能力,一跃成为非洲最大的新闻阅读浏览器,爬到了谷歌新闻品类的Top3;作为游戏浏览器的后者,PC端MAU达到了1100万。2018年7月,Opera以7亿美元的市值,重新回到公开市场。2024年3月,Opera的市值已经再度冲到14.3亿美元,其2023年Q4的月活跃用户达到3.13亿。

自Opera News上线至今,昆仑万维的技术团队被磨砺成了经验丰富的搜索专家。预训练数据收集、清洗、深度加工等技术能力已经不在话下,团队开始研究如何确保信息的真实性,比如对各种信息源网站进行打分。对于如何进行信息推送、如何调整内容以适应国内用户、如何避免信息茧房等问题,团队也已经有了经验和对策。

2023年11月,ChatGPT的一炮走红,昆仑万维此前在人工智能算法、数据、产品上的所有积累,就像是前进路上无数个“点”,终于在此刻连成了“线”,通向一个人工智能的未来。

爆发在一夕之间。2023年4月,昆仑万维的首个自研大语言模型“天工”上线。有了强大的基座,2023年8月,昆仑万维推出国内第一款AI搜索引擎“天工AI搜索”,成为中国AI搜索鼻祖。几个月乃至半年后,百度、360等也陆续进军这一赛道。

同时,昆仑万维发布公告称,公司将全面“All in AIGC与AGI”,并长期储备至少10亿美元以上的资金,支持公司AGI和AIGC业务长期健康发展。2023年8月,周亚辉更是找来了在计算机视觉和机器学习领域有着全球影响力的科学家颜水成,担任天工智能联席CEO,并兼任昆仑万维2050全球研究院院长。

昆仑万维天工AI搜索网页版

就像伙伴一样,天工AI搜索给出的,是经过逻辑归纳整理的内容,每个回答均附带了可溯源的信息链接。相较于传统搜索引擎,AI引擎变得更懂、且更像人类,用户在搜索的过程中,还能获得愈发个性化的回复。

发力做AI搜索,并不是昆仑万维一拍脑袋的决定。昆仑万维董事长兼CEO方汉表示,这是来源于用户的需求。他发现,使用PageRank范式下的传统搜索引擎,用户还需要从不同网页中自己提炼总结信息,这个过程需要耗时3-10分钟,而大模型,可以将时间压缩到5-10秒。

“我们认为,这就是所有用户的痛点,更快即更好。”方汉表示。天工AI搜索也很快明确了自己的产品定位:从寻找内容,到获取答案;从信息,到知识;从模糊到精确;从通用到个性;从鱼龙混杂,到可追溯可信赖。

此后,国内AI搜索市场也涌现了众多类似的产品:2个月后,百度将旗下的简单搜索升级为AI互动式搜索引擎,在搜索页面内置文心一言大模型技术;5个月后,360在多个安卓应用商店上线了大模型搜索产品“360 AI搜索”。

AI为搜索带来的,不仅仅是人机交互方式的跃升,也是对长期以来竞价排名造成的行业沉疴。上至“莆田医院”,下至标题党的文字游戏,竞价排名正在逐步摧毁用户对搜索引擎的信任。但对传统搜索厂商而言,广告竞价又是难戒的罂粟——根据贝哲斯咨询的数据,2022年,全球实时竞价广告平台的市场容量就达到了442.26亿元。

而AI搜索愈好用,留给竞价广告的空间就会越少。

作为搜索行业的新玩家,天工AI搜索没有采取竞价广告的模式,用户看到的,是“干净版”的搜索结果。方汉对36氪总结:“天工AI搜索没有广告竞价的包袱。”

一个AGI的新未来

在AI的加持下,搜索市场战火重燃。

2023年9月,“淘宝问问”上线淘宝内测。12月,抖音也在App内测试了名为“AI搜”的智能搜索功能,而2024年初,周鸿祎推出“360 AI搜索”。

开源生态的蓬勃、模型技术的跃升,也为搜索赛道带来了一波新玩家。2024年初,前阿里CTO贾扬清的团队,仅仅用了500行的代码和一个周末的时间,搭建了开源AI搜索引擎Lepton Search,迅速登顶Github趋势榜。谈及上线Lepton Search的目的,贾扬清表示,他们想向开发者展示“天下没有难构建的AI应用”。

而在国外,“在AI搜索赛道诞生一个新的谷歌”的故事,更是为人津津乐道。文前提到的明星创业项目Perplexity在硅谷掀起一阵AI搜索热潮,Perplexity CEO Aravind Srinivas更是在X上公开叫板谷歌:“Yahoo—→Google—→Perplexity”。

AI搜索落地的场景在变广,搜索的形式,也从传统的“关键词”,朝着更广阔的交互方式延伸。

大模型对语言,甚至是多模态理解能力的跃升,让用户用一句话、一张图、一段语音就能搜到想要的结果——这让搜索行业,第一次沐浴到AGI(通用人工智能)的曙光。

天工AI搜索上线后,不少用户发现,搜索引擎开始理解诸如“为什么一天只有24小时”的开放式问题,也能支持图像和语音输入,甚至还能担任Agent的角色,为用户规划行程、制定方案、制作攻略。

而政策的东风,也已吹进“AI+搜索”的牌局。2023年北京市经济和信息化局发布了《2022年北京人工智能产业发展白皮书》。其中指出,北京将支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。今年政府工作报告,两度提及“人工智能”。

或许用Perplexity CEO Aravind Srinivas的一段话,能够概括AI对搜索赛道的意义:

“我们的存在,是为了改进搜索,通过更少的关键字查询、更少的筛选、链接点击、页面查看来提高信息访问的效率,直接追根究底,给出简洁明了的个性化答案。这与谷歌的财务和业务目标不符。”

“这也是其他人能够从白纸开始重新思考产品和业务的机会。”Aravind Srinivas最后总结。

本文转载自36氪

●「天工大模型3.0」4月17日正式发布

●「天工2.0」MoE大模型发布

● 昆仑万维荣膺量子位「2023人工智能年度评选」两项大奖

●昆仑万维入选甲子光年2023中国AI大模型领域最具商业潜力榜

●昆仑万维荣膺金牛奖最具投资价值上市公司和ESG科技引领50强两项大奖

● 昆仑万维开源「天工」Skywork-13B系列大模型,0门槛商用

● 昆仑万维天工通用大模型推理能力大幅超过GPT-3.5和LLaMA2,达到全球领先水平

●用大模型重塑搜索 昆仑万维发布国内第一款AI搜索产品


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1