当前位置:首页|资讯|ChatGPT|百度

搜索“蝶变”

作者:经理人杂志发布时间:2023-07-25

原标题:搜索“蝶变”

在算法不断优化、大数据技术持续迭代的加持下,传统搜索引擎稳步前进。而AI场景应用的创新、搜索功能及服务的拓展,为搜索引擎提供了新的重大机遇。

国际大型科技公司作为变革的发起者,希望通过AI翻开搜索的新序曲。微软CEO萨蒂亚·纳德拉(Satya Nadella)表示,“我们正在着手重塑地球上最大的软件类别:搜索”。谷歌CEO桑达尔·皮查伊(Sundar Pichai)则判断:“对谷歌来说,现在我们正面临着最激动人心的时刻:一个能够深度改善谷歌用户体验的良机正摆在我们眼前,对此我深信不疑。”

而在这个搜索“蝶变”的重要时刻,中国的搜索引擎行业不仅面临着复杂的市场变化,对所有业内玩家也提出了更高的要求。

“我们几乎在业务的各个方面都面临激烈竞争。”在2022年度报告中,百度直言不讳当前所面临的竞争态势。时至今日,百度尚端坐搜索业务“铁王座”,但群雄正在虎视眈眈。那么,在老将新秀共存的中国搜索行业,正在面临怎样的挑战?在生成式AI技术正在成为未来搜索引擎竞争的一大变量的行业共识下,中国搜索企业又该何去何从?

科技浪潮从不等人,而在这个被称作“AI的IPhone时刻”,中国搜索企业应当勇敢拥抱变化。

来源 | 经理人传媒旗下《经理人》杂志

策划:本刊编辑部

研究/执笔:谭晓影 李启辉 季生

中国搜索引擎王座易主?

流量监测公司StatCounter数据显示,在中国内地桌面搜索市场上,到2023年4月,微软必应的份额再次创出历史新高,达到了37.4%,取代百度(09888.HK)成为中国第一大桌面搜索引擎。StatCounter是一个网站流量分析工具,主要提供网页浏览器的使用分布的讯息,曾因数据不实被投诉和诟病。那么此次的数据真实性如何?

经过更为细致的数据筛查和对比,发现这其实是一场乌龙。从数据统计模式来看,它是依靠在众多站点、博客当中抓取数据来实现的,但国内目前很多内容APP与平台都拒绝搜索引擎的索引,比如微信公众号。因此,这种数据抓取模式,很容易导致数据失真。

较为权威的数据佐证有两个,海外知名流量监测网站similarweb的数据显示百度在PC端的搜索份额是微软必应的4倍。而根据央视市场研究(CTR)在2023年4月的检查调研,百度在传统搜索引擎全端(PC端+移动端)月活用户行业渗透率高达96.3%。(如图1)

尽管StatCounter的数据有误,但百度搜索市场份额正在下滑的趋势是确定的。从传统搜索引擎行业的行业渗透率来看,百度搜索依旧全端口位居行业第一,但百度“赢家通吃”的局面悄然改变。

“我们几乎在业务的各个方面都面临激烈竞争。”在2022年度报告中,百度直言不讳当前所面临的竞争态势。

除了360、搜狗传统搜索引擎的市场竞争,在逐渐普及的移动端,百度还要面临以神马、夸克等为代表第二梯队的紧追猛赶。神马是阿里在2014年收购UC后,双方在整合“一搜”后,推出的移动搜索引擎。2016年,阿里又上线了“夸克搜索”,借助神马和夸克,阿里在移动端搜索领域不断获得话语权(如图2)。而微软公司于2009年推出了搜索引擎——Bing(必应)。尽管早期被人认为与中国搜索市场“水土不服”,表现也不温不火,但在长久的国内用户体验优化下,并伴随着近期将ChatGPT整合到必应的技术热潮,其日活跃用户已经破亿。

然而,更让百度产生危机感的,还有一批“非典型竞争对手”。2022年微信搜一搜月活跃用户已达8亿,搜索量较上一年同比增长54%。作为微信生态各内容板块的“连接器”,搜一搜不断开放更加多元的搜索场景,目前已成为微信助力内容创作与运营的重要工具。不仅如此,近些年信息流和短视频领域异军突起的字节跳动,在搜索领域也动作频繁,其搜索业务也形成了由“头条搜索+抖音搜索+悟空搜索”组成的三驾马车。还有一个最近备受人们关注的平台——小红书。把小红书当搜索引擎来用,已经成为众多用户的共识。援引小红书后台数据,称打开小红书的用户中,超过八成都选择使用了搜索功能。

细数中国互联网近二十年中,百度在搜索业务上所面对的诸多对手,从初期与国际巨头谷歌的分庭抗礼,谷歌退出竞争后,到与后来者360、搜狗争夺搜索业务,再到互联网新兴势力——字节系产品、小红书等的崛起冲击商业化业务,以及夸克等新锐势力在移动端不断发力,百度始终不缺对手。尽管在数据库信息量上,新老搜索品牌和百度之间,尚存在无法弥合的差距,尤其是小红书、抖音的搜索更多是为内部商业化服务,但这样的“围猎”之下,也足以让百度压力倍增。

那么,在老将新秀共存的中国搜索行业,正在面临怎样的挑战?在生成式AI技术正在成为未来搜索引擎行业竞争的一大变量的行业共识中,中国搜索企业又该何去何从?

搜索业务多挑战

  • 信息孤岛困境

搜索业务高度依赖用户及流量,“任何流量下降均可能削弱我们的品牌,导致用户及客户流失”百度在财报中的这句话适用于每一个搜索品牌。移动互联网时代,对用户的争夺越发激烈。在数据垄断的分割下,用户被希望直接在各自App之内完成行为闭环,这就形成搜索领域的“信息孤岛困境”。

实际上,小红书、微信搜一搜、抖音搜索等并非严格意义上的“搜索引擎”,但当人们发现仅靠百度等传统搜索引擎并不能解决生活中遇到的大多数问题的时候,反而在这些平台上发现了自己的想要的答案,不仅如此,还给出了实用建议、详尽的操作指南,且时效性很强。

这种“群雄割据”的局面,是各大互联网平台意图与传统搜索引擎“脱钩”,从而实现留存用户的目的。但从结果来看,并不能满足用户普遍的搜索需求,各个搜索品牌将新增的互联网内容被“锁死”在各自的App里,使得越来越强化其在某一领域的功能作用。这也一定程度上增加了用户想要获取答案的流程和时间,面对某一具体的问题,用户还要思索在哪里能得到更有“针对性”的答案。

  • 优质内容竞争加剧

对于致力于构建内容生态的中国互联网企业来说,内容生产者尚且需要吸引与培养,优质内容更是一场持久的争夺战。毕竟,具备优秀的内容产出能力和生态服务能力的企业,才能在当前“信息孤岛”环境下培养出更高的用户粘性,从而持续发展业务、产生更大的商业价值。

百度的内容生态系统包括为合作伙伴开发的产品,例如百家号、智能小程序、托管页、百度联盟,以及内部开发的内容与服务产品,例如百度知道、百度百科、百度健康、百度文库、百度经验、百度贴吧、好看视频及爱奇艺。尽管百度已经建立了较为全面的内容生态系统,但是,倘若没有持续的优质内容生产力,其内容产品对用户的吸引力将会快速下滑。毕竟,从用户搜索使用目的上来看,工作学习搜集信息、材料需要是用户在PC端/移动端搜索的首要共性目的。(如图表3)

在各平台形式各异的“创作者激励”计划下,优质内容竞争日益加剧,而创作者则深陷“数据焦虑”困境。因为流量和变现当前创作者普遍面临的两个核心问题,哪个平台能够为创作者提供良好的创作环境和收入,就能够激励持续创作,并产生优秀创作者的“虹吸效应”。

在内容产出能力上,百度决定在现有的内容生态系统上,增加AIGC(AI Generated Content,即人工智能生成内容,又称“生成式AI”)的技术助力。5月25日,2023万象·百度移动生态大会。百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰表示:“我们要让AI走下技术的‘神坛’,深入应用的‘土壤’”。据悉,2022年万象大会上,百度推出“创作者AI助理团”,至今已有45万创作者使用,产出超700万篇内容,累计分发量超过200亿。

作为微信生态各内容板块的“连接器”,搜一搜目前已成为助力内容创作与运营的重要工具。今年微信上线问一问功能,通过定向邀请优质内容创作者参与问题回答,更是直指提升其优质内容生产力的聚合力。

目前,在搜索领域,BAT等在内的头部企业都在抢夺内容生产者;而字节跳动、小红书等互联网新秀除了吸引创作者外,还在积极完善搜索工具,优化搜索体验。

  • 在线营销服务生变

2001年9月,百度首次推出了面向终端网民的搜索服务,同时也推出了一种国外搜索引擎商普遍采用的盈利模式——竞价排名服务,这也为当时搜索引擎服务补齐了只赔不赚的盈利短板。

关键词搜索集中在民生密切相关的旅游、医疗、养生保健、金融、理财等领域。根据用户的使用习惯和心理,在搜索引擎中排名越靠前的网站,被点击的几率就越大。在竞价排名服务下,用户不得不心生警惕,搜索界面中排在前面的,究竟是广告(竞价排名),还是搜索引擎自家的内容?

不仅如此,这还衍生出了新的商机——SEO①,这很大程度上是经营者的一种商业行为,将自己或自己公司的排名前移。在这样的机制下,百度竞价医疗广告所引发的社会讨论与批判,也为百度带来了挥之不去的阴影。

搜索引擎企业既然通过“竞价排名”赚取广告费,就有义务向用户提供安全可靠的搜索引擎服务。如果用户通过“竞价排名”搜索引擎查到虚假信息,导致其财产受到损失,搜索引擎公司应为其提供的虚假信息承担相应责任。尽管近些年政府多次出面整治竞价排名乱象,但不可避免的是广告带来的用户体验下降、用户流失。

一直以来,在线营销服务是百度核心业务的重要支撑。根据百度财报,2022年百度的核心业务收入为954亿元,其中在线营销服务收入为747亿元,占公司总营收的78.3%,而在线营销收入则来自于百度的“搜索广告”。广告是各个平台收入的重要组成部分,分析广告主端口投放决策因素及变化也十分重要。

根据CTR网络调研,从广告主角度来看,“广撒网”的模式早已被“精耕细作”模式所取代,不但多数广告主倾向两端资源同时投放,移动端的广告投放前景被看好,并且广告主也比往年更加注重自身营销的预算压力、平台扶持策略和ROI(投资回报率)。(如图4)

有用户才有流量,有流量才有生意。一直以来百度的营业收入都依赖于在线营销服务,而老将与新秀,尤其移动端的兴盛带动字节系产品的崛起,不仅在搜索业务上向百度发起挑战,更在快速抢夺百度赖以为生的用户和广告主。

  • 网络安全问题警钟长鸣

随意点开的一个网址、注册时填写的手机号、查找和网购的搜索记录等等,用户在互联网的这些操作,都可能埋下信息被泄露的伏笔。

作为中国头部搜索企业,百度更是掌握着海量的用户信息。2018年,百度创始人李彦宏在中国高层发展论坛上针对用户数据隐私的问题表示,“我想中国人可以更加开放,对隐私问题没有那么敏感,如果他们愿意用隐私交换便捷性,很多情况下他们是愿意的。”

随后的几年,科技公司数量增涨,行业的快速发展,人们发现隐私数据被偷窥、分析,然后被推销、骚扰的情况层出不穷。舆论对于李彦宏的那一番话的多次讨论,也验证了用户对于屡屡被侵犯隐私的反感情绪。

2021年11月1日,《个人信息保护法》正式实施,其中对于个人的权利保障范围以及敏感个人信息处理等问题都进行了明确的规定,平台方按监管要求更新了隐私协议、上线“一键关闭个性化推荐”等功能。

中国互联网企业,尤其是搜索企业,日常管理涉及敏感客户数据,更需要回应用户对隐私的保护诉求。从普华永道《2023年全球数字信任洞察调研中国报告》中,用户能够欣慰地看到中国企业大多已经制定管理和治理客户数据的相关政策。(如图5)

普华永道也指出,作为运营的重要组成部分,企业需要确保拥有足够的网络安全韧性来管理突发情况,如果缺乏韧性,网络事件可能会破坏大多数甚至所有的商业成功计划,导致财务损失、名誉损害和信任丧失。

2022年7月21日,国家互联网信息办公室依据《网络安全法》《数据安全法》《个人信息保护法》《行政处罚法》等法律法规,对滴滴全球股份有限公司处80.26亿元罚款。有滴滴的前车之鉴,中国的互联网企业更应该明镜高悬,主动构筑网络安全防线。

行业内外新变量

在由高盛集团和SV Angel在旧金山举办的AI Forward 2023活动上,微软公司联合创始人比尔·盖茨表示,“当前IT技术竞赛的最终赢家是顶级人工智能,它将颠覆搜索引擎、生产力软件和在线购物网站”。

自搜索引擎的底层技术逻辑确定以来,广告逐渐成为相关企业主要的收入来源,但搜索引擎在很长的一段时间缺乏颠覆性的创新。而今,生成式AI技术正在成为未来搜索引擎行业竞争的一大变量。

在人工智能(AI)赛道上,谷歌与微软在开展新一轮竞争。2023年2月7日,微软宣布支持聊天机器人ChatGPT的技术整合到最新版本的必应(Bing)搜索引擎和Edge浏览器中。微软首席执行官萨蒂亚·纳德拉表示,“搜索领域迎来了新的时代”。对于面前在国际搜索市场占据主导地位的谷歌来说,这无异于正面挑战。

随后5月份,竞争态势升级,微软宣布将必应进行功能升级,并全面开放聊天机器人BingChat,支持文生图、图表生成、第三方插件、下载与共享等功能。目前新Bing的日活跃用户已经超过1亿,累计进行了超过5亿次聊天。尽管Bing的用户数量还远低于谷歌,但新Bing的增长态势十分迅猛。

谷歌的动作也很迅速。5月11日,在谷歌I/O开发者大会上,谷歌CEO桑达尔·皮查伊(Sundar Pichai)宣布:“对于生成式AI,我们正以一种大胆而负责任的方式迈出下一步。”谷歌在开发者大会上展示了许多正在研发的人工智能产品,具体到谷歌最为强大的搜索领域,则是搜索生成体验(SGE,Search Generative Experience)。SGE可以理解为是谷歌加入了全新AI功能的新一代搜索引擎,在传统的搜索框中输入问题后,能够回答用户的问题,还可以通过追问,获得更多增量信息。

大模型是当下全球科技创新的焦点,也是全球人工智能竞赛的主战场。无论是升级用户对话体验,还是构建智能化产品生态,从行业发展趋势来看,搜索引擎未来的升级路线将与AI技术息息相关,而由生成式AI的GPT类产品带来的“鲶鱼效应”,也逐渐从国外传导至国内。

目前,百度和阿里先后上线了各自的大规模语言模型“文心一言”和“通义千问”,腾讯、网易、京东也相继公开了自家的大模型产品“混元”、“玉言”和“ChatJD”,而360的大语言模型产品——“智脑”已经开始内测,据创始人周鸿祎介绍,能够实现生成式语言模型+联网搜索,从功能来看,是国内类新Bing产品。

尽管当前国内赛道热闹非凡,但从技术实力上来说,较早布局人工智能这条路的百度,有着一定的领先优势。搜索是百度的传统优势。百度通过搜索技术索引了万亿规模的知识,大语言模型在这些海量知识上每天持续学习、不间断训练、推理、涌现,二者结合实质上建立了一个强大的世界模型。目前,百度文心大模型已经迭代到3.5版本。与3.0版本相比,训练速度提升了2倍,推理速度提升了17倍,模型效果累计提升超过50%,在数据质量、生成效果和内容安全性上,都得到了一定的提升。

百度在3月20日正式发布了文心一言,李彦宏在发布会上承认文心一言并不完美。首先,文心一言和GPT-4相比,仍有一定的技术差距。其次,从ChatGPT的使用体验来看,当前的生成式AI技术有着十分明显的缺点。比如最被人诟病的是,它参考的源信息质量缺乏保障,有大量UGC(普通用户生产的内容)和未经权威认证的内容。除此之外,也有人为诱导AI生成不良内容、放大歧视与偏见的有害信息的负面案例。因此,技术风险的防范和管理,对于各大科技企业来说依旧“任重道远”。

在这一层面,百度认为,人工智能大模型带来的治理挑战也不容忽视。新技术应用往往先于规范,而建立健全保障人工智能健康发展的法律法规、制度体系、伦理道德,才能营造良好的创新生态。着眼未来,在重视防范风险的同时,也应同步建立容错、纠错机制,努力实现规范与发展的动态平衡。

面对AI发展可能带来的一些列问题,政府也加大了监管力度。为促进生成式人工智能技术健康发展和规范应用,网信办在2023年4月11日发布了《生成式人工智能服务管理办法(征求意见稿)》。

英文大模型的训练背后,考验的是企业在算法、数据、框架、资源调度等全栈和全流程的综合能力。尽管百度在搜索业务上有着多年的积淀,但是做出中文大模型的难度也许更高,首先是在当前中文互联网中一座座信息孤岛为大模型训练增设了门槛,其次,中文对上下文语境理解要求更高。当前国内一众互联网企业对大规模语言模型产生了前所未有的热情,因为前沿科技带来的影响往往是颠覆性的,但是在那之前,国内的企业还需要更为开放的态度,以及漫长时间的试错与积累。

将生成式AI技术嵌入搜索引擎,从而实现广泛的、应用级别的落地场景,可以说是AI技术摆脱产业化困境一大进步。今年年初国内互联网环境对ChatGPT的讨论热潮,也折射出中国科技企业的普遍焦虑。5月下旬,阿里巴巴创始人马云召集淘天集团各业务负责人开展沟通会,他认为,一个企业从行业标杆到死亡,半年到一年就足够了,在互联网行业这个速度可能会更快。

在过往研究中,埃森哲根据受访者的回应,以及经外部验证的财务绩效数据加以综合分析,将企业运营成熟度划分成四个级别:稳定级、高效级、预测级和未来级。伴随着中国互联网发展进程,中国科技企业逐渐壮大成长,但能够称为“未来级”企业还寥寥无几。面对搜索行业内外的新变量,国内的搜索品牌可以从技术、流程、数据、人才等方面进行多维度升级,向“未来级”企业不断靠拢(如图6)。

技术杠杆包括实现自动化、采用新的技术解决方案、以及业务部门与IT部门之间的通力协作。在提升运营成熟度初期,技术杠杆发挥的作用最为显著。对于中国的搜索品牌来说,早期的技术积累已经完成,如何利用生成式AI技术为自身搜索业务持续赋能是关键。

流程杠杆包括应用领先实践和标杆分析法,以及实施客户、员工和业务伙伴体验管理方案。在埃森哲调研中,企业普遍将结构和战略视为扩大流程能力的要务,如领先实践、利益相关方体验等。不断提升用户的搜索体验,是当前搜索品牌需要为之奋斗的目标。

数据杠杆包括借助数据应用、分析工具和人工智能,提升业务绩效和利益相关方体验。71%的“未来级”企业认为,在设计运营模式的过程中,数据远比经验更为重要。对于已颇具数据规模化的“预测级”和“未来级”企业而言,战略和组织结构才是最大挑战。前文提到,大模型训练考验的是企业在算法、数据、框架、资源调度等全栈和全流程的综合能力。

人才杠杆包括实施人才战略、释放人机协作潜能、以及充分利用专业人才或人才生态系统的优势。对于中国科技企业来说,人才的重要性不言而喻,但同时也要注意加强与相关专业人才(数据科学家、人工智能从业者、设计思维专家、产品经理)的融合,促进持续创新。

值得注意的是,埃森哲指出,企业当前无论出于何种运营成熟度,一旦应用四项杠杆同时发力,其在未来三年跻身“未来级”企业的可能性将提高一倍。同时,企业也要意识到,运营升级无法一蹴而就,需要坚持长期主义,合理、有序的调配四大杠杆协同运作是企业能否实现颠覆的关键。

在风靡全球的小说《冰与火之歌》中,伊耿·坦格利安一世征服七大王国后,将上千把敌人们的宝剑收集起来,用灼热的龙炎将利剑熔铸成高大而扭曲的“铁王座”。铁王座上有许多尖刺和倒钩,刻意令人坐得不舒服,用以警戒上位者。在创业初期,李彦宏就深知,如果不能及时把握市场需求的变化,就会被淘汰。李彦宏也曾告诉员工,“百度离破产永远只有30天”。面对行业内外的新变量,搜索企业应该始终保持危机意识。

对于成功经验,百度总结:“我们的成功取决于提供产品与服务吸引用户,使用户拥有优质互联网体验。”这一点适用于所有的搜索品牌。时过境迁,人们的搜索习惯变了,但是方向是明确的,那就是缩短提问和答案之间的时间。面对生成式AI引发的搜索行业“蝶变”,国际搜索巨头间的竞争不断升级,国内的搜索品牌在加速追赶的同时,也要牢记《冰与火之歌》中,史塔克家族的族语——“凛冬将至”(Winter is Coming)。

注:①SEO(Search Engine Optimization)搜索引擎优化。是一种利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名的方式。目的是让其在行业内占据领先地位,获得品牌收益。

参考文献:

①《2023年中国搜索引擎行业研究报告(CTR洞察)》

②《2023年全球数字信任洞察调研中国报告(普华永道)》

③《智能运营:实现价值乘数效应(埃森哲)》


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1