【导读】
「李彦宏在内部指出,相关技术已达到临界点,百度在其中有较大的机会。」
ChatGPT的风吹了又吹,不过依然有些仅限于“圈内狂欢”的味道。
万千大众离这次热潮貌似还有一定距离。
但如果能降低使用门槛、注册渠道、语言屏障,可能将演变成一场真正的龙卷风。
最直接的解决方法是国产化。
而现在,国产版ChatGPT可能要来了。
据传要做它的公司是百度。
有消息称,百度正在研发类似ChatGPT的聊天机器人服务,将于近期推出。
但目前尚处于保密阶段,多位百度人士表示该项目在内部高度保密,不允许公开讨论。
此前ChatGPT被讨论用途时,“取代搜索引擎”被多提到,而如今以搜索引擎起家的百度要做国产版有些要用技术以毒攻毒的意味。
据《财经十一人》报道,该项目在百度内部由搜索(MEG)和技术中台(TPG)团队牵头,呈现形式将会是生成式搜索,也就是将搜索和ChatGPT结合。“最终产品可能偏向搜索。”一位百度人士表示。
目前百度对上述信息并无回应。受此消息影响,百度股价1月30日单日一度上涨5%,截至收盘,单日上涨0.44%。
但类似ChatGPT等技术的出现,对传统搜索引擎业务到底是威胁还是助力?
ChatGPT反推搜索引擎
ChatGPT利用网页与用户进行对话互动,实现信息咨询,在模仿人类说话风格的同时可以回答大量用户的问题。它不仅能够识别英文,对中文的理解程度也很高。有些回答甚至比搜索引擎获得的答案更靠谱。
较高质量的回答、高效获取信息的方式以及上瘾式的交互体验,让ChatGPT出现之初就被质疑,“ChatGPT是否会替代搜索引擎?”
搜索引擎作为典型的工具型产品,当更好用的工具出现时,用户自然而然就会换新。ChatGPT如果能够为用户提供足够精准的内容,传统的搜索引擎自然就会被放弃。
不过目前ChatGPT还处于测试阶段,短期内不会对传统信息检索工具造成冲击。但,ChatGPT对搜索引擎的威胁,这些科技公司并非没有意识到。
近日,比尔·盖茨在美国社交新闻网站Reddit问答帖下的亲自回复,“Web3没那么重要,元宇宙没革命性,人工智能最重要。”此前有消息称,微软计划在2023年3月底前推出一个采用ChatGPT的必应搜索版本,以更好对抗谷歌搜索。
从全球的搜索引擎市场份额来看,长期以来,必应都活在谷歌的阴影之下。根据2022年的统计数据,谷歌占据着全球80%以上的搜索引擎市场,去年3月的月访问量甚至高达908亿次,而同期必应的访问量仅为13亿次。
ChatGPT的出现,让微软嗅到了反超的可能性。同样,百度也嗅到了新的机遇。
百度一下该升级了,李彦宏:相关技术已达到临界点
据知情人士透露,李彦宏在内部指出,相关技术已达到临界点,百度在其中有较大的机会。
李彦宏称:“这很宏伟,很激动人心。但我们认为它是可实现的,因为技术已经到了临界点。类似ChatGPT这样的技术很火,如何用在搜索场景上,这是比技术本身更难探索的。怎么能把这件事情做出来,让每天有几亿人从中受益,让他们的效率有明显的提升?未来一年,在这方面我们非常有机会。”
若不抓住机会,就意味着会因错过受到冲击。
如果未来ChatGPT的内容质量和训练成本有望进一步改善,搜索引擎将迎来技术革命。而谷歌、百度、搜狗、360等将成为第一个被冲击的对象。
百度积极入局可以看作是形势所迫,那本身技术能进行开发支撑吗?
ChatGPT本身是基于其开发公司OpenAI 2020年推出AI大规模GPT-3开发而成。
百度 NLP 于 2019 年 10 月预发布了通用领域的对话生成预训练模型 PLATO,这是世界首个基于隐变量的生成式开放域对话大模型,利用隐变量建模开放域对话中的一对多关系(一个输入对应多个正确输出)
后来,在2021年百度也推出了预训练大模型文心(Ernie),根据百度方面披露的信息,该文心大模型已大规模应用于搜索、信息流、智能音箱等互联网产品。
另一方面,在ChatGPT等大模型的光鲜亮丽背后,是数千亿数据的喂养以及大算力芯片的消耗,训练和推理成本极高,以Stable Diffusion为例,它在4000台A100显卡集群上训练了一个月时间、学习了近59亿条图片数据才真正开发出来。
因此,具有强大云计算底座能力的云平台,成为了大模型和开发者们的新“栖息地”。
2022年第三季度,中国的云基础设施服务支出同比增长8%,达到 78 亿美元,占全球云支出的12%。其中,阿里云、华为云、腾讯云和百度智能云占据80%的市场份额,百度排名第四。百度智能云的年度增长为12%,并且实现了连续三个季度增速超过整体市场。
如此看,百度具备了开发国产版ChatGPT的基础。
除技术和工程外,摆在百度面前,或者说摆在所有想尝试开发此项技术的公司面前,还有技术之外的问题,例如合规性遵守互联网相关法律法规等等,毕竟之前ChatGPT已经被引导写出如何毁灭人类计划书了。
ChatGPT取代搜索引擎仍需时间
眼下,ChatGPT还无法取代搜索,主要在于计算成本太贵、没法实时获取数据等原因。
ChatGPT可以说是一个烧钱的游戏。
公开报道显示,目前OpenAI在用户与ChatGPT的每次交互中花费的计算成本为“个位数美分”,随着使用规模变大,这些计算成本可能将飙升至数百万美元,ChatGPT背后的OpenAI仍处于严重亏损之中。
在应用领域方面,搜索引擎的信息库抓取信息快、信息库更频率高、存量大,常常应用在文献检索、互联网搜索等领域。
而ChatGPT 的语料库来源于离线数据,输出的文本存在虚假信息的可能,且吸纳新的知识需要对模型进行再训练和微调。因此主要应用于人机对话、智能客服、智能问答等强逻辑性的自然语言交互领域。
说回百度,2022年12月后,百度“快马加鞭”投入相关研发,但并不能算是百度目前的“重点方向”,同时期还有不少新项目在投入,且目前效果和ChatGPT的差距还很明显。
目前,ChatGPT 在搜索引擎中的应用,在实现路径上尚有难度,后续仍要看百度对其的研发投入力度。
参考文章:
《财经十一人》-百度跟进,国产版ChatGPT要来?
《科创板日报》-百度进军ChatGPT 李彦宏:相关技术已达到临界点
《光锥智能》-微软盯上ChatGPT,一场关于生成式AI的豪赌
《电商报Pro》-百度推出聊天机器人,互联网大厂暗流涌动