当前位置:首页|资讯|ChatGPT|谷歌|百度|微软

ChatGPT火了,谷歌慌了,百度稳了

作者:钛媒体APP发布时间:2023-02-10

原标题:ChatGPT火了,谷歌慌了,百度稳了

图片来源@视觉中国

文 | 天辰光源

ChatGPT的横空出世让整个科技圈进入新的变革期。

2月8日凌晨,微软宣布推出由ChatGPT支持的新版搜索引擎必应及浏览器Edge,微软首席执行官萨蒂亚·纳德拉表示,搜索引擎迎来了新的时代。

作为应对,2月8日晚间,谷歌在巴黎举行AI发布会,向外界正式披露聊天机器人产品Bard(巴德),但在演示时却出现重大错误。

有用户问Bard:“该如何告诉一个9岁孩子关于詹姆斯·韦伯太空望远镜的发现?”巴德给出的答案其中有一条是:“韦伯太空望远镜拍摄了太阳系以外行星的第一批照片。”但随后,有天文学家指出,由欧洲南方天文台的甚大望远镜早在2004年就捕捉到了系外行星的图像。

一次对比让微软和冰火两重天。微软股价近日来连续上涨,市值重回2万亿美元;而股价则下跌超7%,市值蒸发逾千亿美元。

国际市场打得火热,国内市场也开始升温。连日来,已有多家科技公司纷纷响应。

2月7日,确定将推出一款类ChatGPT项目,项目名字确定为文心一言,英文名ERNIE Bot,三月份完成内测,面向公众开放。2月8日,阿里巴巴证实正在研发类ChatGPT产品,目前处于内测阶段。2月9日,腾讯证实目前在类ChatGPT相关方向上已有布局,专项研究也在有序推进。同日,360创始人周鸿祎表态,如果企业搭不上ChatGPT这班车,很可能会被淘汰。

截至目前,从相关技术到项目名称再到开放日期,百度是公布信息最明确的国内科技公司。不仅如此,天辰光源获悉,CEO李彦宏2023年一季度OKR关键任务为“引领搜索体验的代际变革”,这意味着搜索或将全线接入文心一言,搜索产品将迎来颠覆性变化。

在近期流出的一份内部讲话中,李彦宏再次强调:“技术已经到了临界点,类似ChatGPT这样的技术如何运用在搜索场景上,未来一年,在这方面我们非常有机会”。

可以看出,面对ChatGPT,国内外两大搜索引擎的表现截然不同,拉响了“红色警报”,则看到了新机遇。

在全球,一场搜索引擎市场的大变局正在发生。在中国,谁能最先搭上ChatGPT这班车也呼之欲出。

实际上,ChatGPT从一出生就是冲着来的。

2015年,为了打破有望形成的垄断局面,美国人工智能公司OpenAI成立,背后汇集了美国创业孵化器Y Combinator总裁阿尔特曼、特斯拉总裁马斯克、PayPal联合创始人彼得·蒂尔、领英联合创始人里德·霍夫曼等多名科技大佬。

2019年,微软向OpenAI投资10亿美元,双方达成深度合作。2022年11月,OpenAI推出聊天机器人模型ChatGPT,发布仅5天,注册用户数就超过100万。截至2023年1月末,ChatGPT月活用户已突破1亿,成为历史上增长最快的消费应用。

2023年1月,微软宣布对OpenAI追加数十亿美元的投资,并将在旗下的Office和云服务中植入ChatGPT。

ChatGPT的迅速爆红让拉响“红色警报”。其实,真正让谷歌紧张的并不是核心技术落后的问题,而是“起个大早,赶了个晚集”。

理论上,ChatGPT不是什么新鲜事。它背后的基础模型GPT3/GPT3.5早就问世,对于这些OpenAI模型的能力是有了解的。总体来说,OpenAI大模型和类似模型(包括模型)之间没有多大的技术差距。在大语言模型、聊天机器人的技术上,跟ChatGPT算是平起平坐的。

早在2021年开发者大会I/O上,就已经发布了专门针对对话类应用的大语言模型LaMDA和多模态多任务模型MUM。这两个模型,实际上已经具备了和ChatGPT基本相同的能力。而且在去年已经通过官方演示和小范围内测应用,向公众展示了这两个模型在多轮对话、文本生成、跨模态搜索等多种任务上的强大能力。

但LaMDA发布已有一年半的时间,却仍然没有像ChatGPT那样面向公众大规模开放,而眼看着ChatGPT瞬间爆红,这让不得不感到心塞。认为,这是一个重大的错误,其严重性和紧迫性,应该被当作真实生产环境事故一样对待。

可更焦虑的是,即便谷歌发布了ChatGPT的竞品,也会对自身的商业模式造成颠覆。

目前,的核心营收来源是广告,其中许多出现在其搜索引擎上。数据显示,2021年,在2576.4亿美元收入中,约80%来自广告。搜索广告、结果排序、页面广告,以及其他任何广告展示方式,只有当广告位存在,能够被展示的时候,就能赚钱。这种模式一旦被颠覆,必将受到重创。

2月初,第23号员工、Gmail创始人保罗·布赫海特就发推特称,像ChatGPT这样的人工智能聊天机器人将摧毁,就像当初搜索引擎摧毁网络黄页一样。距离被彻底颠覆可能只需一两年的时间。

如今,慌忙展示Bard却遭遇大翻车,焦虑心无疑更重了。

同样靠搜索引擎起家,却丝毫无需担心ChatGPT带来的冲击,其核心就在于,一方面百度和谷歌赚钱的“家伙事”不同;另一方面,Open AI和微软都是瞄着谷歌打的,百度不用担心此类问题。

与相比,对广告营收的依赖没有那么重。根据数据,2022年三季度,总收入325亿元,其中,广告收入187亿元,占比57.4%;非广告收入65亿元,同比增长25%,主要受智能云及其他AI驱动业务的推动。

就广告收入来说,和也大不相同。广告收入主要依赖于托管页收入,并非传统的搜索广告。托管页的广告形式即使在AI对话场景中同样生效,不受到威胁。

所谓托管页,是移动生态面向商家提供的一套移动商业解决方案,涵盖了包括快速建站、营销工具以及客户管理、长期维护等一系列工具箱。通过使用的托管页服务,商家不再需要使用自有的服务器建站,而是调用提供的各类组件与模块完成建站和维护。截至2022年3月,约86%的广告客户使用托管页建站投放广告。

再看竞争方面,微软和注定是一对天敌。

浏览器是微软最早涉足互联网的武器。1995年年底,微软创始人比尔·盖茨发出The Tide of Internet(互联网的大潮)长信后,微软开始扑向互联网,凭借将IE与Windows的捆绑式销售,IE成为了市场霸主,并形成了长期垄断地位。

1996年的春天,在斯坦福计算机系的“比尔·盖茨大楼”开幕典礼上,拉里·佩奇和谢尔盖·布林正老实的坐在台下,听比尔·盖茨发表演讲。不曾想,台下坐的这两个年轻人,在不远的未来会成为微软的对手,而他们的武器就是。

从搜索到广告、邮箱、视频、地图、移动服务、手机平台、数字出版、应用软件,势如破竹,几乎在所有的互联网关键应用上都有布局,与微软的业务也不断形成交叉,并渐显合围之势。

随着搜索对市场的占领,用户互联网的入口也在向搜索转移。2008年9月,Chrome浏览器推出,在短短一年的时间里,Chrome的市场占有率就达到了3.17%。同时,Chrome浏览器配合Chrome OS操作系统也在瓜分Windows拥有的一大块市场,对微软的打击越来越致命。

除了业务压力,在那段时间,还有一个令微软动怒的原因,就是不断地从微软“偷”人才,甚至在微软华盛顿Redmond总部5英里远的地方设立了办公室。那段时间,微软员工在离职时,人事部门的第一个问题通常是“你要去吗?”

2009年6月底,微软发布搜索引擎Bing(必应),向发起反击。然而,另微软沮丧的是,Bing不但没有掀起波澜,反而被一直按在地上摩擦。除了中国和韩国等少数国家,的搜索广告份额在全球几十个国家的占有率都在90%以上,而Bing目前在全球的份额约为9%。

此次微软携ChatGPT以复仇者的身份又回到了战场,目的就是让“Google is done”。也许胜负一时难以分出,但鹬蚌相争渔翁得利,可以从中借鉴很多经验。

谁先搭车

不管怎样,ChatGPT的面世足以将人工智能乃至整个科技业带向新的高度,在这样的趋势下,科技公司势必会迎头跟上,正如360创始人周鸿祎的表态,如果企业搭不上ChatGPT这班车,很可能会被淘汰。

那国内谁能先搭上这班车?

目前,人工智能的技术栈可以分为四层:芯片层、框架层、模型层和应用层。ChatGPT处在技术架构的模型层,而训练一个千亿的大模型是对算力、算法、算据的全流程考验。

首先是算力,根据瑞银分析师Timothy Arcuri的说法,ChatGPT已导入至少1万颗英伟达高端GPU。

再看算法,光有高参数的算力还不够,还缺少一个利用算力训练模型的工具,这个工具就是深度学习框架。这方面,目前世界前三分别是的TensorFlow、Meta的PyTorch和的飞桨。

而对数据的训练则是来自互联网上公开的聊天记录和对话数据。

谁能同时具备算力、算法和数据,就能在更多的应用场景进行布局,基于此,目前各巨头围绕着大模型的争夺成为普遍现象。

回顾OpenAI GPT模型的进化之路,具有十分明显的规模效应,2018年,初代GPT参数量达1.17亿,2019年,二代参数量达15亿,2020年,GPT 3.0参数规模直接飞跃至1750亿。如果把模型比成科技公司打入人工智能领域的“入场券”,那么大模型就是科技公司的“护城河”。

目前行业常见的大模型已经达到了千亿、万亿级参数量,这样量级的资源投入,对于中小企业、传统行业而言是很有难度的。在国际,比如的LaMDA规模为1370亿,PaLM的规模为5400亿,DeepMind的Gogher规模为2800亿。在国内,智源GLM规模为1300亿,华为“盘古”规模为2000亿,“文心”规模为2600亿,是全球最大的中文单体模型。

另一方面,大模型的比拼已逐步从实验室阶段转变到产业化阶段,想让自家大模型的差异化优势更为明显,就要抢占产业高地。

目前,腾讯混元大模型聚焦广告行业。据腾讯研究院发布的《AIGC发展趋势报告2023》显示,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等行业取得重大发展。

据阿里研究院公布的信息显示,阿里巴巴达摩院在2020年初启动中文多模态预训练模型M6项目,已在超40个场景中应用,日调用量上亿。

百度文心大模型已涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域,累计发布11个行业大模型,ERNIE Zeus基础大模型和PLATO对话大模型等都开放了API接口,供产业伙伴使用。

经过对比发现,是目前国内应用场景最多的科技企业。更重要的是,还是国内唯一一家拥有全栈AI技术架构的公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心大模型,各个层面都有关键自研技术。

不得不提的是自然语言处理(NLP),有人把NLP称为“人工智能皇冠上的明珠”。所谓NLP就是“懂人话”和“说人话”,谁能实现这方面的突破,谁就能在AI领域一骑绝尘。

目前,微软、搜索引擎在中国的市场份额都不高,同时这两家的NLP技术基本都是以英文语法为主,在中文语法方面不是优势,因此,中国企业在NLP领域还大有文章可做。这方面,仍是主角。

早在诞生之时、从处理用户的第一次搜索开始,NLP技术就成为搜索技术的重要组成部分,并伴随着的快速发展,同步甚至更快地发展壮大。

2010年初,国际顶级自然语言处理专家、内院的“扫地僧”王海峰亲自操盘,对NLP的工作进行了重新梳理与规划,自然语言处理部正式成立,并不断在语音、图片等技术上布局,敲定了在知识图谱技术上长期投入的战略。王海峰也凭借自身的理论造诣以及在的工程实践成就,成为自然语言处理领域世界上影响力最大的国际学术组织ACL50多年历史上唯一的华人主席。

在NLP的持续帮助下,变得更加“聪明”。打造了世界上最大规模知识图谱,拥有超过50亿实体和5500亿事实,并在不断演进和更新,应用于各行各业,每天的调用次数超过400亿次。2021年9月,发布了PLATO-XL,一举超过Facebook Blender、Meena和微软DialoGPT,成为全球首个百亿参数中英文对话预训练生成模型。

英文是偏结构化的语言,而中文是自由的线性语言,在信息处理上有一些“特有”的难题,因此,能做好对中文语言的理解和处理的,自然会是一家中国公司,不是微软、谷歌。

国内最先搭上ChatGPT这趟班车的科技企业会是吗?


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1