来源 / ToB行业头条 (ID:wwwqifu)
作者 / 樊航 · 编辑 / 海阳
过去10多个月,朋友圈热闹非凡,有人用AI作画,有人用AI写作,还有人开始尝试用AI谱曲,这场全民对AIGC(生成式AI,其中包含AI写作、作画、对话机器人等分支)的探索伴随着Open AI的ChatGPT问世之后迅速被推至高潮,家喻户晓。
上线两个月的ChatGPT月活已经突破一亿,且呈现每日急增的高速增长态势,造就了消费级应用程序史上用户速度增长最快的神话。
而时下最火的莫过于微软、谷歌、百度三家搜索引擎公司的直接对抗。
首先是骄傲的微软,作为Open AI的投资方和合作伙伴,至2月7日宣布推出由ChatGPT支持的最新版本必应搜索引擎和Edge浏览器之时,微软一夜市值飙涨超800亿美元,毫无疑问是当下值得骄傲的最大赢家。
其次是出糗的谷歌,同样是2月7日,谷歌 CEO 桑达尔·皮查伊(Sundar Pichai)宣布,谷歌将推出一款由 LaMDA 模型支持的对话式人工智能服务,名为 Bard。
但在2月9日Bard首次亮相就犯下巨大失误(Bard回答詹姆斯韦伯太空望远镜新发现时表示拍摄到太阳系外行星的第一张照片,事实上第一张系外行星照片是由欧洲南方天文台于2004年拍摄),此消息一出,谷歌股价大跌9%,市值损失近1000亿美元。
最后是满怀期待的百度,百度宣布类ChatGPT大模型新项目文心一言(ERNIE Bot),预计三月份完成内侧,面向公众开放。作为国内首个有实力进行掰手腕的企业,官宣当日,股价一度涨超15%,被寄予厚望。
同一件事,不同的结果,真是有人欢笑有人愁。
那么问题来了,微软先发在前,百度、谷歌是赶鸭子上架吗?百度追赶该领域领跑的硅谷巨头,底气在哪里?值得讨论。
如果说非盈利机构Open AI推出的ChatGPT 工具是一个往大海里试探深浅的石头,那它的目的很明显已经达到了。
但真正的新时代竞争,则来自于微软宣布由ChatGPT支持的最新版本必应搜索引擎和Edge浏览器的消息。为此微软CEO萨提亚纳德拉还放出豪言:这是搜索引擎新的一天,这是一个新的搜索方式,一场比赛从今天开始。
萨提亚纳德拉的话看似夸张,但并非不无道理。如果说传统搜索,人们需要滚动鼠标浏览页面,消耗时间和脑力,在浩如烟海的链接中做出筛选。而全新的搜索页面,你可以看到由AI直接整理好的结果列表的摘要。
图片来源于网络
也就是说,搜索引擎不再只是简单的查询工具,它即将变成了人们手头的高能助理(至少不是现在,而在未来)。
同样对于“传统搜索”的谷歌而言,该不该慌呢?
应该慌。这一点,从谷歌母公司发布红色警告,召集联合创始人帮助,以及近期的股价、用户的反应等方面来看,都显现出谷歌如临大敌。有多位风险投资人均表示,哪怕只流失10%-15%的使用量,都是谷歌巨大的损失。
但从技术层面而言,谷歌依然有信心。或许大家可能忘了,2022年6月科技界发生的一次重大事件,一名谷歌工程师勒莫因(Blake Lemoine)认为他们公司开发的「对话应用语言模型」(Language Models for Dialog Applications,简称LaMDA)具有8.9岁孩子的自我意识,引发伦理与哲学的争议。
而谷歌最新发布的以对抗ChatGPT的测试产品Apprentice Bard(学徒巴德),正是基于谷歌的对话大模型LaMDA进行研发,实际上谷歌研究LaMDA模型很长时间,据最近的数据显示,LaMDA 模型具有 1370 亿个参数(2022年1月 ChatGPT具有1750亿参数,而目前GPT-3.5版本更高)。
虽然在亮相时出糗,但其底层技术与先行者相差无几。所以从技术角度来看,失去先机的谷歌,仍然在这场新时代盛宴的竞争行业当中。
再说回百度,在技术和布局层面或许也不虚。
首先可以简要的复盘一下最近半年AIGC出圈的时间线(不完全)与百度在AIGC的技术研发和布局时间线作为对比:
2022年8月的美国科罗拉多州博览会艺术比赛上,一幅经由AIGC创作的《太空歌剧院》作品拿到了一等奖,引发全民讨论:我倒要看看AI作画水平能厉害到什么程度?
2022年8月,Stability AI 宣布发布 AI绘画工具Stable Diffusion开源,让全民皆可使用文生图能力,成为AIGC出圈爆火的主要条件之一。
2022 年10月,Jasper(AI内容生成平台,基于 OpenAI 旗舰大型语言模型 GPT-3 的文案初创公司)融资 1.25 亿美元,在成立仅 18 个月后就达到了 15 亿美元的估值,成为最年轻的独角兽之一。
2022 年10月,Stability AI 宣布获得1.01亿美元融资,同样成为备受瞩目的新晋独角兽。
再看百度这边:2022年7月,百度世界大会,李彦宏指出AIGC将走过三个发展阶段:第一个阶段是“助手阶段”,AIGC用来辅助人类进行内容生产;第二个阶段是“协作阶段”,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面;第三个阶段是“原创阶段”,AIGC将独立完成内容创作。
2022年8月,AI作画平台文心一格上线,情感陪伴型虚拟博主叶悠悠和林开开上线。在此之前的2022年2月可以进行AI思维创作、AI剪辑、AI作画、AI作曲的数字虚拟偶像希加加上线。
接下来的故事想必大众都知道,ChatGPT上线,引爆全球,谷歌、百度宣布跟进。全球AIGC频繁出圈,在投资界、股市疯狂吸金。
从百度整个发展时间线与国外出圈时间线交叉来看,事实上百度在AIGC的布局并没有落后太多,甚至可以说是和硅谷帮同步进行。
罗马并非一日建成,回到商业领域,当一款成品应用展现在大家面前的时候,其背后的布局和研发远也比想象的要早,Open AI、谷歌如此,百度和大众所熟知的涉及AIGC的众多企业亦如此。
这也得益于百度公司的重技术属性。过去十余年,技术、研发投入成为百度的代名词,在AIGC的发展上,不论是AI作画、写作,数字虚拟人还是文心一言,其背后都离不开百度预训练大模型、深度学习平台、以及人工智能芯片等技术的支撑。
自2019年开始,百度便基于飞桨文心大模型家族进行深度开发,比如AI作画依靠的是跨模态图文生成模型ERNIE-ViLG;AI数字对话人使用的是对话生成大模型-文心PLATO等等。
百度方也直言,ChatGPT相关技术,百度都有。百度在人工智能四层架构中,有全栈布局,包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用,其中“文心一言”位于模型层。
百度在人工智能领域深耕数十年,拥有产业级知识增强“文心大模型”ERNIE,具备跨模态、跨语言的深度语义理解与生成能力,这是百度做类ChatGPT的底气。
根据公开资料显示,在百度文心的发展过程中,ERNIE3.0大模型即拥有千亿参数,与超强算力方联合的鹏城-百度文心作为一款融合了自然语言理解和自然语言生成的大模型,其参数量达到了2600亿,相对GPT和ChatGPT提升了50%。
此外,ChatGPT最显著的几个关键词-AI、NLP、搜索,在国内都是百度的标签,在自然语言处理领域更是独占鳌头,因此也被大众认为百度是最容易做成中国版ChatGPT的公司。
要知道,在大众的理解中,第一个出现,即便不完美,迎来的只有鲜花和赞美;第二个出现,不完美,你就是跟风;第三个出现,不完美,呵呵。
技术上没落后的谷歌、百度,遇到什么难题导致失去先发优势?这是人们所关心的。
第一个难点还是不完美,目前市面上所有不论是ChatGPT还是类ChatGPT的产品都在讲正确的废话,体验过的朋友可能都知道。
但从商业角度来讲,优势技术+优势领域的强强联合,势必会产生质变,赚的盆满钵满。
但不完美的技术+优势领域结合,就是在砸自己的饭碗,把不标准甚至四处拼接的错误答案拿出来填充大部分用户的思想,达到所谓的“AI搜索正确”,是极其危险的。这也是谷歌、百度考虑的一点。
第二个难点,在没想好商业模式之前,拿出来成本太高,短期内收支会完全失衡。
查询成本方面,根据摩根士丹利分析师估计,ChatGPT每次查询的成本大约是谷歌传统搜索查询成本的七倍。
有学者算过一笔账,按百万用户数据,每人每天约10次提问,粗略估计ChatGPT查询每天成本按每条1美分算,消耗接近10万美元。如果按千万级用户、亿级用户算,成本将成倍增长。
在算力成本方面,东吴证券研报分析认为,ChatGPT的优化主要来自模型的增大,以及因此带来的算力增加。其中GPT-3训练单次的成本就高达460万美元,目前GPT3.5以及未来的GPT4也都将成倍增长。
而商业变现方面,当类ChatGPT+搜索引擎作为主营业务的时候,网传的靠广告营收和订阅收费或许都不太可能。也因此,收支如何平衡是商业公司考量的标准之一。
另外该产品生产的内容是否涉嫌偏见、伦理、种族歧视、个人色彩等网络红线,以及未来是否会受到强监管都是值得考虑的。
在「ToB行业头条」看来,从某种程度上讲,不论是谷歌还是百度,都是被先发者微软推出来的,属于被迫应战。
这一点从谷歌2月9日Bard首次亮相犯下严重错误就可以看出来,在内部谷歌并没有完全准备迎接这场对抗。
也正如李彦宏所说:“百度技术能做到这一步,但它会成什么样的产品,产品能满足什么样的需求,这个链条上还有很多不确定性。这个事情很难做,但百度必须要做。”
当然,前有Open AI的ChatGPT的成功案例,也证实了广大非技术人员都能参与,使用门槛将被无限降低,对于百度而言,在文心一言面世的那一天,也将会收获广泛群体积极参与与讨论,这对百度而言,是挑战也是绝好的机会。
或许真等到文心一言面世那天,它仍然也会不完美,但一个属于AIGC的时代已然来临,那些对AIGC探索的企业也将接踵而至。
混沌初开,一切都是未知数。