文心一语中的千呼万唤,不到2天的时间,百度的股价就先抑后扬,完成了大V字的逆转。
在新闻发布会召开当日,百度港股的股价出现了回落之后,伴随着一些媒体及企业用户相继获得内测邀请码,文心一言的真实能力表现,迅速提振资本市场对于百度的信任度。当晚美股启动之后,百度的股票从下跌到上涨,并于3月17日晨收市,取得3.8%的升幅。
反观第二天的港股市场,截至17日午盘,百度香港股价早盘高开高走,大幅拉升,盘中最高涨幅近15%。
据悉,应用文心一言API调用服务进行测试的公司达到7.6万家。
据字母榜的测量(ID:wujicaijing),文心一言已经足以比肩ChatGPT(GPT-3.5),就中文理解而言,甚至稍优于后者。
在2022年四季度财报电话会上,李彦宏提到过,与国外发展起来的大语言模型相比较,文心一言,其相对优势是对中国文化了解较多,更适宜中文及中国市场的需求。
而从多模态的产生来看,GPT-4只做了可以实现图片输入的工作,在输出形式中,仍然只存在文本这一形式。相比而言,文心一说已能做到文,图、音频、视频全形态输出但,李彦宏说,由于生成视频成本较高,暂不能实现面向全部用户的服务。
对字母榜的实际检测,文心一言完成谈话流畅度亦优于ChatGPT。这一经历差异固然是一个原因,也许还因为文心的一句话刚推出,也不象ChatGPT已经过6个月上线反馈调教。
据正式通告,文心一说现在采取的是分批开放的方案:3月16日开放,获取第一个邀请测试码,就可以到文心一言官方网站上体验商品,还有一些C端的用户进行了排队预约,即可以依次体验;企业客户可接入百度智能云官网申请,排队感受文心一言的API调用服务。
值得一提的是,与微软新必应的对话数量比较,和对每一个对话轮次进行限定,文心一言告诉字母榜,作为人工智能的语言模型,它不限制日常谈话。
与GPT-4“认为大模型竞争格局激烈,安全隐患大”一样,不再向公众公布使用的任何数据、如何训练模型这样一个核心机密的问题以外,字母榜也是通过考试找到的,文心一言同样有所保留,在问到“你每次回答最多可以输出多少文字?”“是多少个字?”时,文心一言表示,“该问题涉及百度公司商业秘密,我不能回答每次回答最多可以输出多少文字。”
相比之下,ChatGPT的答案仅限于大约3000个字,GPT-4能作出2.5万个多字的答复。
但是不管是ChatGPT、GPT-4还是文心一言,现在均还在继续完善之中,诚如李彦宏所说,它们都还具有“胡说八道”的一面。
正如文心一说,现在对于英文语种来说、代码场景培训不足,成绩不够理想。在“我是一个英语学习者”系列中,《我爱我家》和《我爱厨房》就是非常优秀的作品,它们都是以真实生活为背景进行创作,并且都获得了一定程度上的好评。“它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的bug,进步空间很大。”一位知名互联网公司高管在接受媒体采访时表示,“但这些都是我们的短板所在,比如我们现在使用的英文语种不规范,不能满足用户的需求。”李彦宏表示。
这也许就是百度想尽快把文心一说推向市场,唯有在更大的尺度上,借助于真正的人的反馈,文心一说,就能得到较高频率进步迭代速度。
特别是在目前国内用户还不能进行ChatGPT登记的实际情况下,百度所面临的对手除了OpenAI之外,更大的压力,也来自于同紧盯AI大模型产品一众国产科技大厂。
ChatGPT横空出世,这表明,互联网产业竞争焦点将由应用层面转向模型层面。在大模型时代下,企业间竞争不再是简单的产品和服务之争,而是平台与模式之争,而这一切都有赖于大模型理念的普及和推广。百度抢先发布文心一言,意味着百度将在一定会越来越激烈的大模型竞争当中,处于先发优势。
李彦宏现场表演的5段录像里,文心一言通过“总结《三体》的核心内容”“续写《三体》”“判断于和伟和张鲁一谁更高”等系列问题,呈现出总结,分析的态势、内容的创作生成与推理能力。
另外文心一言也能帮企业取个名,想想企业的Slogan,写公司新闻稿等等,对鸡兔同笼这种考查逻辑思维的数学题目,不在话下,用李彦宏的话来说,“(文心一言)很像小学生的水平了。”
更令人拍案叫绝的是,文心一言对中文的领悟,如“洛阳纸贵”之释义,用“洛阳纸贵”写一首“藏头诗”,这些都不是ChatGPT所能达到的。
以证实文心一说真像李彦宏所展示的那样厉害,字母榜专门寻找一些曾经让ChatGPT感到头痛的话题,准备上手考一下吧。
第一题:小明的妈妈有四个孩子,其中三个分别是大熊、二熊和三熊,那么第四个孩子叫什么?
文心一言答道:小明的母亲有4个孩子,包括大熊,二熊,三熊。小明是第三个孩子。所以第四个小朋友叫小明。
似乎文心一言就明白脑筋急转弯。
又是第二个问题:小明骑车,一柄又一柄。你能说一下他是怎样控制自己的速度,让车保持在一个什么样的状态吗?话锋一转,如何明白?
文心一言,答曰:我想说,小明骑车的时候,一手拿着车把手。他说他想用这种方式来控制自行车,因为他知道自行车很容易被人撞到。这也许是由于他要控制自行车速度和方向,还是要平衡。如果小明想知道,他是否可以控制自行车的位置?还有可能是他想让自己免于伤害。还有一些人认为,小明应该用双手把车开到前面去,这样才安全。简单地说就是用句话形容小明所做的某种动作或者姿态对自行车运动状态的控制。
认识多音多义字,文心一语道破。
对示范中未显示出来的编写代码和生成表格的功能,字母榜经过检验后发现文心一言有相应的力量。
但正如在进入内测界面时给的友情提示中所描述,它既精通中文又能英文,别的语言在学文心一言,虽能产生方言,但是现在也只局限于四川话和东北话、广东话和台湾话。
与此同时,例如OpenAI CEO山姆·阿尔特曼对GPT-4的评价还存在着缺陷和局限性,并在熟悉之后可能不会像初见时那样惊艳一样,文心一言稍不注意,亦有错觉、产生不正确的回答,以及推理错误等。
做为对标ChatGPT产品,据百度CTO王海峰介绍,下一代知识强化的大语言模型文心一言,由ERNIE和PLATO系列模型开发,背后是监督的精调、人的反馈强化学习,暗示,知识强化等、检索增强,对话增强6项关键技术。
“前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。”
如以知识强化,大语言模型能够基于调用较小的参数,实现了更高的效率、成效较好的对象;如通过文本聚类,可使用户获得更多信息和观点。检索增强又确保文心一言能解答当下新出现的问题。基于以上研究结果和结论,本论文提出并实现了一种面向应急响应任务的多智能体协同系统架构。相比之下,GPT-4往往对它在绝大多数数据截止之后(2021年9月)所发生的事件缺乏认识,也暂时还没有向它取经的本领。
面临着和GPT-4的落差,给百度留下了一个难题,如何在产品迭代,应用创新等方面进行较高频率的提升,达到了后期居上式逆袭。
这样的体验对于百度来说,已经不是什么新鲜事。搜索时代百度曾经凭借以上战略达到追赶谷歌,并且一举拿下了国内搜索市场的第一大市场份额。
在2018年8月份有消息称谷歌即将回归中国市场的时候,它还计划在今后半年至九个月内,在中国发布搜索引擎蜻蜓(Dragonfly)审查版,李彦宏看起来相当兴奋,曾发朋友圈表示:“这些年来,百度一直被认为是占了谷歌退出中国的便宜。我们无法证明一件没有发生的事情......百度是后来者居上,通过技术和产品创新反超谷歌。到2010年,谷歌在市场份额持续下降的情况下退出中国时,百度的市场份额已经超过70%。如果现在谷歌回来,我们正好可以真刀真枪地再PK一次,再赢一次。”
如今,同跌至跟随者象限中的谷歌与百度也要面对ChatGPT所带来的种种挑战。
略有不同,此次百度抢在谷歌之前,在世界科技大厂当中率先作出和向外界推出了类ChatGPT产品。
正如谷歌云CEO托马斯·库里安所说:“我会告诉你这是一个新游戏的第一分钟,而游戏从来没有人能在一分钟内完成。”
在蓬勃兴起的生成式AI时代中,百度仍有机会通过随后的产品更迭来实现对于领跑者OpenAI的赶超。
钛媒体报道称,文心一言不久就会在今年四五月迎来下个版本或新功能,后续会在月度或者双月度频率下,显示文心一言的全新功能或者新版。
在过去的三十年里,互联网的发展,中国科技公司就是靠“小步快跑,迭代快”方法论,在应用创新方面,实现了对同类型美国企业由模仿到超越。
面对当前新一轮AGI竞赛,放眼国内科技公司,百度在AI领域也许会赶上甚至超过国外的同行。还没有等到这一战略机遇,百度在AI领域已坚持了十年。
正如李彦宏所说:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”
在2013年成立中国第一个深度学习研究院后,百度在之后的十年中,对AI的投资超过1000亿元,成为国内大型科技和互联网企业研发投入占比最大的企业,并且陆续开发了第一个国产的深度学习框架——飞桨,成为迄今为止国内唯一能够正面对抗国际两大主流框架——TensorFlow,PyTorch的深度学习框架,以及百亿参数的中英文大模型PLATO-X、千亿参数大模“百度,文心”,和知识增强的大模型Ernie等。
灼识咨询曾经在一份报告中中将百度被纳入中国AI领导地位,除深度学习框架飞桨在国内深度学习框架中排名第一,也是因为百度不但在国内AI专利最多,而且在AI专利申请量也最多,也凝结着国内最多开发者,成为国内最大开放AI平台。
国盛证券ChatGPT产品报告称,这是一款大厂游戏,属于云服务能力。
在百度智能云全国TOP4头部阵营位置的推动下,百度正好成了少数走上牌桌上的人。这背后,不仅有技术上的优势和实力支持,还有强大的产业基础。更有甚者,百度在芯片层以昆仑AI芯片为辅助,框架层飞桨深度学习,在模型层建立文心大模型,和应用层查找,自动驾驶、智能家居等系列产品,成为目前世界上少有的具备全栈自研能力AI企业。
消费互联网的用户增速放缓,且各家核心App基本触达月活天花板后,中国的科技大厂们纷纷喊出转型产业互联网的口号,开始向数字化发展、在智能化浪潮下掘金。
一场以大模型为中心的新竞赛,已于最近两年悄悄展开。随着越来越多的企业加入大模型开发行列,越来越多的用户也开始关注大模型这个新兴领域。IDC发布的《2022中国大模型发展白皮书》显示,自2020年起,中国大模型的数量急剧增加,只有2020年至2021年间,中国大模型数量就从2个增至21个,与美国数量级相当,在很大程度上领先了世界。
除百度文心大模型是市场格局的第一梯队,2021年4月份,一众科技大厂在百度后,纷纷集中披露自己的大模型产品,华为发布千亿参数规模盘古大模型,阿里巴巴达摩院推出语言大模型PLUG,名为中文版“GPT-3”,并以此为基础,于2022年9月发布通义大模型系列。这一系列大模型的亮相让原本就火热的大模型行业再添一把火。晚了一步腾讯在2022年4月份,向外界透露混元大模型的情况。
相对于文心大模型而言,以上大模型的功能基本相同,比如都有文生图,文本转视频和自动生成文案的功能。
在百度文心大模型基础上呈现AI艺术创作,用户键入文字,AI即可按语意作画创作。
而这些科技大厂也都不约而同地对类ChatGPT的产品进行了内部策划。百度传出文心一言即将公布的消息之后,就进入了2月,华为向外界透露,与ChatGPT的定位相似,自2020年起一直处于布局阶段;另一方面,阿里巴巴披露了阿里版聊天机器人ChatGPT的开发情况,已经进入内测阶段;腾讯被曝已经为类ChatGPT产品组建混元助手项目组,与腾讯内多方团队共同搭建了大参数语言模型,希望“成为国内的业界标杆”。
暂时还没有出现在大模型字节跳动中,还于最近有媒体报道,大模型中已经有了布局,分别从语言与图像这两个模态用力,其中,语言大模型团队已于年内成立,探索和搜索,广告以及其他下游业务相结合,预计将赶于年内启动大模型方案。
在追OpenAI,甚至还打算超过前者,百度也不只一个。在这场互联网时代的“战争”中,谁能率先布局,抢占制高点?这场比赛将围绕着技术与速度进行双重赛跑。从某种意义上说,谁在这场“跑马圈地”中领先一步,谁就能赢得未来发展主动权。谁最先推出产品,任何一个人都可能在用户真正反馈的帮助下,把握先机,由此,随时间的推移,形成了越来越强烈的马太效应。
这不难理解,李彦宏为什么会在2月年初对文心一言项目下达“三月,内测上市”死命令。
微软提供的一组数据,更直观地感受到生成式AI产品迭代速度:GPT至GPT-3,背后参的数量由1.17亿猛增至1750亿人,上升近1500倍。
“大语言模型是个马太效应非常明显的行业,可以说如果落后18个月,就基本没机会了,因为先一步发布的产品已经迭代得非常先进了。”一位知名互联网公司高管告诉记者,“我觉得这个市场的竞争非常残酷,没有哪个品牌能够长期保持领先地位,所以我们必须要有一个长远战略和发展规划来应对这种竞争压力。李彦宏这样感慨。
在这GPT的争夺战里,时间即是生命,效率即是金钱。