近期以来,ChatGPT全球爆红,在中国也掀起了大语言模型研究热潮。谷歌、微软、百度、阿里、腾讯、字节……全球头部科技大厂再次站上了同一个赛道,包括很多AI领域的创业者、创投机构纷纷行动了起来,开启了大语言模型“军备竞赛”。
我国在AI技术创新方面已有多年积累,在建构大语言模型上具备优质的土壤。百度大语言模型“文心一言”官宣在3月16日发布,成为我国第一家做出大语言模型的科技大厂,备受业界关注。
市场上比较关注的问题是:大语言模型赛道是否拥挤?为何是百度拔得头筹?国内大语言模型是否能与ChatGPT展开竞争?
首先,大语言模型作为AI技术创新的产物,绝非一时炒作的概念。基于自然语言理解的人机对话是AI技术创新的一个重要方向,ChatGPT展现出的人机交互水平,显示大语言模型已经具备成为通用人工智能平台的一些特征,这就意味着在千行百业中具有广泛的应用潜力。
市场足够大,赛道也必然拥挤:主流科技大厂不愿错过这种变革性的发展机遇,初创公司也希望把握住成为“独角兽”的科技浪潮。因此,这一赛道必然会出现、激烈竞争和残酷淘汰赛,因为建构大语言模型存在资金、技术、人才构筑的极高门槛,且很显然具备科技业广泛存在的“马太效应”特征,注定是全球科技大厂“巨头的游戏”。以ChatGPT为例,背后不仅有天才的技术团队,更有微软公司数十亿美元的投资和资源扶持。
其次,国内科技大厂竞争力各有差异,在AI创新领域,百度起步最早、投资力度最大、应用场景最丰富,拥有完整的芯片、框架、模型和应用四层技术栈,某些领域具有全球领先的技术实力。例如知识增强方面,百度早在2019年发布的文心大模型,是全球首个知识增强千亿大模型,拥有世界上最大规模知识图谱,包含50亿实体、5500亿级事实,每天调用量超过400亿次。在检索增强方面,在大模型底层融合搜索架构和生成式AI架构,搜索在真实数据和用户需求理解上具备先发优势,能提升大语言模型的准确性和实效性。在对话一致性、长期记忆和多轮对话丰富度上,百度也实力显著,其“知识与深度学习融合的通用对话技术及应用”曾获中国人工智能协会吴文俊奖特等奖,是历史上首个特等奖。
百度文心一言拔得头筹,可以说是必然的。主要的关注点可能在于:和ChatGPT相比产品力如何?
要知道,ChatGPT在发布之初也有诸多槽点,但随着越来越多人使用,它也变得越来越“聪明”,进入2023年后,几乎是一夜之间突然爆红。业界要充分意识到大语言模型的技术难度,百度文心一言只要能达到ChatGPT去年11月发布水平,就实属不易。
特别是在中文领域,ChatGPT的表现远不如英文领域。随着使用的人越来越多、训练越来越深入,文心一言有可能在某些方向展现出更强的特质,尤其是在汉语言使用场景,国内的大语言模型理解显然能够更加深刻。文心一言将成为更适合中国市场的大语言模型。
随着更多大语言模型面世,互相竞争并不断进步,产生的优胜者——文心一言或者其他,其竞争力值得业界期待,也值得广大用户期待。我们可以相信,大语言模型建构将带动应用开发、场景开发等产业链联动,带来更快的迭代速度和更大的想象空间。无论是资金、技术还是人才,以文心一言为代表的大语言模型能够突破这些门槛。
C114通信网 南山