类ChatGPT应用为何在2023年的春天“竞相开放”?“文心一言”可否成为百度的新技术引擎呢?
文|王倩
ID | BMR2004
来源 |《商学院》杂志4月刊
千呼万唤始出来!
2023年,百度创始人、董事长兼首席执行官李彦宏首次公开亮相,便带来了百度的重磅产品——文心一言。但这一次,公众对李彦宏和“文心一言”有点小失望。
录播互动、无现场演示,两位高管略微磕绊的演说,给原本属于文心一言的高光时刻,增加了一种难以言说的意味。
发布会当日,百度集团(09888.HK)股价午后跳水,一度跌逾9%。在百度文心一言发布前一天,当下爆火的ChatGPT宣布升级到第4代。文心一言正对标ChatGPT,外界不可避免地将二者进行了对比。此外,类GPT应用还有Google旗下Bard等。
类ChatGPT应用,为何在2023年的春天“竞相开放”?“文心一言”可否成为百度新技术引擎呢?
01
诞生
每隔一段时间,人工智能领域就会有一个新的热点出现。而2022年的爆款,非生成式AI莫属。生成式AI,即利用现有文本、音频文件或图像创建新内容的技术,无论是ChatGPT、还是Google的Bard、抑或文心一言,都属于生成式AI。
文心一言是百度研发的对标 ChatGPT的大语言模型、生成式AI产品。
在百度文心一言的发布会现场,李彦宏演示了文心一言的几种能力:文学创作、商业文案的创作、数理逻辑的推算、中文的理解、多模态生成。
李彦宏表示,大模型训练需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。根据国盛证券报告《ChatGPT 需要多少算力》显示,GPT-3训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。
这种耗资巨大的投入,并非每一个企业都能支撑得起。财报显示,2022 年百度核心研发费用 214.16 亿元,占百度核心收入比例达到 22.4%。
同时,这种超大规模模型的训练和推理,给深度学习框架带来了很大考验。除了资金,还需要有强大的算力支持。为了支持千亿参数模型的高效分布式训练,百度的AI深度学习框架——百度飞桨(PaddlePaddle),专门研发了 4D 混合并行技术。
文心一言并非“横空出世”,早在2019 年,百度就推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0每天接受数十亿次用户的搜索请求。根据其最新发布的ERNIE 3.0 Zeus(任务知识增强),已经拥有千亿级参数,并具备智能创作等各类自然语言理解和生成任务。
百度是为数不多的进行全栈布局的人工智能公司。所谓全栈布局,是指AI深入到从设计到最终实现的每个环节,包括底层芯片的IP和芯片产品、计算架构、API等。
人类进入人工智能时代,IT技术的技术栈发生了根本性变化。过去技术栈基本分为三层:芯片层、操作系统层和应用层;现在可以分为四层:芯片层、框架层、模型层和应用层。文心一言位于模型层。
“洛阳城里春光好,阳艳无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央”。这是百度发布会现场,文心一言即兴作的一首“藏头诗”,不仅如此,它还能准确讲出“洛阳纸贵 ”这一成语典故以及对应的经济学原理。不得不说,文心一言在中文语言和中国文化上的表现,令人满意。
从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但整体而言,这类大语言模型还远未发展到完善的阶段,有赖于通过真实的用户反馈而逐步迭代。
02
布局AI
百度为国内生成式AI开了一个头。
北京大学新闻与传播学院教授胡泳认为,人工智能是科技领域的一个大事件,影响深远。不仅涉及到产业和企业,还会影响到整个社会和文化。“从战略角度讲,中国互联网厂商肯定要进入,否则意味着我们将在关键技术的跨越阶段错失很大的机会。”胡泳表示。
过去十年,移动互联网的发展改变了国内的互联网格局。尤其是在BAT三阵营的争夺中,单从股价来看百度已经掉队多年,尤其在火热的电商潮流中,百度很明显地败下阵来,这也让人工智能这条主赛道成为百度的必争之地。
实际上,早在2010年百度就成立了专门的业务部门——自然语言处理部,迈出了初探AI的第一步,并由此成为了中国最早深度布局AI的企业。2013年初百度深度学习研究院正式成立。2016年,百度推出人工智能产品百度医疗大脑。2017年,李彦宏搭乘基于apollo技术的自动驾驶汽车,经北京五环路去参加发布会,引发轰动。也就是在这场发布会上,百度宣布调整战略为All in AI。
李彦宏认为,生成式AI将催生新产品、新业态,会有很多创业和投资机会。百度首席技术官王海峰表示,文心一言是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括监督精调、从人类反馈中进行强化学习(RLHF)、提示构建、知识增强、检索增强和对话增强。
值得注意的是,监督精调是百度基于对中国语言文化和中国应用场景的理解,筛选了特定的数据来进行模型训练;提示构建则是对词语序列的概率分布进行建模,利用上下文信息预测后续词语出现的概率分布,从而同时使用RLHF,将人类偏好作为奖励信号并微调模型,实现有逻辑的对话能力。
03
商业化
文心一言发布当日,百度股价大跌,但峰回路转,次日(3月17日),百度的股价大涨,收盘涨幅超13%。百度方面表示,已经有650家企业与百度的文心一言达成合作。
李彦宏表示:“百度希望和大家一起,推动人工智能技术进步,让所有人都能使用最先进的生产力工具,让所有人都能从中受益。”
胡泳认为,百度在这场AI之战中有属于自己的机会。一方面,百度本身是技术出身,且核心是中文搜索,原本就拥有数10亿的搜索数据和图片数据,这些数据和图片构成了百度的知识图谱,这是它的先天条件。
在胡泳看来,AI人工智能的竞争,核心是算法、算力和数据的综合竞争,数据是扼守这场竞争的重要一环,百度对中文语言的处理处于独一无二的位置,这些都属于百度的先天优势。
另一方面,百度不仅要做面向消费者层级的产品,还要做面向企业的或者面向产业的产品。百度将文心一言定义为自主研发的产业级知识增强大模型,这并非简单的模型,而是意味着百度有实力在行业大模型上有工具、有平台,能够支撑企业和开发者进行高效便捷的应用开发。
有机构预测,到2030年,人工智能可以将每一个知识工作者的生产力提高4倍以上。很多人的工作性质会发生不可逆转的改变,而且不少人也在担心这一趋势的到来。
在胡泳看来,现阶段人工智能与人类有可能是一种互补关系。虽然在内容市场中难以避免机器人的进入,但是机器人的投入使用并不是为了替代人类写作,有时候可能是担任人类创作者的助理,在某种程度上可以减少内容市场中的人力投入,而在某些场景内,人工智能的写作工具比人类作家有能力在更短的时间里创造更多内容。
根据李彦宏的预测,文心一言将会打开三大产业的机会大门。
第一类是新型云计算公司,文心一言将根本性地改变云计算行业的游戏规则,其主流商业模式将从IaaS变为MaaS。之前企业选择云厂商更多看算力、存储等基础云服务。未来,企业更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层技术栈之间的协同。
第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,它们具有行业专有技术,调用通用大模型能力,为行业客户提供解决方案。简单来说,预训练的大模型是基础设施,在此基础上可以快速抽取生成场景化、定制化、个性化的小模型,实现不同行业、垂直场景的布局。比如百度文心大模型,已经在电力、金融、媒体等领域发布了10多个行业大模型。
第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。就像移动互联网时代,最成功的商业产品不见得是安卓和iOS,而是基于安卓和iOS开发的微信、淘宝、抖音等各种超级应用。
但让胡泳担心的是,技术的飞速发展正突显法律的滞后。他呼吁,能否预先将法律框架建立起来,建立相应的规则,让人工智能的发展进入一个良性轨道。
04
较量
尽管人们对文心一言“千呼万唤”,但其亮相不免让业界有些失望:录制Demo无现场演示,业界争议纷纷,在资本市场,百度股票更是出现大跌。
互联网分析师丁道师认为,原因在于百度文心一言发布前一天,OpenAI的GPT-4发布,而GPT-4的表现力远超这个时代所有同类型产品。
ChatGPT-4提前登场,文心一言不可避免地会被拿来做比较。李彦宏既强调百度的客户及百度本身对文心一言的庞大需求,也不断放低身段,承认百度“没有完全Ready”,这也意味着百度要对标ChatGPT甚至是GPT-4,门槛依然很高。
在胡泳看来,百度真正的考验刚刚到来,虽然百度早就将主赛道调整到人工智能上,如今人工智能领域也已然迎来机会,但在业内燃起熊熊的战火背景下,如果百度尚未有相关产品,那么在人工智能领域的较量可能就会落在下风。
然而,文心一言与ChatGPT的对比是不可避免的。在文心一言发布后,不少测试者便对二者进行了比较。丁道师认为,ChatGPT的回答相对来说更简洁一些,百度的文心一言回答更丰富一些;文心一言对中文的理解,在一些特定的中文语言环境之下,表现要比ChatGPT要好一些;由于百度文心一言是中国企业研发的产品,要符合中国的法律法规和监管政策,很多敏感问题无法给出答案。相对来说,ChatGPT回答一些敏感问题时,尺度要更大一些。
丁道师认为,需要客观承认,文心一言是一款新的产品,和GPT-4这样的“前辈”相比,差距较为明显。
但他同时表示,如果仅仅在中国市场使用这种生成式的语言模型,随着时间的推移,比如说一年后、两年后,相信文心一言的表现要好于ChatGPT。反之如果在全球范围内使用的话,短期内还是ChatGPT比百度要好一些。
胡泳也认为,百度可能会占有另外一个优势,当它面对中国市场的时候,因为中国的产业和企业有它的独特性,那么它显然会比国外的公司更熟悉中国企业的应用。
本文来源《商学院》杂志2023年4月刊