“文心一言”秀“五大场景”

作者：深圳商报发布时间：2023-03-17

李彦宏在发布会上。（受访企业供图）

深圳商报记者陈姝

3月16日下午，百度正式发布新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏等展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。他称，这类大语言模型还远未到发展完善的阶段，进步空间很大，“希望和大家一起，推动人工智能技术进步，让所有人都能使用最先进的生产力工具，让所有人都能从中受益。”

现场“秀”五大场景

发布会上，李彦宏展示了文心一言在五个使用场景的表现。

在文学创作场景中，文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结，并提出了五个续写《三体》的建议角度，体现出对话问答、总结分析、内容创作生成的综合能力。生成式AI在回答事实性问题时常常“胡编乱造”，而文心一言提升了事实性问题的准确率。

在数理推算方面，面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题，文心一言首先指出“题出错了”，然后根据修改后的问题按正确的步骤，一步步算出正确答案。

多模态生成方面，文心一言能够生成四川话等方言语音，不过由于视频生成能力因成本较高，现阶段还未对所有用户开放，未来会逐步接入。

“多模态是生成式AI一个明确的发展趋势。”李彦宏表示，“未来，随着百度多模态统一大模型的能力增强，文心一言的多模态生成能力也会不断提升。”

不完美但会很快进步

从文心一言的表现看，某种程度上具有了对人类意图的理解能力，回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但整体而言，这类大语言模型还远未到发展完善的阶段，有赖于通过真实的用户反馈而逐步迭代。在发布会上，李彦宏也坦言，文心一言还有很多不完美的地方。

百度首席技术官王海峰表示，文心一言是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术，ERNIE和PLATO中也已经有应用和积累，在文心一言中又有了进一步强化和打磨；后三项则是百度已有技术优势的再创新，也是未来越来越强大的基础。“文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮，效果会迅速提升，给你‘士别三日，当刮目相看’的惊喜。”李彦宏强调。

带来三大产业机会

AI市场爆发性的需求增长，将释放出前所未有的、指数级的商业价值。李彦宏预测，大语言模型将带来三大产业机会。

第一类是新型云计算公司，其主流商业模式从IaaS变为MaaS。文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务；未来，更多会看框架好不好、模型好不好，以及模型、框架、芯片、应用这四层之间的协同。

第二类是进行行业模型精调的公司，这是通用大模型和企业之间的中间层，他们可以基于对行业的洞察，调用通用大模型能力，为行业客户提供解决方案。这方面，百度文心大模型已经在电力、金融、媒体等领域，发布了10多个行业大模型。

第三类是基于大模型底座进行应用开发的公司，即应用服务提供商。李彦宏断言，对于大部分创业者和企业来说，真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型，这很不现实，也不经济。基于通用大语言模型抢先开发重要的应用服务，这可能才是真正的机会。目前，基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景，已经涌现出很多创业明星公司，可能就是未来的新巨头。

“AI会彻底改变我们今天的每一个行业。AI的长期价值，对各行各业的颠覆性改变，才刚刚开始。未来，将会有更多的杀手级应用、现象级产品出现，将会有更多的里程碑事件发生。”李彦宏说道。