技术路线再起争端！文心一言用户破2亿，百度李彦宏：开源模型会越来越落后

作者：和讯网发布时间：2024-04-16

文心一言百度李彦宏

图片由百度提供

4月16日，百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上，正式宣布发布文心大模型4.0的工具版。

李彦宏表示，相比一年前，文心大模型的算法训练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。“也就是说，客户原来一天调用1万次，同样成本之下，现在一天可以调用100万次。”

李彦宏还透露，从去年3月16日首发，到今天一年零一个月的时间，文心一言用户数突破了2亿，每天API的调用量突破了2亿，服务客户数或者说企业达到了8.5万，利用千帆平台开发的AI原生应用数超过了19万。

李彦宏强调，大语言模型本身并不直接创造价值，基于大模型开发出来的AI应用才能满足真实的市场需求。他分享了基于大模型开发AI原生应用的三个思路：

一是，未来大型的AI原生应用基本都是MoE。即大小模型的混用，不依赖一个模型来解决所有问题。

二是，小模型更有效价比。小模型推理成本低，响应速度快。在一些特定场景中，经过精调后的小模型，它的使用效果可以媲美大模型。这也是今日百度同步发布ERNIE Speed、ERNIE Lite和ERNIE Tiny三个轻量模型的原因。

三是，智能体大幅降低开发门槛，可低代码甚至零代码生成AI原生应用。

李彦宏表示，智能体是当前非常热的一个话题，随着智能体能力的提升，会不断催生出大量的AI原生应用。智能体机制包括理解、规划、反思和进化，它让机器像人一样思考和行动，可以自主完成复杂任务，在环境中持续学习、实现自我迭代和自我进化。

“在一些复杂系统中，我们还可以让不同的智能体互动，相互协作，更高质量地完成任务。这些智能体能力，我们已经开发出来了，并且向开发者全面开放。”李彦宏称。

李彦宏介绍，因为基础模型文心 4.0 可以根据需要，兼顾效果、响应速度、推理成本等各种考虑，剪裁出适合各种场景的更小尺寸模型，并且支持精调和 post pretrain。这样通过降维剪裁出来的模型，比直接用开源模型调出来的模型，同等尺寸下，效果明显更好；同等效果下，成本明显更低，“所以开源模型会越来越落后”。

李彦宏所持观点，与不少业内人士相反。在近期哈佛大学的一次演讲中，360集团创始人周鸿祎表示：“没有开源就没有 Linux、没有互联网，甚至包括我们自己借助了开源技术才能发展至今。”他预言，在未来一到两年内，开源技术的力量很可能会超过闭源技术。

周鸿祎表示：“现在开源模型的能力达不到 GPT-4。但是专注在一个方向上，用企业内部的专有数据加上专业训练，进行能力的加强之后，它就有可能在专业能力上超过 GPT-4。”

今年3月份，金沙江主管合伙人朱啸虎亦表示了类似的观点：“现在开源比非开源落后一代，但长远来看，开源肯定会赶上来。”除此之外，国内处于第一梯队的大模型创业公司百川智能和智谱AI也都选择了开源的技术路线。

不过，关于闭源和开源孰优孰劣的技术路线之争，市场并没有定论。“客观来讲，2023年在国内市场上，百度在大模型上出拳的体系和章法，领先于国内其他互联网公司，可以看出它在人工智能上过往的积累。”分析师赵松告诉时代周报。

作为国内第一家推出聊天机器人，并开放内测硬刚ChatGPT的互联网公司公司，百度在人工智能领域具备一定先发优势。实际上，早在2019年3月，百度就对标谷歌BERT模型，推出了文心大模型ERNIE 1.0，称其中文效果超越BERT，并于2021年12月达千亿参数，迈进“智能涌现”门槛。

“百度与阿里、腾讯、华为在大模型行业处于第一梯队，是获得业内认可的‘全能型选手’。百度在大模型、大模型工具平台、大模型对自身应用的重构、大模型生态包括开发者孵化上，搭建了比较全面的体系”，赵松称：“当下，基础大模型性逐步提升，落地应用场景是国内大模型企业的难点。”

李彦宏在演讲中提到“落地”相关话题时表示：“无论是中国，还是美国，最好的AI原生应用还没有出现。”他认为，就像移动时代诞生了像微信、抖音这样的“mobile-native”的应用一样，AI原生时代一定会有新的超级应用将基于大模型开发出来。

但上述超级应用的诞生不会在短时间内骤然出现。这既需要基础大模型技术能力不断迭代，也需要越来越多开发者参与其中。