北京商报讯(记者 魏蔚)7月4日,百度创始人兼CEO李彦宏在2024世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上再次谈及开源与闭源大模型之争,他表示开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景。“当你处在激烈竞争的环境中,需要让业务效率比同行更高、成本比同行更低,这时,商业化的闭源模型是最能打的。”同时强调,大模型的重点还是“卷应用”,“没有应用,光有基础模型,不管是开源还是闭源都一文不值”。
“今年(2024年)以来,很多人混淆了模型开源和代码开源的概念”,李彦宏说道,“模型开源只能拿到一堆参数,还要在做SFT、安全对齐,即使是拿到对应源代码,也不知道是用了多少比例、什么比例的数据去训练这些参数,无法做到众人拾柴火焰高,拿到这些东西,并不能让你站在巨人的肩膀上迭代开发。”
李彦宏直言,同样参数规模下,开源模型的能力不如闭源,“如果开源想能力追平闭源,它需要有更大的参数规模,这意味着推理成本更高、反应速度更慢。很多人拿开源模型来做改款,以为这样可以更好地服务自己的个性化需求,殊不知这就变成了一个孤本模型,既无法从基础模型的持续升级中获益,也没办法跟别人共享算力。”
他承认,开源模型在一些学术研究、教学领域有存在价值,可以用于研究大模型的工作机制,形成理论。但开源模型并不适用于大多数应用场景,在激烈的商业环境中,想要让业务效率高于同行、成本低于同行,商业化的闭源模型是“最能打的”。他以百度在小说创作上的实践为例,当从开源模型转向轻量级模型、再转向文心大模型4.0后,小说生成的可用率和优质率得到极大提升,让网文作者如虎添翼。在李彦宏看来,大模型的重点还是“卷应用”,“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”