从小甜甜到牛夫人，昨日火热的大模型，今天已显微凉皆因不接地气

作者：电科技发布时间：2024-01-30

前不久，360公司董事长周鸿祎在亚布力论坛上表示：“2023年，我们看大模型像仰望神一样，觉得那是曼哈顿计划，造了一个原子弹。到今年年初，你们再看大模型就跟茶叶蛋似的。”他指出，现在开源模型比比皆是，各种模型层出不穷。

周鸿祎还指出：“选模型已经不是问题，而且都免费。去年大家都飙着OpenAI，都想搞通用大模型，想垄断全世界。但2024年的目标变了，是大模型如何找到自己的应用场景，而最大的应用场景就是跟各行各业结合，因为和各行各业结合才能带来工业革命。”

2022年，11月，OpenAI公司发布了ChatGPT，在接下来的2023年中，这种人工智能聊天机器人开始频繁登上媒体头条。基于GPT-3.5和GPT-4大模型的ChatGPT可以用自然语言与用户进行对话，还可以生成各种类型的文本，例如代码、歌词，甚至是论文等。

ChatGPT的火爆程度可以从它的估值上看出来，其公司OpenAI的估值一度高达290亿美元，成为美国估值最高的初创企业之一。

ChatGPT也引发了国内外相关产业的竞赛热潮，全球各大企业都发布了自己的大模型和AI聊天机器人，例如微软的Copilot、谷歌的Gemini和亚马逊的Olympus等。

国内企业当然也不会示弱，百度、阿里、腾讯和华为等一线科技巨头均纷纷下场，发布了自己的大模型。百度的文心大模型、阿里云的通义大模型、腾讯的混元大模型、华为则有盘古大模型，林林总总，不一而足。

然而，在经过一年的喧嚣之后，国内外的大模型似乎又都无一例外地都陷入到了一个怪圈，那就是“发布时热热闹闹，落地后却变得悄无声息”。

各家的AI大模型都没有在市场上掀起太大的波澜，只是在技术界和产业界产生了一定的影响，却没有引起太大的社会共鸣。

电科技认为，这主要还是因为大模型的“不接地气”。在普通用户看来，这些大模型似乎更适合用在一些简单的休闲场景中，如陪用户聊天、写诗、生成图像等等，这些功能虽然有趣，但是并不能为用户产生太大的价值。而在工作场景中，大模型尚待进一步优化。之前各家宣传的“提高生产力、解放想象力”愿景其实并未实现。

对于各家企业狂卷大模型的做法，百度创始人李彦宏就曾表示，大模型本身是不直接产生价值的，基于基础大模型开发出来的应用才是它存在的意义。李彦宏直言，对于创业者来说，“卷大模型没有意义，卷应用机会更大”。

虽然李彦宏的这番言论是为了推广自家的产品，但是国内大大小小的企业都在争相开发大模型却是真实存在的现象。

就像当年的千百家团购网站忽然拔地而起而又忽然轰塌倒地的景象一样，大模型如今也正在重复这个故事，俨然有了从“小甜甜”到“牛夫人”的沧海桑田之感。

难怪周鸿祎吐槽，现在的AI大模型已经从原子弹变成了茶叶蛋。

对于大模型产业的未来，目前业界的一大共识是，它的未来在于与产业实现垂直整合，企业需要训练自己的“私有化大模型”，并将其打造为自己的核心资产。

金沙江创投董事总经理朱啸虎就曾表示：“AIGC（生成式人工智能）在国内只有两种机会：1）现有场景降本增效；2）技术非常难，美国也做不出来，国内部分人工部分AI直接交付结果，比拼销售效率和支付效率。全部AI的反而很快就会成为红海。”

朱啸虎还指出：“很多垂直场景用开源小模型优化后的结果远比通用大模型要好，垂直场景和数据的重要性远超大模型本身。”

大模型的未来会发展成什么样子，谁也不知道，但是一个总体的期待就是，大模型需要“接地气”，能够落地生根，和各个产业进行深度结合，而不是身怀绝技却难堪大用。

电科技相信，在经过了2023年这个“AI元年”之后，未来人工智能大模型很可能将走向新的方向，产业还会经过一番大浪淘沙，一大批乘风而起的大模型会消失，就像中国科学院院士陈润生所预判的那样，“中国现在有数以百计的通用大模型，其中的90%没多大用处，也发展不起来，只会加剧资源和人力的浪费，应该被淘汰。”

相关资讯