当前位置:首页|资讯|AI大模型

国产AI大模型猛打价格战,但从业者表示没什么用,纯噱头

作者:知危发布时间:2024-05-28

这个 5 月,国内大厂的大模型也开始争 “ 地板价 ” 了。 

5 月 15 日,字节跳动的豆包大模型发布,定价 0.0008 元/千Tokens。21 日,阿里通义千问 GPT-4 级主力模型 Qween-Long 降价 97%,API 输入价格从 0.02 元/千Tokens 降至 0.0005 元/千Tokens,每千 Tokens 比豆包便宜 0.3 厘。同天,百度的文心大模型中的两大主力模型 ERNIE Speed 和 ERNIE Lite 直接宣布免费。22 日,腾讯也跟进了降价风潮,旗下数款大模型降价 50%-87.5% 不等,有三款大模型直接免费。 

似乎,中文互联网世界的任何事物都要经历一波价格主导的 “ 百团大战 ”。

国产大模型价格普降,理论上并不意外,毕竟要全面铺开市场,利用冗余产能,低价和免费是最直接有效的方式。但同时,在行业人士看来,降价这件事经不起细琢磨,无论是长远效益,还是眼下国产大模型的技术水平,这场价格战来得都比较急,而且有点不痛不痒。

AI 世界瞬息万变,或许再过一段时间,这场价格风波会迭代成新的战斗方式,几分几厘的争执并不重要。不过,在这个也许会转瞬而逝的风波面前,我们试图稍 作停顿,找寻国产大模型降价背后的原因,以及这场风波有可能的后续。 

01 国产AI大促销,一家更比一家低

截至目前,参与到 “ 价格战 ” 中的大厂有字节跳动、阿里、百度、腾讯。 

5 月 15 日,字节跳动正式发布旗下豆包大模型,在发布会上重点强调了豆包的价格优势。那天,豆包在这几家大厂里还是最便宜的,在国内整体大模型厂商中也几乎是最低价,豆包主力模型在企业市场的定价只有 0.0008元/千Tokens,比行业便宜 99.3% 。

一周后,阿里和百度在同天跟进降价。通义千问 GPT-4 级主力模型降价 97%,差不多打了一折,API 输入价格从 0.02 元/千Tokens 降至 0.0005元/千Tokens,比豆包还便宜 0.3 厘。另一边,百度文心大模型的两大主力模型 ERNIE Speed 和 ERNIE Lite 干脆直接宣布免费。 

次日,腾讯混元大模型也来了一波价格普降,除混元-pro 的输出价格仍保持在 0.1 元/千Tokens 之外,其他大模型的价格都降了 50%-87.5% 不等。调价前,最贵的是 0.12 元/千Tokens 的混元-standard-256k 大模型,而这次降价最多的也是它,输入价格调至 0.015元/千Ttokens,输出价格 0.06 元/千Tokens,降幅分别为 87.5% 和 50% 。在腾讯云降价的同一天,科大讯飞旗下大模型讯飞星火 API 能力也正式免费开放。

如今,国产大模型已经进入了以毫厘论价甚至免费的时代。客观来说,大模型降价是一直以来的趋势,去年以来,OpenAI 就进行了多次降价,5 月 13 日新发布的 GPT-4o,面向 ChatGPT 的所有付费和免费用户发布,取消其他所有限制,API 价格从 0.1 元/千Tokens 降至 0.035 元/千Tokens( 价格单位经过换算以便与国产厂商对齐 )。 

几位行业人士对知危表示,降价这件事不算大,也不算稀奇。现在价格被打下来的主要是文字生成这块的大模型,行业其实还没有做到把别的模态也打下来。而经历过去一年多的技术迭代,文字生成效果比较好的模型现阶段已经可以跑到端侧了,端测运行客观来讲就是免费的。” 心光 App 联合开发者王禹效对知危说。 

他补充,降价这件事本身可能也有很多没直接说的东西。“ 比如 OpenAI 有两种报价,一种报价对应的服务响应比较快,另一种报价响应慢一些,也就是他们把服务器的剩余资源拿来给你用。一般来说,大模型厂商不太可能把最好的模型拿来做免费,你会发现真正的好东西还是很贵,因为好的模型的算力成本也确实高。” 

国产大模型在这个 5 月纷纷拿出价格诚意,一方面是大势所趋,连技术水平更高的大模型都没那么贵,上述企业自然也希望通过降价获得更多市场。

另一方面,来自于大模型自身的迭代。王禹效说,从技术角度来看,最开始大模型需要疯狂堆料,但后来再做优化的时候会发现,其实不用堆太大的参数,可以通过知识蒸馏降低计算资源和模型大小,那之前的模型成本就能降到之前的十分之一,还能保证差不多的效果,降价也就顺理成章了。

02 噱头大于实际的一次价格战

在豆 包大模型发布会上,火山引擎负责人谭待表示,大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。而且,如今基座大模型已经进入了稳定迭代的阶段,在模型训练和推理使用上,都还有长足的优化空间,成本下降得很快。 

字节的解释,透露出两个信息。一是模型结构完成了优化调整,算力效率提升了,这是降价的底气。二是通过降价拉高市场使用量,反过来对大模型的继续迭代也是好事。 

理论上讲,这是一个完美的答案。不过,如果再仔细推敲起这个逻辑,很多现实结果还有待验证。

首先,从商业模式上说根基不稳。AI 应用创业者谷林( 化名 )对知危表示,以价换量占领市场,这个逻辑看起来是对的也是常见做法,但这一策略需依赖于能够实现规模效应的商业模式,大模型 API 却并不是:

“ 大模型面向 B 端用户,也就是开发者,要切换 API 的话,不存在切换门槛和壁垒。”

大模型的成本分有模型训练、商业服务、API 服务这三类。单说训练成本,就需要昂贵的投入,包括优质工程师、标注过的高质量数据以及各领域科学家对模型进行调优,这些成本都十分高昂。此外,API 使用模型进行推理的运算成本,涉及显著的电力和硬件消耗。谷林表示,“ 正常的商业模式,就算没有利润,也要考虑到卡的成本和电力成本的,如果 toB 要持续提供好的服务,一定是要有利润的。现在厂商给出每百万 Tokens 几块钱几毛钱的价格,电价可能都不够,更别提卡了,那肯定要靠企业从其他业务的利润上拿来做补贴。” 

就像消费互联网常见的 “ 百团大战 ” 一样,在 AI 大模型领域,先挑起价格敏感的,也是大厂。无论算力效率如何提升,成本如何比以前降低,AI 大模型毕竟没有到一个全行业形成价格标准的时代,现在去无限压低价格,还是比较具有煽动性的事情。 

不过,如此降价能不能长期持续也不好定论。如果是传统的 “ 价格战 ”,卖的是一次性或标准化的服务,那确实谁便宜谁占领市场。但 AI 大模型不一样,毕竟 toB 的技术企业还是要不断做研发创新的,现在的低价买到现在的技术,日后开发者必然也需要更好更与时俱进的技术支持,到那时还可以用现在的价格去买吗?

还有一个值得注意的点,大厂尚有充裕的算力资源可以拿出来做低价,“ 反而是现在正在烧钱跑的模型侧的一些公司,包括跑开源的公司,他们压力比较大,因为模型研发还是挺贵的,是一个比较重资产的游戏。” 王禹效表示。 

在行业人士看来,国内这批大模型理论上是要比 OpenAI 等海外厂商的大模型差上 2-3 代,要补齐差距可能也要半年到一年的时间。也就是说,现在这拨低价,是用旧的模型去促销,抢存量市场,压力还在后头。

所以,这可能不是一场 “ 价格战 ”,而是赔本赚吆喝。

03 价格不是当下最需要卷的

价格 降了,无疑会带来不少正向的影响。能帮助到现有应用的开发团队,为其提供很多选择,可以把免费或超低价的模型都拿来试试。同时也能带来新的创业机会,在几乎不需要考虑这方面成本的情况下,一些好的想法更容易落地。无论如何,大模型通过低价一定会收获使用量上的暴增。 

因为大模型便宜了,所以选择用用看,这个逻辑是成立的。但是,要不要继续用下去,或者长期选择哪个大模型,却不是以价格为导向的。

王禹效解释,在国内这批大模型宣布降价之前,一个创业者如果真想做点什么,那几乎每家大模型厂商都会给出很高的免费额度。“ 比如 GPT 一开始给的是将近 2 万人民币的免费额度,大家都可以申请。” 

对于真的有想法想做 AI 创业的人来说,价格不是最核心的痛点,只能说低价或 0 元购吸引他们过来创业了,但继续做下去的话,不会有人因为这款模型便宜就一直用,还是要筛选技术更好,更符合自己应用开发需求的模型。 

“ 对开发者而言,免费可以毫无顾忌地使用到更多场景下进行推理,使用更长的 Context 提升推理的精确度和内容的多样性。但在认真做产品的团队,在技术选型上,还是首先考虑多模态的支持和内容质量,而不仅仅是基于成本考虑。最终一定是回归到大模型厂商的技术和服务上来,这才是壁垒,价格不是壁垒。” 谷林坦言。 

不仅是开发,在应用运营的实际情况中,价格也不敏感。王禹效举例,“ 前两天我们 App 的技术同事还问我,要不要搭一套新架构,这样随时可以在后台切换任何模型,都可以试试,还不会影响到业务。我觉得这个事情不着急,因为在应用侧的实际情况中,用户是不在乎你用了什么模型的,用户只在乎你的场景。所以,对于开发者来说,今天这个模型好,明天那个模型差,谁便宜了几毫厘,谁免费了,都没太大意义,你只要把用户最关心的某个场景的问题解决了就好。” 

更何况,一款 AI 产品会用到不止一个模型,价格高的模型、价格低的模型、免费的模型,开发者都可以用,免费的模型可以用在边角料上,做点简单的处理。当一个开发者同时是所有价位的模型的客户,似乎也不存在用价格抢客户的事情了,只能说大家都有饭吃。 

说白了,眼下国产大模型的 “ 价格战 ” 更像是营销手段,为厂商带来短期的获客,而真正决定留客率的还是模型本身的技术水平。 

这也是从业者们对大模型 “ 价格战 ” 并不兴奋的原因。不会因为便宜而一直选择,更不会因为贵就放弃好的模型。他们只觉得,在 AI 大模型还处于没有确立标准的野蛮时代,厂商用价格作为营销策略也是能理解的,就像字节在着重强调豆包的价格优势一样。“ 字节销售也是总来找我们,和其他厂商比,感觉字节大模型在营销上确实算最卖力的。” 王禹效说。 

归根结底,开发者和大模型是双向选择的过程。筛选客户的核心不是谁家便宜,这跟消费互联网的价格战不一样。谷林解释,“ ToC 的产品用户切换的壁垒,有用户心智,有市场占有。假如说厂商是 toC 之后积累了规模效应后,竞争优势很难打破,但现在大模型厂商提供的就是 API,不存在规模效应,B 端用户的切换成本也不高。实施免费和补贴市场策略是否真的有助于商业增长,能形成商业壁垒吗?这个策略是帮助行业发展,还是进入劣币驱逐良币的内卷?” 

搞促销,是互联网博弈局的常见套路。只是,对于正在探索的应用层开发者和跃跃欲试的新创业者来说,这次不一样,价格没那么重要。

王禹效坦言,“ 机会真是满天飞,你快点开始做就行了。现在立刻开始做,远比你去选哪个模型,哪个厂商,哪个更便宜,来得更实际一些。”

本文来自微信公众号“知危”(ID:BusinessAlert),作者:知危编辑部,36氪经授权发布。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1