就在5月15日,太平洋两岸的两大科技巨头谷歌和字节跳动都举行了活动,而多模态大模型全家桶则都成为了主角。其中,谷歌发布了AI助手Project Astra、对标Sora的文生视频模型Veo,字节跳动也正式上线“豆包大模型”家族。如果说这两大巨头发布的新技术、新功能可能还有些晦涩难明,那么新品的价格则无疑是普罗大众非常感兴趣的一点。
在发布豆包大模型的同时,字节跳动方面还搞出了一个大新闻,并吹响了AI大模型价格战的号角。据字节跳动火山引擎总裁谭待介绍,“大的使用量才能打磨出好模型,也能大幅降低模型推理的单位成本。豆包主力模型在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。”
其实不仅仅是字节跳动,进入2024年之后,几乎所有的国内大模型厂商都开始琢磨“价格力”了。此前在Create 2024百度AI开发者大会上,李彦宏除了贡献“开源模型会越来越落后”、“闭源是有真正的商业模式,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才”等金句之外,还表示文心大模型的推理成本降到了原来的1%,在客户原来一天调用1万次同样的成本之下,现在一天就可以调用100万次。”
紧接着,国内明星AI初创公司智谱AI宣布降价,其能力对标GPT3.5-Turbo的GLM-3 Turbo大模型API调用价格最高下调90%,仅需1元就可以购买200万Tokens。按一个汉字两个Token计算,给智谱AI的LM-3 Turbo充值1元,就能让大模型输出百万字的内容,都够一本长篇小说的体量了。
此外,百度方面也在不久前发布了文心大模型的轻量版,其中ERNIE Tiny版本的价格也来到0.001元每千tokens,1元也能买到100万tokens。而面壁智能的端侧模型“小钢炮”MiniCPM,则更是打出了“0元购”的口号。
此前在2023年,大模型赛道军备竞赛的主题是“性能”,各厂商乐此不疲地在C-Eval、CMMLU等大语言模型基准测试榜单上“刷榜”,“不服跑个分”也成为了彼时百模大战的经典场面,各家更是无不以更多的得分为傲。可到了2024年,随着大家对大模型祛魅,纯粹比拼性能已经很难调动用户的兴趣,大家更看重的则是如何通过大模型来解决实际问题。
2023年国内大模型赛道主要是进行宣传,大干快上是为了更好地从投资人手中拿钱,可面对这个赛道“烧钱如烧纸”的状态,投资者的热情也在迅速消退,一级市场的观望情绪开始占据主流。紧接着,大模型的商业化,或者说利用现有AI能力构建新产品就成为了今年的主题。既然要商业化,最简单、最直接的手段自然就是价格战,毕竟用投入来换市场份额是互联网行业烂熟于心的一套玩法。
这时候如果大模型厂商继续维持0.1元/千Tokens的价格,不光是C端消费者会望而却步,即使是B端用户恐怕也心有戚戚。毕竟大模型想要真正意义上有作用,廉价化是必经之路。当然,如果没有技术进步,即使大模型厂商想要打价格战也是巧妇难为无米之炊。但在百模大战拉开帷幕的一年时间里,国内大模型赛道也堪称是日新月异。
数据、算力、算法无疑是大模型的基石,考虑到目前算力供应短缺,以至于OpenAI、微软、谷歌等海外厂商都在琢磨着自研芯片,以及英伟达GPU受管制的背景,所以国产大模型打价格战,算力并不是关键。同样,数据也不是主因,因为在高质量语料的价值已经成为共识之后,大模型预训练需要的数据成本是不降反升。实际上,大模型的算法在过去一年突飞猛进,才是如今各大厂商敢于打价格战的核心因素。
此前李彦宏在Create 2024上就曾表示,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理成本降到了原来的1%。例如百度的异构计算平台“百舸”,就宣称实现了训练和推理场景的吞吐量提高30%-60%,提供有效训练时长达到98%,带宽有效利用率达95%。
这一变化就意味着原先需要用100天的训练才能达到的效果,如今最低仅需40天。除此之外,百度的“千帆”大模型平台还兼容昆仑、昇腾、海光DCU、英特尔等,英伟达之外的AI算力供应商,为客户提供了低成本的算力解决方案。除了百度之外,腾讯也在去年秋季升级了混元大模型背后的自研机器学习框架Angel,升级后的训练效率可提升至主流开源框架的2.6倍,用该框架训练千亿级大模型可节省50%的算力成本,使得大模型推理速度提高了1.3倍。
在确保同等效果的前提下,提高硬件利用率、缩短算力资源的使用时长,以及优化工具链以提高训练、推理效率,这就是过去一年国产大模型共同的思路。用一句话来概括,就是在过去一年,国产大模型在把PPT写得天花乱坠的同时,也确确实实地在进行降本增效。
但需要注意的是,0.0008元/千Tokens这样超低定价或许很难持续。毕竟作为巨头的字节跳动这番操作几乎就是明牌,那就是通过持续的价格战来挤压中小厂商的生存空间,进而扩大市占率、以期与BAT等巨头决战,甚至其他一些有资本支持的AI独角兽可能也是这样想的。所以在接下来,高烈度的价格战或许将会是这一赛道的主旋律。