图片来源:视觉中国
国内AI大模型行业也不可避免地从营销战走向了价格战。
5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。这是这股AI浪潮一年多以来,字节跳动首次正式、大规模地向公众介绍旗下AI大模型业务。相比起百度、阿里巴巴和腾讯,从产品发布的节奏上来说字节跳动没有去抢先机,但在营销和价格战力度上,字节已经摆出了想要后来居上的姿态。
根据火山引擎总裁谭待在此次发布会上的介绍,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成3000万张图片。此外,字节跳动产品和战略副总裁朱骏在现场给出的数据显示,豆包大模型发布至今已累计超过1亿的下载量,双端超过2600万月活,创建智能体总数超过800万。
字节跳动让豆包默默发育了一年,集中秀了一波肌肉。
作为对比,根据QuestMobile今年3月的统计数据称,抖音的豆包、百度的文心一言、昆仑万维的天工、点阵盒子的扮伴-AI绘画、科大讯飞的讯飞星火位居前五位,月活用户分别为1,757万、1,213万、801万、643万、558万,这当中,豆包用户增长迅猛,上线近三个月用户就飙至首位。此外,根据券商监测数据,截至3月25日,月之暗面旗下AI助理Kimi的网页端、APP端的用户日活突破历史新高,分别达到了79万和54万。叠加小程序用户量,全端总日活大于225万。
总的来说,豆包、文心一言、Kimi等大模型均属于目前第一阵营,不过整个大模型智能助理行业正处于用户增长爬坡的早期阶段,当下的数据并不能反映最终的行业格局。QuestMobile数据显示,截至今年3月,基于大模型的AIGC行业用户量为7380万,尽管同比增长了8倍,也仅占移动互联网用户量的6%。
这一年内整个行业的迅猛增长,得益于各家大模型厂商在保持推进技术和产品研发的同时,也已经开始在广告营销上加强投放。其中,Kimi对抖音达人、B站UP主、小红书博主以及平台信息流广告均有大量投放,不过据蓝鲸新闻此前了解,抖音的流量已无法再投;智谱清言则大量投放了一线城市的地铁、楼宇和机场广告;目前,豆包的主要买量渠道就是庞大的抖音流量池。
营销战仍如火如荼地进行当中,豆包打响了价格战迄今为止最响一枪。
在此次发布会上,除了针对C端用户的豆包APP可免费使用外,火山引擎总裁谭待还给出了针对行业B端用户的豆包大模型的定价。“豆包主力模型(小于等于32K)在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。”谭待表示,此外,128k的豆包通用模型也只需要0.005元/千Tokens,比行业价格低95.8%。作为对比,谭待在发布会上同时给出了GPT4、文心一言和通义千问等友商大模型的单价。
图片来源:企业官方
根据火山引擎现场公布的价格计算和对比,一元钱就能买到豆包主力模型的125万Tokens,大约是200万个汉字,相当于三本《三国演义》。
这一极具竞争力的定价的公布意味着,国内其他大模型厂商现在或许需要重新制定自己产品的定价策略。但需要指出的是,豆包在强调极致低价的同时,没有在发布会现场给出测评和跑分方面的信息。
就在几天前,智谱AI刚刚调整了旗下入门级大模型GLM-3-Turbo(上下文长度128k)的价格,从0.005元 / 千tokens降低到0.001元 / 千tokens。此外,开放平台新注册用户获赠从500万tokens提升至2500万tokens(包含2000万GLM3-Turbo和500万GLM4)。而GLM-3 Turbo Batch批处理API还将进一步便宜50%——0.0005/千 tokens,也就是1元200万tokens。
仅从价格上来说,智谱AI的入门级大模型目前处在与豆包主力模型同样的价格带。但其他大模型厂商的主力产品价格仍然较高。
在字节跳动发布豆包大模型的价格之后,被直接点名的百度公司随后跟进披露了一组数据和观点。百度针锋相对地透露,文心大模型日均处理Tokens文本已达2490亿,“使用大模型不应该只看价格,更要看综合效果”。同时,百度再次强调不久前其CEO李彦宏的观点称,“闭源大模型+公有云”能实现比开源大模型性能更好、成本更低的综合效果,并以此促进AI应用生态繁荣。
字节跳动豆包大模型原名“云雀”,是国内首批通过算法备案的大模型之一。而“豆包”这个名字本来只属于字节跳动旗下的AI助手APP,现在也成为了其背后大模型的名字。
根据官方介绍,字节跳动基于豆包大模型打造了AI对话助手“豆包”、AI应用开发平台“扣子”、互动娱乐应用“猫箱”,以及星绘、即梦等AI创作工具,并把大模型接入抖音、番茄小说、飞书、巨量引擎等50余个业务,用以提升效率和优化产品体验。
此外,豆包大模型提供的是一个有多模态能力的模型家族,目前主要包括通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等九款模型。“用自然语言交互,语音是一个更好的方式。”谭待称。