【大河财立方 记者 陈薇】2024云栖大会上,阿里云发布了多款产品并宣布了新一轮的降价,一年来,通义千问API在阿里云百炼上的调用价格下降了97%。
9月19日,阿里云智能集团首席技术官(CTO)周靖人在接受媒体采访时,但在被问及降价的底线在哪里时,他表示,“(大模型)今天的价格不存在说已经足够低了,相对未来庞大的应用来说还太贵了。”
大模型降价:没有最低只有更低
9月19日,阿里云Qwen-Turbo百万tokens的最低调用花费,被刷新到了0.3元,周靖人宣布,Qwen-Turbo价格直降85%,Qwen-Plus和Qwen-Max分别再降价80%和50%,阿里云又开启了新一轮的降价。
此外,阿里云通义旗舰模型Qwen-Max也迎来全方位升级,周靖人称其性能接近GPT-4o,通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。此外,周靖人还宣布通义万相全面升级,并发布全新视频生成模型,这款AI视频制作工具完全免费,APP端开放每日不限次使用。
“过去一段时间,模型推理成本指数级下降。一年来,通义千问API在阿里云百炼上的调用价格下降了97%,百万 Tokens调用花费最低已经降到了5毛钱。”9月19日上午,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在演讲中也不避讳行业的价格战,他也表示,阿里云会努力把成本继续降下去。
虽然今年5月,阿里云率先开始大模型行业的价格战,国产头部大模型企业注入科大讯飞、字节跳动、腾讯等纷纷参与到这场价格战中,让百万tokens的成本迅速降低一度降至1元。7月百度在世界人工智能大会上进一步推动降价,宣布文心旗舰款模型ERNIE4.0和ERNIE3.5大幅降价,甚至推出ERNIESpeed和ERNIELite两款主力模型免费使用。
降价为培育大模型应用生态
大模型的“降价潮”未有结束的迹象。
“有一个说法是现在的AI相当于1996年左右的互联网,也就是在BBS时代。那时候的上网资费很贵,后来互联网的发展包括移动互联网的发展,运营商大力去搞基建,流量资费降下来。”阿里云副总裁张启在接受媒体采访时表示。
周靖人则表示,虽然价格战激烈,但阿里云的每一次降价都经过了非常严肃的内部讨论,“开源、降价都是一个逻辑,就是怎么让(大模型应用)生态发展起来。”
从目前来看,降价、开源对通义千问大模型生态繁荣是有效果的。根据阿里云披露的数据,自5月首次宣布降价后,阿里云百炼付费客户数较上一个季度增长超过200%。大批企业和开发者放弃私有化部署,选择直接在百炼上调用各类AI大模型,阿里云百炼已服务超30万客户。
即使如此,周靖人还是认为,今天大模型的运用以及基于大模型各种各样的创新,现在还在早期的阶段。“(大模型)今天的价格不存在说已经足够低了,相对未来庞大的应用来说还太贵了。”他说。
随着大模型降价对毛利的蚕食甚至负毛利,周靖人表示,阿里云降价主要是通过技术的优化,不光是模型本身的快速迭代,模型的推理效率、结构优化等也在同步进行,以此去推进模型推理成本的进一步下降。
张启则补充表示,大模型的能力需要让大家都能用得起,才能激发更多的产业级的创新,这个长远的目标才是阿里云考虑更多的问题,而不是说今天一定要算一个账,马上能够赚多少钱。
责编:刘安琪 | 审校:李金雨 | 审核:李震 | 监审:万军伟