为了加速AI应用的爆发，通义千问GPT-4级主力模型降价97%

作者：龚进辉发布时间：2024-06-12

作者：龚进辉

今年以来，阿里云总是带给业界惊喜。继2月底宣布100多款产品全线降价20%后，今天它又抛出重磅炸弹：通义千问GPT-4级主力模型Qwen-Long，API输入价格从0.02元/千tokens降至0.0005元/千tokens，直降97%。这意味着，1元可以买200万tokens，相当于5本《新华字典》的文字量。

据悉，Qwen-Long是通义千问的长文本增强版模型，性能对标GPT-4，上下文长度最高达1千万，降价后约为GPT-4价格的1/400，也比字节跳动豆包主力模型0.0008元/千tokens的定价更便宜，真正击穿全球底价，带动大模型定价进入“厘时代”。

除了输入价格降至0.0005元/千tokens，Qwen-Long输出价格也直降90%至0.002元/千tokens。相比之下，国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet和Ernie-4.0每千tokens输入价格分别为0.22元、0.025元、0.022元和0.12元，均远高于Qwen-long。

通义千问本次降价共覆盖9款商业化和开源系列模型。其中，前不久发布的通义千问旗舰款大模型Qwen-Max也加入到降价行列，API输入价格降至0.04元/千tokens，降幅达67%。它是目前业界表现最好的中文大模型，在权威基准OpenCompass上性能追平GPT-4-Turbo，并在大模型竞技场Chatbot Arena中跻身全球前15。

随着大模型性能逐渐提升，AI应用创新正进入密集探索期，2024年被认为是AI应用元年，但推理成本过高依然是制约大模型规模化应用的关键因素。基于此，阿里云才会大力推动大模型降价，在武汉AI智领者峰会现场，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光宣布上述重磅举措。

他表示，“作为中国第一大云计算公司，阿里云这次大幅降低大模型推理价格，就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”在刘伟光看来，不管是开源模型还是商业化模型，公共云+API将成为企业使用大模型的主流方式。

据我观察，过去大模型推理成本下降，很大程度要依赖算力升级，但从2023年开始，推理成本的下降，则是在算力没有升级的情况下完成的，包括架构创新、推理优化、系统升级甚至推理集群计算架构方面等。这意味着，除了算力升级之外，模型优化本身也拥有较大空间。

而这恰恰是阿里云优势所在，它可以从模型自身和AI基础设施两个层面不断优化，追求极致的推理成本和性能，好处也显而易见。随着大模型从卷技术向卷应用转变，谁能解决推理成本过高这一难题，谁就能打开AI应用的开关，推动大模型规模化应用。

所以，阿里云才会放出大模型击穿全球底价这一大招。此前，智谱AI、豆包大模型也纷纷宣布降价，大模型价格卷起来了！在我看来，这轮大模型降价潮的背后，是各大玩家希望进一步抢占市场，从而加速AI应用的商业化落地。纵观科技发展历程，成本下降刺激需求爆发是一大铁律。可以预见的是，推理成本下降，必然将带动AI应用加速普及，全力投入的阿里云或成最大赢家。