不怕OpenAI抢风头！谷歌发布Gemini 1.5升级模型，综合能力提升，价格减半

作者：搜狐科技发布时间：2024-10-22

OpenAI 谷歌

出品｜搜狐科技

作者｜郑松毅

9月25日，就在OpenAI宣布GPT语音功能正式开放之际，谷歌也亮出了大招，发布了两个“招牌”模型的升级版本——Gemini-1.5-Pro-002和更轻量化的Gemini-1.5-Flash-002。

这次升级可谓是诚意满满，两款模型不仅在性能表现方面得到增强，1.5 Pro的使用价格更是直接砍半。

对于多数开发者来说，这无疑是个好消息，因为比起性能强大但价格昂贵的模型来说，如今的Gemini 1.5系列模型是个不错的性价比之选。

综合素质、数学、逻辑推理能力明显提升

关于两个升级模型的具体表现，先放一份谷歌官方披露的“成绩单”供参考：

在更具挑战性的“MMLU-Pro（改进版本的综合素质测试）”测试中，两个升级模型较前一版本有7%-8%的性能提升。

MMLU-Pro是大规模多任务理解数据集，涵盖STEM、人文、法律等数十个学科，旨在测试模型理解和解决问题的能力。

在回答常规数学问题（Math）和竞赛数学问题（HiddenMath）方面，两个升级模型性能分别提升了约20%。

逻辑推理（Reasoning）方面，两个升级模型都有超过10%的性能提升。

除此之外，在多模态信息（文本、图像、音频、视频）理解、安全等多方面，两个升级模型表现均有提升。

谷歌介绍，“除了性能有所提升外，模型的回答输出速度较之前提升了2倍，延迟降低了3倍。”

为更好地满足用户实际使用需求，升级模型的响应风格采用了更简洁的样式（对于摘要、问答等用例，更新模型的默认输出长度比之前短5%-20%左右），旨在让模型更易使用并降低成本。

此外，谷歌将1.5 Flash的付费层速率限制从1000 RPM提升至2000 RPM，1.5 Pro从360 RPM提升至1000 RPM，以便开发者能够利用Gemini高效构建更多应用。

1.5 Pro是谷歌最初于2月份发布的AI模型，最突出的特点是具有高达200万个tokens的上下文长度，支持处理超大量的推理任务。

而1.5 Flash模型更为轻量化，以满足处理大量数据时能迅速响应的需求。

从近期LMSYS竞技场数据来看，榜单上游位置已长期被OpenAI和谷歌两家占领。两大AI巨头的模型更新已成为竞技场放榜的最佳看点。

截止发稿，OpenAI最新模型o1暂居榜首位置，9月3日更新版本的GPT-4o暂时领先于8月27日更新版本的Gemini 1.5 Pro。

最新版本的1.5 Pro和1.5 Flash模型在LMSYS竞技榜单中的排名暂不得知。

1.5 Pro价格打对折，比GPT-4o便宜

说完了性能提升，再来看看大家最关心的模型使用价格。

谷歌宣布，从今年10月1日起，Gemini-1.5-Pro模型使用将更加优惠。

当提示词少于或等于128K Token时，每百万输入Token价格降低64%，每百万输出Token价格降低76%。

当提示词大于128K Token时，每百万输入Token价格降低29%，每百万输出Token价格降低53%。

与其直接对手GPT-4o相比，谷歌1.5 Pro的使用价格更具优势。GPT-4o每百万输入Token价格为5美元，每百万输出Token价格为15美元。

自年初以来，大模型价格战持续升级。海内外包括谷歌、OpenAI、百度、智谱等一众科技大厂相继打低模型使用价格，争抢市场客源。

有业内人士表示，“短期来看，大模型的性能遇到了瓶颈，谁也甩不开谁，谁也拿不出杀手锏。降低成本和使用价格是每一家厂商的最高优先级任务。”

但更多声音认为，“AI大模型不能只是拼价格，更要拼技术，拼解决行业痛点，应把更多精力放在超级应用当中。”

相关资讯