又慢又贵？OpenAI推理模型“草莓”来了，GPT-5还有多远

作者：澎湃新闻发布时间：2024-09-13

OpenAI的“草莓”终于来了。

当地时间9月12日，人工智能（AI）巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列，包括OpenAI o1-preview以及小版本的o1-mini。

据OpenAI介绍， o1会花更多时间思考问题，然后再做出反应，就像人一样。通过训练学会了完善自己的思考过程，尝试不同的策略，并认识到自己的错误。与以前的科学、编码和数学模型相比，可以推理复杂的任务，解决更难的问题。

OpenAI表示，该系列模型对于复杂的推理任务来说是一个重大进步，因此也将产品计数器重置为1，并命名为OpenAI o1。该名称中的“o”或指代Orion（猎户座）。

推理能力更强，思维链提供模型安全新机会

“草莓”项目此前名为“Q*”，也正是引发OpenAI“宫斗”并导致公司CEO山姆·奥特曼（Sam Altman）曾被突然解职的原因。彼时，据消息人士称，OpenAI首席技术官米拉·穆拉蒂（Mira Murati）曾告诉员工，一封关于Q*（发音为 Q-Star）AI取得突破的信件促使董事会采取了解雇行动。

OpenAI在Q*上取得的进展，让部分公司内部人士相信，这可能是他们找到“超级智能（即AGI，通用人工智能）”的突破。

根据官方给出的信息，o1多项能力远超GPT-4o。在编程竞赛题（Codeforces）中排名第89位，在美国数学奥林匹克预选赛（AIME）中跻身全美前500 名学生行列，在物理、生物和化学问题（GPQA）基准测试中的准确率也超过了人类博士生水平。

据介绍，类似于人类在回答一个难题前可能会思考很长时间，o1在尝试解决问题时也会使用一连串的思考。通过强化学习，o1可以学会磨练自己的思维链，完善自己使用的策略。它学会识别和纠正错误、把棘手的步骤分解成更简单的步骤、在当前方法无效时尝试不同的方法。

OpenAI表示，使用思维链能显著提高安全性和一致性，因为能够以清晰的方式观察模型的思维，且模型对安全规则的推理对分布外场景也更加稳健。

商汤科技董事会执行主席兼CEO徐立此前曾表示，未来决定一个模型聪不聪明，完全在于构造模型思维链数据的方法论是否足够强，并且这一足够强的方法论能够可持续并且迭代。

OpenAI o1的原始完整思维链部分截图

目前，ChatGPT的Plus和团队用户可以使用o1两款模型，企业和教育用户将从下周开始可以使用。

更慢却更贵，并非GPT-4o“继任者”

目前，o1-preview的每周消息限制为30条，o1-mini为50条。OpenAI称正在努力提高消息上限，并让ChatGPT能够根据给定的提示自动选择合适的模式，也将访问权限扩展到更多层次的用户，计划为所有免费用户提供o1-mini的访问权限。

而在API（应用程序编程接口）端，o1-preview每100万输入tokens（大模型将文本分解成单词、字符集或单词和标点符号的组合）收费15美元，每100万输出tokens收费60美元。与GPT-4o 相比，输入成本是其3倍，输出成本是其4倍。

o1-mini则定位速度更快、成本效益更高，据称在数学和编程方面的表现也较为出色，在AIME和Codeforces等评估基准上几乎与o1性能相当，可作为o1-preview的替代方案，具有更高的速率限制和更低的延迟，API用户使用o1-mini的价格比o1-preview便宜80%。

其他弊端也显而易见，OpenAI o1的速度比其他模型更慢。据外媒报道，o1回答某些问题可能需要10多秒钟，该模型会选择通过显示当前正在执行的子任务的标签来显示进度。

同时，鉴于生成式人工智能模型的不可预测性，o1可能还有其他缺陷和局限。例如有时会在井字游戏中出错。在一篇技术论文中，OpenAI表示一些测试人员传言称o1比GPT-4o 更容易产生幻觉，当它不知道问题的答案时，也不太愿意承认。

此外，o1目前也无法浏览网页或分析文件。

奥特曼坦言，o1是OpenAI目前能力最强、最对齐的一系列模型，不过仍有缺陷。

OpenAI总裁格雷戈里·布罗克曼（Greg Brockman）也表示，目前o1技术仍处于早期阶段，OpenAI正积极探索，包括可靠性、幻觉和对抗攻击者的鲁棒性（稳定性）。

OpenAI表示，作为一个早期模型，OpenAI o1还不具备使ChatGPT变得有用的许多功能，如浏览网络信息、上传文件和图片等。对于许多常见情况，GPT-4o 在短期内会有更强的能力。后续会进行定期更新和改进，“让这个新模型与当前模型一样易于使用的工作仍在进行中”。

OpenAI强调，OpenAI o1并不是GPT-4o的“继任者”，可以将4o与o1的推理功能结合使用，在o1系列之后还计划继续开发和发布GPT系列模型。

OpenAI o1与GPT-4o多项基准测试对比

值得一提的是，此前据外媒报道，OpenAI或正考虑给“草莓”大模型或下一代旗舰模型制定更高的收费标准，最高或将达到每月2000美元。作为对比的是，目前ChatGPT Plus的收费标准是每月20美元。

动荡不安的OpenAI，GPT-5何时到来？

据外媒报道，穆拉蒂表示，目前正在构建下一代主模型GPT-5，该模型将比其前身大得多。尽管该公司仍然相信规模将有助于从人工智能中挖掘出新的能力，但GPT-5很可能还会包括本次推出的推理技术。

“有两种范式。”穆拉蒂表示，“缩放范式和这种新范式。我们希望将它们结合在一起。”

GPT-5的开发之路并不好走。

就在当地时间9月11日，GPT-4o/GPT-5的研究领导人、OpenAI版“Her”技术负责人亚历克西斯・康诺（Alexis Conneau）突然宣布离职。而此前，OpenAI联合创始人、首席科学家伊尔亚·苏茨克韦（Ilya Sutskever），“超级对齐”团队负责人杨·莱克（Jan Leike），联合创始人约翰·舒尔曼（John Schulman），ChatGPT负责人Peter Deng等人都已先后离职……目前，11位创始人中，仅剩两人仍留在OpenAI。

不仅人事动荡，OpenAI还被曝出今年或将面临50亿美元的收支缺口。

但可以看到的是，OpenAI已经在行动。

OpenAI最新计划再融资约65亿美元，该轮融资估值达到1500亿美元。而就在上个月底，OpenAI被曝正在准备新一轮由风投公司Thrive Capital领投，微软、苹果、英伟达或跟投的10亿美元融资时，估值才刚超过1000亿美元。

当地时间8月29日，OpenAI表示ChatGPT目前每周活跃用户超过2亿，是去年秋季的两倍。

OpenAI表示，92%的财富500强公司都在使用该公司的产品，自7月推出ChatGPT-4o mini以来，其API的使用量翻了一倍。

又慢又贵？OpenAI推理模型“草莓”来了，GPT-5还有多远

推荐体验

相关资讯

又慢又贵？OpenAI推理模型“草莓”来了，GPT-5还有多远

又贵又慢功能少的o1模型成AGI关键路径，基于推理模型的AI Agent能力大增

GPT-5要来了？OpenAI奥特曼发布草莓照片，或在隐喻新模型

有重大进步但既贵又慢，最新推理模型o1能让OpenAI保持领先吗？

GPT-5降临，代号猎户座？OpenAI疑用草莓训练，数学推理暴涨超越所有模型

近期资讯

如何在QQ音乐上关注好友，享受音乐社交的乐趣与互动体验

掌握Photoshop技巧，让你的照片在数字时代焕发新生

如何在iPhone上批量删除联系人，轻松管理通讯录

寄件技巧全解析：让寄送包裹更加顺畅与安全的实用经验

如何在苹果手机上设置屏幕密码以保护个人隐私和数据安全

如何有效清理电脑内存，提升运行速度与使用体验的方法解析

如何有效保存PPT文件：技巧与注意事项全解析

掌握MATCH函数：快速查找数据位置的实用技巧与应用

如何通过设置OPPO手机锁屏提升安全性与个性化体验

如何准确使用卷尺：技巧与注意事项分享

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响