【AI时刻】OpenAI首款“推理”模型o1：人工智能的下一场豪赌？

作者：太平洋电脑网发布时间：2024-09-20

OpenAI 刚刚发布了其全新人工智能模型——o1。虽然名称听起来像是随便起的，但o1承载着OpenAI对未来AI发展的雄心壮志。简而言之，o1是一款先进的“推理”模型，具备处理更复杂问题的能力，并且运算速度超过人类。然而，值得注意的是，o1的使用成本显著高于以往的模型，这可能会成为用户的一大考量。

对于关注AI行业动态的用户来说，o1其实就是此前备受热议的“Strawberry”模型。此次，OpenAI不仅推出了o1，还发布了一个更为经济实惠的“迷你版”——o1-mini，后者在价格上更加亲民，但在功能上有所简化。

在多AI模型订阅平台 POE 上o1模型使用每一次约为25000积分（约合3.5元人民币）

在多AI模型订阅平台 POE 上GPT4o模型使用每一次约为25000积分（约合3.5元人民币）

o1：实际上手体验，高考数学包OK！

在多AI模型订阅平台 POE 上，近日更新了对 o1 模型的支持。尽管 o1 模型目前仍处于测试阶段，每天仅限 3 条使用权限，并且每发送一条消息所消耗的积分大约是常规 GPT-4 模型的 50 倍，许多用户仍然愿意尝试。需要注意的是，使用 o1 时回复速度较慢，通常需要等待较长时间。

我们对 o1 模型进行了几道逻辑题和数学题的测试，旨在比较它与 ChatGPT-4o-Latest 之间的差异，特别是 o1 模型在逻辑推理方面的表现。

测试一：9.11 和 9.9 哪个更大？

这是 GPT 模型常常犯错的题目，因为它容易在小数点后的数值比较中产生“幻觉”，错误地认为 9.11 比 9.9 大。ChatGPT-4o-Latest 在这一题上也给出了错误答案，未能正确处理数值的大小关系。

ChatGPT-4o-Latest

然而，o1 模型在这道题上不仅给出了正确答案——9.9 更大，并且进一步探讨了当数字比较不是单纯数值时，可能存在的其他歧义情况。o1 模型的回答不仅准确，还展示出它在逻辑上的深度思考能力。这种对问题多维度的理解反映了它在逻辑推理上的优势。

o1-mini

测试二：在客厅的桌子上放着一个杯子，杯子里有一个戒指。之后，杯子被移到了书房的桌子上，再移到了卧室的床上。在那里，杯子曾被翻倒过一次，随后又恢复了原样。之后，杯子被放回了客厅的桌子上。现在，戒指在哪里？

ChatGPT-4o-Latest

o1-mini

从两者的回答来看，o1 在逻辑推理上的表现更加精准，其对问题的理解和回答的条理性都要优于 ChatGPT-4o-Latest。

测试三：2022 年高考数学的最后一道大题（仅测试第一问的推导过程）。

ChatGPT-4o-Latest

o1标准版

在这道题中，o1 模型的推导过程与标准答案完全一致，展示了它在数学逻辑上的严谨性和准确性。而 ChatGPT-4o-Latest 在推导过程中出现了错误，未能正确理解题目并给出符合标准的推导步骤。

o1：AI 推理能力的全新登场，价格却不够亲民

o1的发布标志着OpenAI在实现类人智能方面迈出了关键一步，尽管这一进展的成本相对较高。借助o1，AI不仅能够协助编写代码，还能解决那些需要深度思考的问题。然而，开发者若欲使用o1，成本将相当昂贵：在API中，每处理100万个输入令牌（一种计费方式）需支付15美元，输出令牌则需60美元。相比之下，GPT-4o的价格仅为5美元和15美元。

o1 的“特别训练”：AI 学到了什么？

OpenAI研究团队负责人Jerry Tworek透露，o1的训练方式与以往模型存在“根本性差异”。尽管他未详细说明这些创新技术，但他提到o1采用了一种全新的优化算法，并使用了专门设计的数据集进行训练。

传统的GPT模型擅长模仿训练数据中的模式，类似一只能说话的聪明鹦鹉。而o1则表现出自我学习的能力。OpenAI通过强化学习的方法训练o1解决问题，简单来说，就是“做对了给奖励，做错了则纠正”。此外，o1还采用了一种称为“思路链”的方法来处理问题，这类似于AI版的“步步为营”，让它能够像人类一样逐步分析和解决问题。

OpenAI表示，这种全新的训练方法使得o1变得更为智能和可靠。“我们发现模型的幻觉现象有所减少。”

o1 能力官方解读：单边天才？

与GPT-4o相比，o1在多个方面表现出显著优势：它在编码和数学问题上的处理能力更强，并且能够清晰地解释其推理过程。OpenAI首席研究官Bob McGrew甚至打趣道：“o1在解决AP数学考试题目上肯定比我当年表现得更好，尽管我大学期间还辅修了数学。”

OpenAI-Sam altman

为了验证o1的实力，OpenAI使用国际数学奥林匹克资格考试对其进行了测试。结果显示，GPT-4o仅答对13%的题目，而o1则表现优异，答对率高达83%。这一成绩无疑令人印象深刻，但也不可忽视其局限性。尽管o1在复杂推理方面表现出色，但在处理广泛的世界知识时却不及GPT-4o，甚至缺乏浏览网页、处理图像和文件的能力。换句话说，o1或许是个聪明的数学家，但仍然是“闭关修炼”的高手。尽管如此，OpenAI依然认为o1代表了一种全新的能力，象征着AI发展的新起点，并赋予其具有重启意义的名称——o1，暗示着AI进化的全新阶段。

外网对新模型的测试与使用评价

McGrew也坦诚道：“我们以前在命名方面确实不太成功，希望这次的o1能够成为我们命名风格的全新开始。”

AI的未来：推理能力只是开始

大型语言模型本质上并不具备真正的“智能”，它们只是通过大量数据寻找模式，预测下一个最可能出现的词语。举个例子，早期的ChatGPT甚至会错误地认为“strawberry”只有两个R，但新的o1模型则能够正确处理这一问题。

外网用户使用o1快速搭建一个ios app

据报道，OpenAI正在以1500亿美元的估值筹集更多资金，其未来的发展很大程度上寄希望于像o1这样的推理模型。毕竟，如果AI能够从简单的模式识别进化到真正的推理，不仅在医学和工程等领域将实现突破，甚至有可能成为未来自动化代理的基础。然而，目前o1的推理速度尚不够快，无法胜任真正的代理系统，加上开发者使用成本较高，OpenAI的梦想可能还需要更多时间才能实现。

正如McGrew所说：“我们在推理能力上已经研究了好几个月，因为我们认为这是AI的关键突破。”从根本上讲，o1代表了一种全新的模型模式，能够解决真正困难的问题，向类人智能迈出了重要一步。

展望未来，AI的发展将不仅仅局限于模式识别和简单的任务自动化。随着推理能力的提升，AI有望在更多复杂领域展现其潜力，辅助人类进行决策、创新和解决重大挑战。虽然当前的技术仍然存在诸多限制，但每一次突破都让我们离全面智能的AI世界更近一步。随着技术的不断进步和成本的逐步降低，AI将在教育、医疗、科研等各个领域发挥越来越重要的作用，成为推动社会进步的重要力量。

【AI时刻】OpenAI首款“推理”模型o1：人工智能的下一场豪赌？

推荐体验

相关资讯

【AI时刻】OpenAI首款“推理”模型o1：人工智能的下一场豪赌？

OpenAI首款“推理”模型o1：人工智能的下一场豪赌？

专家警告：人工智能或引发下一场金融危机

OpenAI发布具有推理能力的人工智能模型o1

OpenAI 深夜再放炸弹！首款复杂推理大模型o1发布！

近期资讯

辽宁信裕申请从镍基高温合金电化学溶解液中分离金属钼和铼的专利，提高了铼钼回收率和铼纯度

从数据到洞察：AI 如何改变用户体验研究的游戏规则

如何有效设置手机阻止陌生号码骚扰，保护你的通话隐私和安全

青岛港新注册《基于GIS图形化技术的件杂货码头数字堆场系统V2.0》等3个项目的软件著作权

美的集团获得实用新型专利授权：“制冷设备的开合装置及制冷设备”

微信给腾讯又送了一个大礼

如何选择合适的电脑电源：功率、效率与品牌的重要性解析

常州市仪之诺取得具有快速冷却功能的四刃立铣刀专利，改善加工效率和误差

8点1氪｜黄子韬带货月销售额近2500万；苹果税中国抽成全球最高；哈萨克斯坦坠毁客机已发现32名生还者

潮玩，被00后拿来整顿婚礼了

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响