Open AI发布新一代大模型“o1”：会像人类一样“花时间思考”

作者：家办新智点发布时间：2024-09-13

AI领域再一次迎来了重大突破！

北京时间今日凌晨，OpenAI正式发布名为OpenAI o1的新模型，即之前所传的“草莓”（Strawberry）模型，该模型可以执行一些类似人类的推理任务，在回复用户询问前会“花更多时间思考”。

OpenAI的CEO萨姆·奥尔特曼（Sam Altman）称其为“新范式的开始”。“o1”新一代大模型能够解决多步骤问题，在复杂推理、数学和编程问题方面，能够像人类一样思考解决问题的过程。

相较于过往的大模型，OpenAI o1大模型的核心逻辑是通过学习大量数据集中的模式，进而预测单词生成的序列，严格意义上来讲并未真正理解客户提问。

Open AI此次发布的新一代大模型“o1”，可谓打破了我们对LLM固有水平的认知。“对于复杂的推理任务而言，这是一个重大进步，代表了人工智能能力的新水平，”Open AI表示。

会像人类一样“花时间思考”

Open AI发布的新一代大模型“o1”，在接收到用户询问后，在作出回答钱，会像人类一样“花时间思考”，用时约10—20秒，进而产生一个内部思路链，从而尝试不同的策略并识别自身的错误。

因具备更为强大到推理能力，因而“o1”在多个行业具有更多应用潜力，尤其是复杂的科学、数学和编程任务。

譬如，在处理物理、化学等问题时，“o1”的表现甚至和该领域的博士生水平不相上下；

再譬如，在国际数学奥林匹克的资格考试中，“o1”的正确率为83%，能够成功进入美国前500名学生的行列，而GPT-4o模型的正确率仅为13%；在编程能力比赛Codeforces中，“o1”模型拿到89%百分位的成绩，而GPT-4o只有11%。

*对复杂数学问题的思路链

未来，该模型还有更多潜在的应用场景，如医疗研究人员可利用该模型来标注细胞测序数据；物理学家可借助o1模型生成量子光学所需的复杂数学公式；软件开发者则可借助它来构建和执行复杂的工作流程等。

缺点与局限

作为“o1”大模型的最初始版本，其也有着明显的缺点与局限。

首先，其使用价格非常昂贵。

据悉，“o1”系列共包含三款模型：OpenAI o1、OpenAI o1-preview和OpenAI o1-mini。这两款模型从今天开始对用户开放使用：

OpenAI o1：高级推理模型，暂不对外开放；
OpenAI o1-preview：这个版本更注重深度推理处理，每周可使用30次；
OpenAI o1-mini：这个版本更高效、划算，适用于编码任务，每周可以使用50次。

然而，OpenAI o1-preview版定价是每百万个输入tokens 15美元，每百万个输出tokens价格为60美元，分别是GPT-4o的3倍和4倍（一百万tokens大致相当于75万个英文单词）。

其次，该模型无法浏览实时网页、无法上传文件和图片、缺乏广泛的世界知识等。

目前，“o1”大模型只是一款“纯文字版”，暂时无法浏览网页信息以及上传文件和图片，这意味着它不具备ChatGPT的许多使用功能，在许多常见用例中不如GPT-4o那么强大，而且还有用量限制，o1-preview版每周上限为30条消息，o1-mini版每周上限为50条。

此外，“o1”大模型在很多领域的能力不如GPT-4o，譬如在关于世界的事实知识方面表现不佳；有的用例下推理能力较慢，需要更长的时间来回答问题；目前o1只是一个纯文本模型，缺乏针对特定文档进行推理，或者从网络收集实时信息的能力。

此外，让AI模型玩井字棋（Tic-Tac-Toe）一直被认为是个业界难题，拥有推理能力的“o1”大模型也还是会在这个游戏中出错，无法完全攻克技术难关。

本文来自微信公众号“家办新智点”（ID：foinsight），作者：foinsight，36氪经授权发布。

相关资讯

《少年先锋报》AI能像人类一样思考吗？

你梦想拥有一个全能的机器人助手吗?现在，AI大模型可以帮你实现。今年8月31日，“文心一言”豆包”商量”8款国产Al机型正式向全社会开放，AI浪潮正涌入我们的生活。那么，什么是AI大模型呢?这要从AI模型说起…

AI大模型文心一言

杂志铺 2023-12-10

小米卢伟冰：不会像Open AI一样做通用大模型

鞭牛士5月24日消息，5月24日，在小米财报发布后的电话会议中，小米总裁卢伟冰表示，会积极拥抱大模型，但不会像OpenAI一样做通用大模型，而是会深度和业务结合协同，利用AI技术提升内部效率。今年4月，小米正式组建AI实验室大模型团队。目前小米AI领域相关研发人员超1200人。

OpenAI

鞭牛士 2023-05-24

卢伟冰：小米不会像Open AI一样做通用大模型

在昨日的财报电话会议上，针对组建AI实验室大模型团队一事，小米总裁卢伟冰表示，会积极拥抱大模型，但不会像OpenAI一样做通用大模型，而是会深度和业务结合协同，利用AI技术提升内部效率。同时，针对造车相关问题，卢伟冰称，小米造车业务会按照原计划进行，在时间进度上将符合或略超预期。

OpenAI

砍柴网 2023-05-25

谷歌发布新一代开源AI大模型

当地时间2月21日，科技巨头谷歌发布了新一代开源模型“Gemma”，并称其是轻量级中“最先进的”开放模型系列，超越了原本最强的Mistral7B。据介绍，Gemma采用了与创建Gemini模型相同的研究和技术。

谷歌 AI大模型

和讯网 2024-02-22

基础大模型能像人类一样标注数据吗？

自从 ChatGPT 出现以来，我们见证了大语言模型 (LLM) 领域前所未有的发展，尤其是对话类模型，经过微调以后可以根据给出的提示语 (prompt) 来完成相关要求和命令。然而，直到如今我们也无

ChatGPT 大语言模型提示词

HuggingFace 2023-07-06

Open AI发布新一代大模型“o1”：会像人类一样“花时间思考”

会像人类一样“花时间思考”

缺点与局限

推荐体验

相关资讯

《少年先锋报》AI能像人类一样思考吗？

小米卢伟冰：不会像Open AI一样做通用大模型

卢伟冰：小米不会像Open AI一样做通用大模型

谷歌发布新一代开源AI大模型

基础大模型能像人类一样标注数据吗？

近期资讯

Surface系统-3-SurfaceControl的创建（native层）

前端铲💩日记 #3：重构「个人主页」

manim边学边做--弧形多边形

十四，在Spring Boot当中对应“ Tomcat 服务器的相关配置”和“服务器的切换”的详细说明

Surface系统-4-BLASTBufferQueue和Surface的创建

十三，Spring Boot 中注入 Servlet，Filter，Listener

十一，Spring Boot 当中配置拦截器的“两”种方式

GPT帮实现了EasyRule简易规则引擎代码生成界面

Surface系统-5-BLASTBufferQueue工作流程概览

Surface系统-2-SurfaceControl的创建（java层）

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响