OpenAI “o1”模型震撼发布，首个超越人类博士水平的AI诞生

作者：快递100官方号发布时间：2024-09-23

北京时间 2024 年 9 月 13 日凌晨，OpenAI 发布新模型 o1。该模型包括两个版本，即 o1-preview 和 o1-mini。o1 最大的特点是具有更强的推理能力。

外媒公布了该模型推理能力的具体表现：在参加美国数学邀请赛中，GPT-4o 得分 13.4 分，o1-preview得分 56.7 分，o1 得分 83.3 分。其中 o1-preview 的能力是 GPT-4o 的 4.2 倍，o1是 GPT-4o 的 6.2 倍，提升明显。

在编码竞赛中，GPT-4o得分 11 分，o1-preview 得分 62 分，o1 得分 89 分。o1-preview 的能力是 GPT-4o 的 5.6 倍，o1 是 GPT-4o 的 8.1 倍，提升幅度比数学竞赛更显著。在博士水平的科学问题测试中，GPT-4o 得分 56.1 分，o1-preview得分 78.3 分，o1 得分 78 分，人类专家得分 69.7 分。o1 模型的两个版本得分均超过人类专家水平，这也是大模型首次在推理能力方面超过人类专家。

据媒体报道，o1 具备更强推理能力的原因主要是采取了优化的算法和专门定制的训练数据集进行训练。优化算法主要是通过强化学习的方法训练大模型，并在用户输入问题后增加推理标记（Reasoning Tokens），以便更好地拆解复杂问题，以试错方式得到最佳策略，得出深思熟虑的结果。

针对此事件，快递100 作为大模型的应用服务商，有三点观察：

一、由于 o1 具有更强的推理能力，在体感上反应速度会比 GPT-4 更慢一些。这符合人类思考的特征，正如卡尼曼在《思考，快与慢》中提到的，人类思考包括快系统和慢系统。慢系统通过逻辑推理和分析，更符合人类特征，如中国古话 “深思熟虑，三思而后言，三思而后行”。

二、就应用潜力和价值方面，o1 潜力主要体现在科研方面，但后续版本很快会进行泛化，向通用领域拓展，人们很快能体验到其全新的大模型能力。

三、o1 为国内大模型提供了新的对标标杆和能力基准，期待国内大模型尽快对标 o1，提升基础大模型能力。

快递 100 作为大模型应用服务商，将大模型通用能力与快递物流具体场景相结合，开发了百递云 GPT，这是一个混合智能架构的大模型应用开发平台。通过该平台整合闭源公有云大模型和开源私有云大模型，结合自身领域知识库和专有 API，将大模型应用到具体商业场景中，推出了 AI 查快递、AI 寄快递、AI 管快递以及 AI 客服等服务。在 AI 查快递方面，可实现一句话查快递；在 AI 寄快递方面，可实现一句话寄快递和一张图寄快递，时间从原来手工填写的 3 分 40 秒降低到 19 秒；在AI 管快递方面，可实现一句话生成对账单和快递费用分析报告；在 AI 客服方面，利用大模型的意图理解和问题分发能力，解决了 90% 的客诉反馈，一次性问题解决率达到 99.4%。

o1 的推出让人们对大模型未来潜能充满希望，期待基础大模型能力不断升级，为与行业场景结合提供更强技术支撑。相信随着 o1 的推出，将引发全球大模型能力的新升级，中国大模型也将不甘落后。人们对未来大模型的发展前景充满期待，同时对大模型与具体应用场景的结合以及未来创新更多应用场景充满信心。

近期资讯

张栋伟 2024-09-20

热镀锌板的锌层性能有哪些

热镀锌板的锌层性能有哪些热镀锌板的锌层性能是影响其耐腐蚀性、耐久性以及在不同环境中的应用表现的关键因素。以下是热镀锌板的锌层主要性能：1.防腐性能主要功能：锌层为基材钢板提供了有效的防腐保护。锌本身具有较强的抗氧化能力，能够在暴露于空气、水分和其他腐蚀性物质时形成氧化锌、碳酸锌等保护膜，减缓钢材的腐蚀过程。自我保护作用：锌在发生电化学腐蚀时，会首先腐蚀，充当“牺牲阳极”，保护钢板不受腐蚀。即使锌层局部受损，锌会通过电化学反应继续保护暴露的钢基材。2.耐磨性锌层硬度：热镀锌层的硬度比钢材低，但具有一定的耐磨

雷正电气桥架 2024-09-20

高中9月逆袭详细规划，开学重进班级前三！！

嘿，朋友们，今天咱们不扯别的，就直截了当——给即将步入高二的你，一份暑假逆袭攻略，助你一开学就跃居班级前三的宝座。基于我当年从重点高中尖子班直通985的实战经验，咱们来聊聊8月里，各科该如何高效备战？语文篇：首先，古文是你手中的“秘密武器”。别让那些古文注释、小字注释和文学常识躺在课本里睡大觉，是时候让它们“活”起来了。用一本总复习资料，系统地啃下实词虚词，掌握文言文的语法脉络。阅读方面，别忘了加固你的答题模板，通过专项训练，比如信息类文本和现代文阅读，让答题技巧更加炉火纯青。我特意为你精选了几套教辅，

高中三年你要脱贫 2024-09-20

OpenAI “o1”模型震撼发布，首个超越人类博士水平的AI诞生

推荐体验

相关资讯

OpenAI 发布 GPT-4，部分已超越人类水平

OpenAI再次震撼世界！GPT-4o语音水平接近人类，科幻正在成真

OpenAI用26分钟再次震撼世界！新模型GPT-4o语音水平接近人类，...

响应时间接近人类水平，OpenAI发布新款AI模型GPT-4o

OpenAI用26分钟再次震撼世界！新模型GPT-4o语音水平接近人类，科幻正在成真

近期资讯

无纸化作业解决方案：三防平板在科技生产中的应用

可以通过远程控制桌面软件远程访问我的路由器设置吗

网格桥架的分类和用途

注电：我走的弯路（注册电气工程师备考心得）

【Find产品笔记】第3篇：双指分屏

万界星空科技电线电缆行业MES系统核心功能

以色列不仅可以爆炸寻呼机

热镀锌板的锌层性能有哪些

高中9月逆袭详细规划，开学重进班级前三！！

高中生物晨读晚背计划，真的能90+

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响