仅持续 15 分钟的直播堪称 OpenAI 史上最短发布会。不过,主持阵容依然强大,包括 CEO Sam Altman、思维链提出者 Jason Wei 和Hyung Won Chung 等人。
Altman 在直播活动结束后,也为我们送上了第一手总结,见下文,企业如何合规使用呢?
参考链接:https://azureopenai.cloudallonline.com/?zxwsh269
微软 Azure OpenAI 企业账户接口申请
我们刚刚推出了两项新功能:
o1,世界上最智能的模型。比 o1-preview 更智能、更快,功能更多(比如多模态功能)。现在已在 ChatGPT 中上线,稍后将推出 API 版本。
ChatGPT Pro。每月 200 美元。提供无限使用和更智能的 o1 模式。更多福利即将推出!
十二月不只是圣诞老人的主场,也将是 AI 年底最后一轮的狂欢。
满血版 o1 发布,看图说话无压力,但有个细节让人「细思极恐」
简言之,OpenAI 今天推出了满血版 o1 以及 ChatGPT Pro 订阅计划。
满血版 o1 现已面向 ChatGPT Plus 和 Team 用户推出,而 Enterprise 和 Edu 用户将从下周开始使用。
官网显示,ChatGPT Plus 用户和 Team 用户每周可以使用 OpenAI o1 发送 50 条消息,每天可以使用 OpenAI o1-mini 发送 50 条消息。
满血版 o1 的思维更加简洁,响应时间比 o1-preview 更快,在处理复杂的现实问题时性能优于 o1-preview,能将主要错误减少 34%。
并且 OpenAI 计划在未来几个月内提供网页浏览、文件上传等功能。与此同时,o1-preview 也已经从模型选择菜单中移除。
不过,满血版 o1 在部分基准测试中的表现不及预览版,比如 MLE-Bench。后者正是由 OpenAI 此前推出的一个旨在衡量 AI Agents 在机器学习工程任务中表现的基准测试工具。
另外,网友也从更新后的 o1 System Card 中挖到了一些值得关注的细节。
满血版 o1 在感知到威胁(被关闭或被取代)时,可能会采取一些自保措施,比如尝试停用监督机制,或者把自己的「参数」(「知识」或「记忆」)偷偷传出去,并尝试用这些「参数」去替换或影响新模型。
附上 o1 System Card 地址:
https://cdn.openai.com/o1-system-card-20241205.pdf
满血版 o1 到底有多强?OpenAI 向我们演示了实际效果。
一个典型案例是其对太空数据中心手绘图的分析,它仅用 10 秒就精确计算出散热装置的表面积,同时阐述了太阳能与深空环境的互动机制。
让满血版 o1 描述二世纪罗马帝国统治者的统治期间与重要贡献时,其仅需 14 秒即可完成分析,相比之下,o1-preview 则需要 33 秒。