奥特曼「草莓」模型跳票，OpenAI凌晨大新闻，把网友整懵了

作者：机器之心Pro发布时间：2024-08-09

机器之心报道

编辑：泽南、杜伟

GPT-5 大模型？不要太着急。

昨晚，很多人彻夜未眠，都在等待 OpenAI 的「大新闻」。

因为在本周三，OpenAI 创始人、CEO 山姆・奥特曼突然在 X 上发了一张照片。

奥特曼虽然偶尔会发一些心灵鸡汤，但大多数的推文都是在宣传公司的产品，人们看法很快达成了一致——此中必有深意。

有人展开解读：四个红草莓，其中还有一个未成熟的青色草莓，这不妥妥地是在说下一代 AI 大模型 GPT-5 要来了吗？

奥特曼在回应网友时也在暗示，惊喜马上就来。

这激起了人们的好奇心，预测 GPT-5 发布的时间从草莓成熟所需要的 4 到 6 个星期，很快发展到了就在明天。

那就不用等了。今天凌晨，答案揭晓了。

OpenAI 发布了基于最新一代大模型 GPT-4o 的全面安全评估。

新发布的 GPT-4o System Card 是一份研究文件，概述了 OpenAI 在发布最新模型之前采取的安全措施和风险评估。

GPT-4o 于今年 5 月公开发布。在首次亮相之前，OpenAI 使用了一组外部红队或试图寻找系统弱点的安全专家来查找模型中的关键风险。

在如今的大模型领域，这是一种相当标准的做法。新的安全测试将更多的精力集中在 GPT-4o 的音频功能上，OpenAI 检查了一系列风险，例如 GPT-4o 可能会创建未经授权的某人声音克隆、色情和暴力内容或复制的受版权保护的音频片段（比如一段流行音乐）。如今结果的发布似乎意味着语音功能即将全面上线。

值得关注的是，根据 OpenAI 自己制定的框架，研究人员认为 GPT-4o 新增的语音对话能力在整体上并不会显著增加风险，但个在别领域上具有「中等」风险。

具体来说，总体风险水平取自四个总体类别中的最高风险评级：网络安全、生物威胁、说服力和模型自主性。除了说服力之外，所有这些都被认为风险较低，研究人员发现 GPT-4o 的一些写作样本可能比人类书写的文本更能左右读者的观点 —— 尽管该模型的样本总体上并不更有说服力。

GPT-4o 是 OpenAI 推出的最新一代自回归全向模型，它接受文本、音频、图像和视频的任意组合作为输入，并生成文本、音频和图像的任意组合的输出。它在文本、视觉和音频方面进行端到端训练，这意味着所有输入和输出都由同一个神经网络处理。

OpenAI 表示，GPT-4o 可以在短短 232 毫秒内响应音频输入，平均反应时间为 320 毫秒，与人类对话中的响应时间相似。它在英文和代码文本上的表现与 GPT-4 Turbo 相当，在非英语语言文本上的表现有显著提升，同时 API 速度也更快、价格便宜 50%。与现有模型相比，GPT-4o 在视觉和音频理解方面尤其出色。

OpenAI 发言人 Lindsay McCallum Rémy 表示，System Card 包括由内部团队创建的准备情况评估，以及 OpenAI 网站上列出的外部测试人员，即模型评估与威胁研究 (METR) 和 Apollo Research，这两家公司都在为 AI 系统建立评估。

评估方式。

这不是 OpenAI 发布的第一个 System Card。此前，GPT-4、具有视觉能力的 GPT-4 和 DALL-E 3 也经过了类似的测试，研究结果也已发布。但 OpenAI 此次发布新版本 dSystem Card，可能是由于一直以来自身在安全方面被批评做出的应对。

许多人呼吁 OpenAI 需要更加透明，不仅应该公开模型、训练数据（如是否使用 YouTube 视频训练），还包括其安全测试的过程。在 OpenAI 和许多领先的人工智能实验室所在的加州，州参议员正希望通过一项法案来规范大型语言模型，其中包括限制公司如果其人工智能被用于有害方式，将承担法律责任。但 GPT-4o System Card 带给外界的最大信息是，尽管有一群外部 Red Team 成员和测试人员，但其中很多都依赖于 OpenAI 自己来评估自己。

与此同时，OpenAI 也宣布任命卡耐基梅隆大学（CMU）机器学习系教授兼主任 Zico Kolter 为公司董事会成员。Zico 的工作主要集中在人工智能安全性、一致性和机器学习分类器的稳健性上，专业知识涵盖新型深度网络架构、数据理解对模型影响的创新方法，以及评估 AI 模型稳健性的自动化方法。

果然网友们纷纷表示「不满意」。有人发问，你要发的「草莓」（可能的下一代大模型）呢？PS：果然没有草莓。

还有人表示，自己已经听了太多关于安全框架的东西了。

更多人开启了对 OpenAI 的打趣。

然而，在研究人员自己看来，OpenAI 的进展似乎远超预料。OpenAI 的联合创始人 Greg Brockman 刚刚发了推，表示我虽然刚刚开始休假，却好像已经错过了太多（Fear of Missing Out）。

「过去 9 年，我把生命都奉献给了 OpenAI，覆盖了我的整个婚姻阶段。工作对我来说很重要，但生活也一样。我觉得休息一下没问题，部分原因是我们的研究、安全和产品进展非常强劲。」

不过与此同时，最近几天在 UC Berkeley 建立的 LYSMS 大模型竞技场中的 anonymous-chatbot 已被广范认为是 OpenAI 的新模型。

我们或许不需要等太久。

参考内容：

https://openai.com/index/gpt-4o-system-card/

https://openai.com/index/zico-kolter-joins-openais-board-of-directors/

https://www.theverge.com/2024/8/8/24216193/openai-safety-assessment-gpt-4o

https://x.com/gdb/status/1821716026448633933

奥特曼「草莓」模型跳票，OpenAI凌晨大新闻，把网友整懵了

推荐体验

相关资讯

OpenAI「草莓」模型再次跳票，凌晨发布的SWE-bench Verified是个啥？

一个弹窗整懵Claude，瞬间玩不转电脑了 | 斯坦福&港大新研究

ChatGPT把好莱坞编剧整罢工了

我的微信机器人把房东搞懵了

午饭不吃啦！OpenAI凌晨发布“草莓”模型，TVCBOOK率先提供体验通道！

近期资讯

方程豹豹8首次智驾OTA正式开启推送：覆盖行车、泊车、避障

蔡磊夫妇500万重奖渐冻症科学家：病友们的英雄

Vite源码学习（一）——从CLI起步

性价比iPhone也要涨价！苹果iPhone SE 4售价曝光

逼真操作！大疆虚拟飞行小程序上线手机飞多款无人机

极氪大型旗舰SUV谍照曝光：前脸霸气神似库里南

【OpenHarmony】鸿蒙 UI动画开发之ohos-svg

《误杀3》最后10分钟CPU干烧了：大结局反转意想不到

数据互通！网易《燕云十六声》移动端明年1月上线

2025年的重量级选手！极氪6座旗舰SUV来了：对标问界M9

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响