当前位置:首页|资讯|GPT-4|GPT-5|OpenAI|AGI|大语言模型

发没发布吵了一周,你在对 GPT-4.5 期待些什么

作者:InfoQ发布时间:2023-12-27

原标题:发没发布吵了一周,你在对 GPT-4.5 期待些什么

作者 | 褚杏娟

“我上周一直都在告诉你们 GPT-4.5Turbo 即将发布,有人说我说瞎话,有人说我疯了。他们说是假新闻,但它就在这里,GPT-4.5 Turbo 不仅上线了,而且还处于保密状态。”网友 Wes Roth 在自己的视频里说道。Wes Roth 透露,OpenAI 的 GPT-4.5 Turbo 已经开始灰度测试,并展示了测试结果:

其他网友测试后也给出了相同的结果:

还有网友称,自己在 iPad 版本上测试成功,但在桌面版本上不行。“不过,当要求详细信息时,它就会变得非常通用。”还有网友在移动端测试也成功了。

推特著名爆料博主 Jimmy Apples 也表示,当反复询问其版本时,他注意到模型的不同反应。“令我印象深刻的是该模型在移动设备上承认是 GPT-4.5 Turbo,而桌面查询却产生了不同的结果。”

目前,很多都是对于 GPT-4 Turbo 灰测的结果大多来源于用户对 ChatGPT 提问后得到的回答。网友“Bahou”对此表示,“我相信这是一种幻觉。”Bahou 给出的具体理由如下:

  1. 我们无法证明 GPT-4 总是正确或错误地回答这个问题。如果你不断地重试这个问题,你会得到不同的结果,其中之一可能是正确的。
  2. 系统提示仍然显示 GPT-4。
  3. GPT 向人学习,在过去的几天里,可能有很多问题使模型倾向于谈论 GPT-4.5。

还有网友猜测,“这似乎来自它的训练数据。也有可能他们已经开始训练 GPT-4.5,但尚未完成,因此并未公布。”

值得注意的是,Reddit 上一篇发布不久的“GPT-4.5 Turbo 已经正式发布”的帖子被删掉。其中就有用户表示,自己并没有看到这个版本:

根据一些说法,GPT-4.5 Turbo 将在推理和“不那么懒惰”方面取得一些进步。但有网友表示,如果当前所谓灰度测试的就是 GPT-4.5 Turbo,“那么改进似乎并不太显著,否则我们会看到一些巨大的飞跃。”

“太棒了,你应该让 Altman 知道这件事!”有网友调侃道。实际上,在 12 月 14 日时候就有用户问道关于 GPT-4.5 是否泄漏的问题,但 Altman 给出了模棱两可的回答。

一名疑似 OpenAI 员工的网友否认这个消息:“兄弟们,你们需要对疯狂的人工智能炒作有更多的抵抗力。没有 4.5,如果有,也不会静默发布。”

GPT-4.5 到底啥样?

最早表示 GPT-4.5 泄露的是 reddit 上的一个帖子(现已经被删除):

GPT-4.5 将被描述为 OpenAI 最先进的“一款”模型,具备全新多模态能力,文本语音图片以及视频和 3D 信息全都能一并处理,并且还可以跨模态理解。从泄漏的截图可以看出,OpenAI 可能推出三种型号:

  • GPT-4.5,每 1 千输入 token 0.06 美元,每 1 千输出 token 0.18 美元
  • GPT-4.5-64k,每 1 千输入 token 0.12 美元,每 1 千输出 token 0.36 美元;
  • GPT-4.5- 音频 & 语音,每分钟输入 0.012 美元,每分钟输出 0.024 美元;

如果泄露的信息为真,那么相比之前的 GPT-4 Turbo 模型,GPT-4.5 的价格提高了整整 6 倍,GPT-4.5-64k 的价格提高了 12 倍。

该消息爆出时,Jimmy Apples 表示:“OpenAI 或将在 12 月底前发布 GPT-4.5。”科技圈知名爆料人 futuristflower 也认为屏幕截图泄露的信息基本正确,只是无法验证截图是否是官方的。这两位的说法让大家普遍认为 GPT-4.5 就会在这个月发布。

也不怪大家这么期待 GPT-4.5,一方面,OpenAI 的发布会总会给人“惊喜”,另一方面,人们发现最近的 GPT-4 变得有些“懒惰”,老是拒绝执行某些任务或直接返回简化的结果。

目前,OpenAl 还没有公开详细介绍 GPT-4.5 的技术细节和改进,但 ChatGPT 有回答“它的设计目的是在会话式 AI 应用程序中提供高效和有效的响应。”

根据外媒的预测,GPT-4.5 可能基于令人难以置信的 1.8 万亿个参数,而 GPT 3.5 仅有 1750 亿个参数。GPT-4.5 几乎肯定会考虑更多参数,并接受更多最新数据的训练。

GPT-4 仅限于 2021 年秋季之前的数据,未来 GPT-4.5 模型可能至少会基于 2022 年的信息,也可能会持续到 2023 年。它还可能可以立即访问网络搜索和插件,GPT-4 已引入该功能几个月了。

GPT-4 的推出还增加了 ChatGPT 识别图像的能力,并对提示做出更自然、更细微的响应。GPT-4.5 可以再添加新功能,也许能够分析视频,或本地执行一些插件功能,例如阅读 PDF 文档,或者甚至帮助教学。

GPT-4.5 也有可能能够记住更多信息,利用过去的对话来构建对未来的响应。GPT-4.5 也可能比 GPT-4 更加高效,运行资源需求更少,这有可能使其能够在更小的设备上运行并更快地响应。

GPT-5 都在路上了

在大家纷纷期待 GPT-4.5 时,OpenAI 已经开始了 GPT-5 的研发。

Sam Altman 在一次最新的采访中对外透露出,下一代人工智能模型 GPT-5 正在开发中。Altman 还表示,计划从微软获得更多资金支持,用以创造相当于人脑的超级 AI——通用人工智能(AGI)。

不过, Altman 并没有透露具体的时间和进度,只是说 GPT-5 会比 GPT-4 更加复杂,连他也无法准确预测 GPT-5 会具有哪些新功能和新技能。

Altman 表示,GPT-5 的终极目标就是是相当于人脑的超级 AI,目前 OpenAI 在构建 AGI 方面还是取得了一定进展,而大语言模型(LLM)是构建 AGI 的核心部分:“语言是压缩信息很好的一个方法,我们已经用 GPT-3 证明了这一点,而谷歌 DeepMind 却错失了这一机会,虽然这些公司也有很多聪明人,但他们并没有这么做。”

但要做好 GPT-5 并不容易。Altman 在公开场合表示需要更多的数据。除了来自公共在线的数据资源,OpenAI 还寻求利用未公开提供的、更高质量的数据资源。

OpenAI 还需要大量的 GPU。据报道,GPT-5 的训练需要 5 万张英伟达 H100 的加持。Altaman 此前也表示 OpenAI 很缺 GPU,以至于并不希望太多人用 ChatGPT。此前,OpenAI 就受到 GPU 的限制,推迟了微调、专用容量、32k 上下文窗口、多模态等短期计划。Altman 表示,最近收到了一批英伟达最新的 H100 芯片,他预计 2024 年供应将进一步放松。

Altman 没有承诺 GPT-5 的发布时间,但即使很快开始训练,该模型也不会在短期内面世。根据其大小和设计,训练可能需要数周或数月的时间。然后原始算法必须经过很多人的压力测试和微调以确保其安全。该公司花了八个月的时间打磨并在测试后发布了 GPT-4。尽管现在竞争格局更加激烈,但 GPT-4 的到来比 GPT-3 晚了近三年。

不过值得注意的是,比尔·盖茨评论称,“GPT-5 不会比 GPT-4 好多少。”他认为,当前生成式人工智能已经达到极限。

相关链接:

https://twitter.com/BahouPrompts

https://www.digitaltrends.com/computing/gpt-45-language-model/

https://singularityhub.com/2023/11/15/openai-ceo-sam-altman-says-his-company-is-now-building-gpt-5/

寻找增长,SaaS 企业选择上飞书

离开云转战 AI?23 岁写了百万人用的开源软件,这个 IT 奇才 11 年后离开了自己的上市公司

月薪八千离职赔百万,宁德时代的“竞业封印”;国内互联网大厂月薪最新一览;蚂蚁宣布新一轮职级体系改革|Q资讯

洞见 re:Invent:生成式 AI 与云共舞,成为构建者最好的时代来临!


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1