OpenAI首席执行官 Sam Altman 周三在达沃斯论坛接受媒体采访时表示,他现在的首要任务就是推出下一代大模型,这款模型可能被称为GPT-5,与现有模型相比,GPT-5 “能做更多、更多的事情”。
OpenAI从去年开始训练GPT-5,几天前,Altman在与微软创始人比尔·盖茨的对话中,首次曝光了有关GPT-5的详细信息,对其未来的应用前景进行了分享。
据Altman介绍, GPT-5将是一个多模态模型,支持语音、图像、代码和视频,并在个性化和定制化功能方面实现重大更新,具备更强的推理能力和更高的准确性。当前大模型的通病——幻觉问题也将在GPT-5中得到解决。
个性化大礼包,真正的多模态模型?
Altman强调,GPT-4.5或GPT-5预计将在个性化和定制化功能方面实现重大更新,最关键的增强部分将围绕理解个人偏好的能力,比如整合用户信息、电子邮件、日历、约会偏好,以及与外部数据源建立联系。
“人们对GPT-4的不满和希望加强的部分,”Altman说,“包括不同的风格,不同的假设集,我们将使所有这些成为可能,然后还能让它使用你自己的数据。”
当前外界对 GPT-5的了解知之甚少,但从当前Altman披露的信息,分析预计GPT-5将是一个真正的多模态模型,类似于谷歌最近推出的新Gemini Ultra模型。
据Altman介绍,GPT-5不仅支持文本输入,还支持语音、图像、代码和视频。
“输入语音,输出语音,图像、视频亦是如此,” Altman表示,“显然,人们真的希望如此。我们已经支持了图像和音频,它的反馈比我们预期的要强烈得多。”
不再出现幻觉,大模型的可靠性迈上新台阶
据Altman介绍,GPT-5将具有更强的推理能力、更高的准确性。
当代大模型存在的最大问题——幻觉(胡编乱造)将在GPT-5中得到解决,这涉及到大模型的可靠性。
他告诉比尔·盖茨:“如果你问GPT-4大部分问题10000次,这10000次中可能有一次回答得很好,但它不一定知道是哪一次。而你却希望每次都能得到这10000次中最好的回答,因此可靠性的提升将非常重要。”
通往AGI之路,GPT-5可能是下一步
Altman告诉比尔•盖茨,现有AI模型都将变成最愚蠢的模型,至少在未来的五年或十年内,这项技术将处于一个非常陡峭的成长曲线上。
他表示:“未来AI系统的计算能力将是GPT-4的10万倍或100万倍,AI将影响社会,影响地缘政治力量的平衡,以及其他许多事物。”
众所周知,OpenAI等许多大型人工智能实验室都将通用人工智能 (AGI) 作为最终目标,因此,早期有人认为,GPT-5可能是某种形式的超级智能。
但根据现有的信息,GPT-5很可能只是GPT-4、Claude 2 或Gemini Ultra的改进版,它将具备更强的推理能力,不仅在许多学术评估上优于人类,理解能力也在一定程度上超越人类。
不过,GPT-5也可能是通往AGI道路上的下一步。据媒体报道,在上周五的Y-Combinator W24活动上,Altman告诉在场的创始人和企业家,他们应该抱着 AGI将“相对较快”实现的心态。
GPT-5何时面世?
在达沃斯论坛的媒体采访中,Altman并没有透露GPT-5的具体发布时间。他说:
“我希望我们能够慢慢来,确保我们能够推出一个让我们感到满意并且对 OpenAI来书足够负责任的产品。”
Altman还说,GPT-5也可能不会被叫做GPT-5,因为这并不符合Altman发布产品的风格。