OpenAI公司3月14日发布了其大型语言模型的最新版本:GPT-4。并表示,在许多专业测试中,该人工智能已经表现出“人类水平的能力”。
OpenAI公司指出,ChatGPT-4比以前的版本“更巨大”。这意味着,它已经在更庞大的数据上进行了训练,而且其模型文件中有更多的参数,这使得它的运行成本也更高。
OpenAI是美国一个人工智能研究实验室,由营利组织OpenAI LP与母公司非营利组织OpenAI Inc所组成,目的是促进和发展人工智能。
目前,人工智能领域的许多研究人员认为,该领域的许多最新进展,都来自于在数以千计的超级计算机上运行的、越来越大的模型,其训练过程可能耗资数千万美元。此类以“扩大规模”来获得更好效果的方法中,GPT-4就是一个最好的例子。
OpenAI公司表示,它使用了微软Azure来训练模型。微软已经向这家初创公司投资了数十亿美元。
与以往不同的是,OpenAI此次没有同时公布具体的模型规模,或用于训练模型,使其可以重新创建模型的硬件的细节,理由是所处的“竞争环境”。
OpenAI的GPT大型语言模型为许多人工智能样板产品提供了支持。在过去六个月里,人工智能的这些样板产品,包括必应的人工智能聊天和ChatGPT等等,一直让科技行业人士惊叹不已。
最新的版本是新技术的预览,这些技术的进步可能在未来几周开始渗透到聊天机器人等消费产品中。微软周二表示,必应的人工智能聊天机器人使用的就是GPT-4。
OpenAI表示,使用新的模型后,将更少出现错误答案,更少地偏离话题,以及更少谈论禁忌话题。与此同时,甚至在许多标准化专业测试中,它的表现要比大部分人类更好。
OpenAI声称,在模拟的律师考试中,GPT-4的表现超过了90%的人类的成绩;在SAT阅读考试中排名93%;在SAT数学考试中排名89%。
然而,OpenAI同时指出,新的软件仍不完美,在许多情况下,它的能力仍然不如人类。该公司说,它在“幻想”或“编造东西”方面,仍存在很大的问题,而且在“诚实性”方面也并不可靠。它仍然容易在犯错误的时候,坚持认为自己是正确的。
该公司在一篇博文中说:“GPT-4仍有许多已知的局限性,我们正在努力解决,如存在社会偏见、幻想不足和存在对抗性回复等。”
OpenAI在一篇博文中写道:“在闲谈时,GPT-3.5和GPT-4之间的区别可能不是很容易被察觉。但当任务的复杂性达到足够的阈值时,区别就显现出来了:GPT-4比GPT-3.5更可靠、更有创造力,能够处理更细致的指令。”
新模型将提供给ChatGPT的付费用户,也将作为API的一部分,允许程序员将人工智能整合到他们的应用程序中。OpenAI将对约750个单词的指令信息收取约3美分,对约750个单词的响应信息收取6美分。