继去年发布惊艳全球的,搭载GPT-3.5的ChatGPT后,还没等同行缓过神来,OpenAI就再次光速革新,于3月14日宣布推出GPT-4,并将其实装在ChatGPT,同时开放了GPT-4的API。
OpenAI工程师自豪地宣称,GPT-4将是“世界第一款高体验、强能力的现金AI系统”。那么与之前的GPT-3.5相比,它在哪些方面有所进步?在应用层面上,又会有哪些亮点?
高级推理能力:更快更强的超级“学霸”
根据官方介绍,GPT-4目前虽然在现实场景中的能力可能不如人类,但是在各类专业和学术考试中的表现已经达到了明显超于常人的能力水平。OpenAI在一系列不同的基准上测试了GPT-4,包括最初为人类设计的模拟考试(并且没有为这些考试进行特定的“培训”)。
来源:OpenAI;翻译:DeepL
结果显示,大多数考试中GPT-4的成绩都超过了GPT-3.5。它甚至通过了模拟的统一律师资格考试,并且分数在考生中排名前10%。
同时,为了初步了解GPT-4在非英语语言中的能力,OpenAI使用MMLU基准——这是跨越57个学科的多项选择问题,并将其翻译成多种语言,包括拉脱维亚语、威尔士语和斯瓦西里语等不常见的语言,以此来观察GPT-4的表现。结论是GPT-4表现远远优于以往的语言模型。
来源:OpenAI
复杂指令:可同时处理视觉与文本输入
在OpenAI的论文中明确提出,GPT-4能够接受图像和文本组合的指令,并且允许用户指定任何视觉或语言任务。结合上文提到的多语言能力:一个能“理解”人类笑话的AI诞生了。
来源:OpenAI;翻译:DeepL
当然,除了理解笑话,GPT-4强大的理解能力还能用在更多地方。
写个功能齐全的网站似乎不是什么难事。
游戏设计师Pietro Schirano也在Twitter上发布了自己利用GPT-4短短一分钟就做出游戏的案例。
这位设计师认为,GPT-4最震撼他的地方在于这是首次一次性完成他的指令,并且不需要做任何调试与修改。
更令人叹为观止的是,另一位网友表示,当他输入一个相对模糊的指令,例如“仿造pong、breakout之类的游戏,利用java和html编写代码”,GPT-4依然很好地完成了这个要求,并作出了《Meteor Dodge》这款小游戏。
GPT-4根据指令做出的游戏
强大如斯,不由得让我们感慨,能阻挡AI的,恐怕只有人类的想象力了。或许下一波失业大潮即将到来?未来我们只能当AI的“小弟”了吗?