当前位置:首页|资讯|GPT-4|ChatGPT|OpenAI

GPT-4效果惊艳,但OpenAI 更封闭了

作者:MoPaaS魔泊云官方账号发布时间:2023-03-15

神秘的OpenAI大型新语言模型 GPT-4 在人们的期待中北京时间今天凌晨震撼登场。继 ChatGPT 开发者 API 开放没多久之后,OpenAI 这次发布了最新的 GPT-4 对话机器人服务以及其开发者 API,让人目不暇接。它打破了之前版本的记录,其模型更加庞大、功能更为强大惊艳。MIT 技术评论杂志记者有机会在GPT-4发布前后采访OpenAI 的相关人员来了解该大语言模型的一些情况,并在第一时间发表报道“GPT-4 is bigger and better than ChatGPT—but OpenAI won’t say why (GPT-4比Chat GPT更大更好,但OpenAI不说为什么)” 试图介绍神秘的 GPT-4一些情况。同行们对此也已期待已久,虽然觉得 GPT-4 现在是所有基础大模型评估的标准,GPT-4 已成为新的里程碑,OpenAI 将继续引领人工智能的发展方向,但也更加抱怨其开放性,这一次它的工作原理更加深入地被封存了起来,“在没有看到技术细节的情况下,很难判断这些结果到底有多令人印象深刻”,有朋友甚至调侃,OpenAI 应该改为 ClosedAI ...

以下为正文:

OpenAI 终于发布了下一代大型语言模型GPT-4。它的上一个惊喜是ChatGPT,它总是很难被效仿,但这家总部位于旧金山的公司已经让GPT-4变得更大更好。

但OpenAI不愿透露它的规模有多大,以及为什么会更好。GPT-4是该公司有史以来发布的最神秘的版本,标志着其从非营利研究实验室向营利性科技公司的全面转型。

OpenAI的首席科学家 Ilya Sutskever 在GPT-4团队宣布消息一小时后的视频通话中对我说:“你知道,这是我们目前无法评论的事情。”“外面的竞争相当激烈。”

加入等候名单的用户和付费ChatGPT Plus的付费用户都可以使用GPT-4,但只能使用有限的文本功能。

GPT-4是一个多模态大型语言模型,这意味着它可以同时响应文本和图像。给它一张你冰箱里食物的照片,问它你能做什么,GPT-4就会尝试用照片上的食材做出食谱。

艾伦人工智能研究所(Allen Institute for AI)的Oren Etzioni 表示:“在许多方面的持续改进是显著的。”“GPT-4现在是所有基础模型评估的标准。”

开源大型语言模型BLOOM背后的人工智能初创公司hugging Face联合创始人 Thomas Wolf 说:“在过去几年里,一个好的多模态模型一直是许多大型科技实验室的圣杯。”“但它仍然难以捉摸。”

从理论上讲,将文本和图像结合起来可以让多模式模型更好地理解世界。“它也许能够解决语言模型的传统弱点,比如空间推理,”Wolf 说。

目前还不清楚GPT-4是否也是如此。OpenAI的新模型在一些基本推理方面似乎比ChatGPT更出色,可以解决一些简单的难题,比如用相同字母开头的单词总结文本块。在我的演示中,我看到GPT-4总结了OpenAI网站上的公告,使用了以g开头的单词:“GPT-4,突破性的代际增长,获得了更大的成绩。护栏,指引和收获。巨大的,开创性的,具有全球性的天赋。”在另一个演示中,GPT-4接受了一份关于税收的文件,并回答了相关的问题,并给出了其回答的理由。

在人类考试中,它的表现也优于ChatGPT,包括统一律师考试(其中GPT-4排名第90百分位,ChatGPT排名第10百分位)和生物奥林匹克竞赛(其中,GPT–4排名99百分位和ChatGPT排名31百分位)。“令人兴奋的是,现在开始在人类为自己使用的相同基准上进行评估,”Wolf 说。但他补充说,“在没有看到技术细节的情况下,很难判断这些结果到底有多令人印象深刻。”

根据OpenAI的说法,GPT-4比基于该公司之前技术GPT-3版本的ChatGPT表现更好,因为它是一个更大的模型,具有更多的参数(神经网络中的值在训练过程中被调整)。这遵循了该公司在之前的模型中发现的一个重要趋势。GPT-3的表现优于GPT-2,因为它比GPT-2的15亿个参数大了100多倍,有1750亿个参数。GPT-4的开发者之一Jakub Pachocki说:"多年来,这个基本公式并没有真正改变多少。"“但这仍然像建造一艘宇宙飞船,你需要把所有这些小部件都弄好,并确保没有一个坏掉。”

但是OpenAI选择不透露GPT-4的规模。与之前发布的版本不同,该公司没有透露任何关于GPT-4是如何建造的——没有数据,没有计算能力,也没有训练技术。“OpenAI现在是一家完全封闭的公司,其科学交流类似于产品新闻稿,”Wolf说。

OpenAI说,他们花了六个月的时间使GPT-4更加安全和准确。根据该公司的说法,GPT-4对OpenAI不允许的内容请求的响应率比GPT-3.5低82%,编造内容的可能性低60%。

OpenAI表示,它使用了与ChatGPT相同的方法,通过人类反馈使用强化学习。这涉及到要求人类评分员从模型中获得不同的回答,并使用这些分数来改进未来的输出。

该团队甚至使用GPT-4来改进自己,要求它生成导致偏见、不准确或冒犯性反应的输入,然后修复模型,使其在未来拒绝这样的输入。

GPT-4可能是迄今为止构建的最好的多模态大型语言模型。但它并不像GPT-3在2020年首次出现时那样独树一帜。过去三年发生了很多事。如今,GPT-4与其他多模式模型并列,包括DeepMind的Hugging Face 模型。Wolf说,Hugging Face正在开发一个开源的多模式模型,其他人可以免费使用和调整。

面对这样的竞争,OpenAI更多的是把这个版本当作一次产品发布会,而不是一次研究更新。GPT-4的早期版本已经与OpenAI的一些合作伙伴共享,包括微软,微软今天证实,它使用了GPT-4版本来构建Bing Chat。OpenAI目前还在与Stripe、Duolingo、Morgan Stanley和冰岛政府(使用GPT-4帮助保存冰岛语)等机构合作。

“启动这种规模的模型的成本对于大多数公司来说是难以承受的,但是OpenAI所采取的方法使得大型语言模型对初创公司来说非常容易,”投资公司Tola Capital的联合创始人 Sheila Gulati 说。“这将在GPT-4的基础上催生巨大的创新。”

然而,大型语言模型仍然存在根本性缺陷。GPT-4仍然可以生成有偏见的、虚假的和令人厌恶的文本;它也仍然可以被黑客入侵以绕过它的护栏。尽管OpenAI改进了这项技术,但它并没有完全修复它。该公司声称,其安全测试已经足够的GPT-4用于第三方应用程序。但它也准备好了迎接意外。

“安全不是一个二元的东西;它是一个过程,”Sutskever说。“当你达到一个新的能力水平时,事情就会变得复杂。其中很多功能现在都已经被很好地理解了,但我相信其中的一些仍然会让人感到惊讶。”

甚至 Sutskever 也表示,放慢发布速度有时可能是更好的选择:“在这样一个世界里,公司会想出某种程序,允许那些具有完全前所未有的能力的模型缓慢发布,这将是非常可取的”。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1