平川玲敏
写代码、搭建故事、搭建虚拟机……聊天机器人ChatGPT有多少我们不知道的惊喜?
OpenAI推出测试版聊天机器人ChatGPT
近日,OpenAI发布了全新的聊天机器人模型ChatGPT,也是GPT-3.5系列的核心模型之一。目前,ChatGPT仍处于测试阶段,注册后即可免费使用。OpenAI希望通过用户的反馈,开发出更好的AI系统。
虽然类似的聊天机器人并不少见,但ChatGPT发布后,迅速火遍全网,好评无数。
一些开发者认为,即使你问Google和StackOverflow,有些技术问题也不如ChatGPT可靠。
就连马斯克也抱怨“很多人都疯狂地卡在了ChatGPT的怪圈”,“ChatGPT太可怕了,我们离强大而危险的人工智能不远了”。
被马斯克推崇、网络炒作的ChatGPT究竟有何魅力?
根据OpenAI的说法,ChatGPT使用与GPT-3.5系列中的另一个模型InstructGPT相同的方法,但额外收集有关AI与人类(包括人类和AI)的对话数据。
这些AI培训师可以使用建模建议写下他们的答案。
ChatGPT开发过程
对于强化学习奖励模型,OpenAI记录了AI培训师和聊天机器人之间的对话。然后,团队随机选择人工智能使用各种自动完成功能生成的答案之一,并让教练对其进行评分。对于微调,OpenAI使用近端策略优化,这是一个重复多次的过程。
目前,很多在线交流者都展示了与ChatGPT的有趣对话,并开启了ChatGPT的多种使用。
有网友问ChatGPT如何设计客厅。ChatGPT贴心的提供了三个装修方案和三张设计图。
有网友用《老友记》这样的喜剧演员作为角色,让ChatGPT写了一些肥皂剧的台词。ChatGPT形象地描绘了几个场景:
还可以解释各种科学概念:
ChatGPT甚至在写论文等更复杂的事情上也匆忙尝试了它。其中最令人兴奋的是ChatGPT在技术领域的使用。
与常规聊天机器人不同,ChatGPT显然更具技术性。
它可以编写代码、修复错误、创建编程语言、构建虚拟机……
与GitHub的AI编程神器Copilot相比,ChatGPT似乎更擅长抢程序员饭碗。科技公司Replit的CEOAmjadMasad称赞ChatGPT是一个很棒的“调试伙伴”,他“不仅解释了错误,还修复了它,并解释了如何修复它”。
对于一些比较简单的问题,ChatGPT就更“流畅”了。在将谷歌搜索结果和聊天结果与ChatGPT进行对比后,有网友自信地宣称谷歌“完蛋了”。
ChatGPT也有很多限制
虽然这给大家带来了很多惊喜,但必须承认,目前的ChatGPT仍然存在大型语言模型中常见的局限性。其中,有网友质疑ChatGPT给出的答案的真实性。有网友指出,ChatGPT提供的代码包含完全不相干的解释:
此外,ChatGPT有时会生成听起来似是而非的响应,但这些响应既不正确也没有意义。根据OpenAI的说法,训练过于谨慎的模型会因缺乏单一事实来源而拒绝提问,而在监督训练中,理想的答案取决于模型的知识,而不是人类演示者。
ChatGPT即使对微小的输入变化也能高度响应。根据输入的不同,它可能什么都不回答、回答错误的事情或回答正确的事情——OpenAI说简单的改写就可以解决问题。还有,ChatGPT回复太长了,大部分都是短句,喜欢多说。发生这种情况是由于过度优化和更喜欢从人类反馈中获得更详细答案的教师的偏见。
ChatGPT不是用问题来回答模糊的陈述,而是试图猜测用户的意图。
有时,模型会响应不适当的请求,而不是拒绝它们。OpenAI尝试使用其审核API拒绝不符合其内容策略的请求。
当你向ChatGPT询问他的意见时,他拒绝回答,理由是无法访问互联网。
OpenAI表示:“ChatGPT模型仍然存在很多局限性,因此我们计划定期更新模型,在这些方面做出一些改进。但我们也希望通过提供ChatGPT的访问接口,我们可以获得有价值的用户反馈,从而发现事物我们还没有弄清楚这个问题。
”“
虽然当前的ChatGPT并不完美,但人们正在描述AI的美好未来。谷歌母公司Alphabet的一名工程师评论说:
“像GPT这样的大型语言模型是谷歌活跃的ML研究的最大领域之一,它们在回答查询、索引信息等方面有许多非常明显的应用。谷歌有很多预算,而且人们在这些类型的工作上工作,并进行实际训练,这非常昂贵,因为训练这些非常大的语言模型需要大量的计算能力。
但是,我从谈话中了解到,在最大的Google产品(例如搜索,gmail)中使用它们这些语言模型的经济性还没有完全准备好。一件事是提供一个人们会感兴趣的演示,但考虑到成本,试图将它深入集成到每天服务数十亿请求的系统中是另一回事,我记得版主说他们想把成本至少降低10倍,才能把这样的模型集成到像搜索这样的产品中。
10倍甚至100倍的改进在未来几年内显然是可以实现的,所以我认为这种技术将在未来几年内出现。
“