文/陈根
ChatGPT作为优越的语言生成模型,受到了广泛的好评和大众的喜欢,与此同时,也由于较高的错误率而遭到不同机构的封禁。前段时间就有 Stack Overflow 封禁 ChatGPT 的消息满天飞,Stack Overflow官方表示暂时封禁 ChatGPT 正是因为它生成的答案正确率太低,而发布由 ChatGPT 创建的答案对网站和查询正确答案的用户来说是非常有害的。
现在,ChatGPT又陷入了造假作弊的风波。毕竟,ChatGPT生成内容时会“参照”现有作品,产出的速度又几乎无限,人们对其的担忧已经蔓延到了 AI 学界自身,全球知名机器学习会议之一的 ICML 最近也宣布禁止发表包含由 ChatGPT 和其他类似系统生成内容的论文,以免出现“意外后果”。
《华尔街日报》的专栏作家曾使用 ChatGPT 撰写了一篇能拿及格分的 AP 英语论文,而《福布斯》记者则利用它在 20 分钟内完成了两篇大学论文。亚利桑那州立大学教授 Dan Gillmor 在接受卫报采访时回忆说,他尝试给 ChatGPT 布置一道给学生的作业,结果发现 AI 生成的论文也可以获得好成绩。
对于这样的情况,ChatGPT 的开放者 OpenAI 已宣布正在努力开发“缓解措施”,帮助人们检测由 AI 自动生成的文本。
目前,已经有开发者制作了面向 ChatGPT 生成内容的检测工具——“GPTZero”,只需要将内容粘贴在输入框,就能在几秒钟之内得到分析结果,快速检测出一篇文章是 ChatGPT 还是人工撰写的。
GPTZero 应用程序的原理是借助一些文本属性进行分析。首先是困惑度(perplexity),即文本对模型的随机性,或语言模型对文本的“喜爱”程度;然后是突发度(burstiness),即机器写作的文本在一段时间内表现出的困惑度更均匀和恒定,而人类书写的文本则不会这样。
事实上,尽管 AI 生成的文字内容在学术会议和学校禁止机器写论文作弊的新闻中看起来令人印象深刻,但要知道,与真正的人类写作相比,它们时常缺乏真正的理解与逻辑。
人都在讨论它的智能,这不足为奇。但是 ChatGPT类似人类的输出和惊人的通用性只是优秀技术的结果,而不是真正的聪明。AI仍然会犯一些可笑的错误,这说明它完全没有常识。无疑, ChatGPT在语言生成模型上是一个巨大的飞跃,但它仍然是人类制造出来的工具,它还有很多缺陷和局限性,这也是技术持续努力的方向。