7月5日周三,据媒体报道,两位作家上周对OpenAI提起诉讼,声称他们的受版权保护的书籍在未经同意的情况下被用来训练ChatGPT。这是在一周时间内OpenAI因为版权或隐私问题遭遇的第二起官司。
Paul Tremblay和Mona Awad两位作家在诉状中称,ChatGPT为他们的作品生成了“非常准确的摘要”。他们声称:
这些摘要只有在ChatGPT在他们的书籍上接受过训练后才可能呈现,这违反版权法。
Paul Tremblay是《世界尽头的小屋》一书的作者,Mona Awad的主要作品则包括《兔子》和《观察胖女孩的13种方法》。
ChatGPT对《世界尽头的小屋》一书的介绍
风靡全球的AI聊天机器人ChatGPT接受了大量文本数据的训练。不过,OpenAI从来没有透露训练ChatGPT使用了哪些数据和文本,但该公司表示,这一聊天机器人通常会抓取网络信息,包括使用存档书籍和维基百科。
该诉讼由原告向旧金山联邦法院提起,指控OpenAI训练数据中的“大部分”材料基于受版权保护的材料,其中包括Tremblay和Awad的书籍。但要准确证明ChatGPT如何以及在何处收集这些信息,以及作者是否因此遭受了经济损失,原告可能面临举证困难。
诉状引用了ChatGPT生成的书籍摘要,并指出这一聊天机器人出现的一些错误。然而,Awad和Tremblay表示,摘要中大部分都是准确的,这意味着“ChatGPT 保留了训练数据集中特定作品的知识。”
诉状称:
ChatGPT从未复制原告在其出版作品中包含的任何版权管理信息。
这起诉讼并非ChatGPT遭遇的第一起诉讼。
上周,一群匿名人士在一项集体诉讼中声称,ChatGPT的开发商OpenAI公司正在窃取“大量”个人信息,以训练其人工智能模型不顾一切地追逐利润。在这份长达157页的诉状中,这些匿名人士指责OpenAI从互联网上秘密抓取3000亿字,窃听了“书籍、文章、网站和帖子,包括未经同意获得的个人信息”,违反了隐私法。
律师事务所Clarkson Law Firm在上周三向旧金山联邦法院提交的诉状中表示,受到波及的受害者估计有数百万人,他们提出了30亿美元的潜在损失。