IT之家 7 月 6 日消息,AI 模型训练数据源的版权一直以来都是老生常谈的话题,此前微软被多人投诉称“将公共代码据为己有”,OpenAI 也被控“非法使用图书数据训练”。
OpenAI 如今又一次陷入了训练数据版权风波,两位知名恐怖小说作家声称 ChatGPT 非法盗用了他们的数据进行训练,法院目前正在对这一案件进行审理中。
▲ 图源 法院文件
参与诉讼的作者之一是保罗・特伦布莱(Paul Tremblay),他在 2018 年以恐怖小说《世界尽头的小屋(The Cabin at the End of the World)》而闻名。这部小说已被改编成电影《敲敲门(Knock at the Cabin)》,由导演 M. Night Shyamalan 执导。
另一位作家是莫娜・阿瓦德(Mona Awad),她也是一位北美知名的恐怖小说作家,著有《13 种看待胖女孩的方式(3 Ways of Looking at a Fat Girl)》《兔子(Rabbit)》和《所有的方式(All's Well)》等作品。
IT之家查询原件发现,这两名作家诉讼的理由是 ChatGPT 能够无视版权,生成他们作品的摘要:
原告不同意使用其受版权保护的书籍作为 ChatGPT 的培训材料。尽管如此,他们受版权保护的材料还是已经被用于训练 ChatGPT,因为通常情况下,只有 ChatGPT 学习过这些作品,才能够生成相关信息。
▲ 图源 法院文件
OpenAI 目前尚未对此作出评论,该诉讼尚在进行中,考虑到当下外界对于 AI 训练数据版权的态度,OpenAI 胜算的可能性并不高。