被指“擅用报道训练大模型”,OpenAI和微软摊上事了!
据公开消息,《纽约时报》12月27日就侵犯版权起诉OpenAI和微软,成为第一家起诉这两家公司侵犯其文字作品版权的美国大型媒体机构。
诉讼称,《纽约时报》发表的数百万篇文章被用于训练自动聊天机器人,而这些机器人现在被视为可靠的信息来源,与《纽约时报》等新闻机构展开了直接竞争。
《纽约时报》表示,为ChatGPT和Copilot提供支持的OpenAI和微软大型语言模型能够原封不动地生成《纽约时报》内容,或生成对其内容进行总结并模仿其文字风格的结果,这种手段破坏了《纽约时报》与读者的关系,同时也损害了《纽约时报》获得订阅、版权许可、广告和其他附带收入的能力。
在其诉讼中,《纽约时报》引用了几个案例,其中显示聊天机器人向用户提供的内容与《纽约时报》的文章几乎一字不差,而这些文章在《纽约时报》网站上需要付费订阅才能阅读。《纽约时报》表示,OpenAI和微软特别强调这些AI在训练时使用了《纽约时报》的新闻报道,因为他们认为这些材料具有可靠性和准确性。《纽约时报》认为,一些读者会对聊天机器人的回答感到满意,不再访问《纽约时报》网站,从而减少能够转化为广告和订阅收入的网站流量。
此外,《纽约时报》还警告称,AI的“幻觉”问题可能对媒体的品牌声誉造成潜在伤害,因为聊天机器人会在回答中插入虚假信息并错误地将其归因于某一信息源。诉状对此也引用了几个案例,其中,微软的Bing Chat提供了据称是来自《纽约时报》的错误信息。例如,Bing Chat会提供“15种最有益于心脏健康的食物”的搜索结果,而其中有12种食物在《纽约时报》的对应文章中并未提及。
为此,《纽约时报》已聘请律师事务所Susman Godfrey作为其在这场诉讼中的首席外部法律顾问,并指出,被告应为“非法复制和使用《纽约时报》独特且有价值的作品”和与之相关的“价值数十亿美元的法定和实际损失”负责。此外,《纽约时报》要求两家公司销毁任何使用到《纽约时报》版权材料的聊天机器人模型和训练数据。
目前微软和OpenAI尚未对此事作出回应。