鞭牛士报道,6月13日消息,据外电报道,OpenAI 和微软提出动议,部分驳回八家报纸联盟的指控,该联盟指控 ChatGPT 制造商未经许可或付费使用这些出版商的文章来推动其人工智能产品的商业化。
今年 4 月,MediaNews Group 和 Tribune Publishing 公司旗下的出版商起诉了OpenAI 和微软,声称人工智能开发人员从大量受版权保护的文章中汲取素材来训练大型语言模型,以增强 ChatGPT 和 Copilot 生成各种风格语言文本的能力。
这些出版商包括论坛出版公司旗下的《芝加哥论坛报》、《奥兰多哨兵报》、《南佛罗里达太阳哨兵报》和《纽约每日新闻》,以及媒体新闻集团旗下的《水星报》、《丹佛邮报》、《橙县纪事报》和《圣保罗先锋报》。
OpenAI 和微软于周二深夜向美国纽约南区地方法院提交了驳回动议,声称报纸出版商未能提出切实的版权投诉。
微软在动议中表示:微软和 OpenAI 的工具既不会利用原告数字内容中受保护的表达,也不会取代它——它们提取和分享属于我们所有人的语言、文化、思想和知识元素。
例如,人工智能开发人员对出版商的说法提出质疑,出版商声称只要给出正确的提示,人工智能产品就会重复大量用于训练其语言模型的报纸文章。
据微软和 OpenAI 称,出版商未能声明人工智能开发人员导致了最终用户版权侵犯,也未鼓励用户促使基于 GPT 的产品制作与出版商文章类似的内容。
人工智能开发人员补充说,仅仅因为用户可能提示用户使用基于 GPT 的产品来制作侵犯出版商文章的作品,还不足以提出版权主张。
微软表示:仅仅从理论上讲,某个地方的某个人可能会做出与原告相同的杂技动作,这不足以合理地指控直接侵权。
同样,OpenAI 表示,出版商的投诉未能充分考虑使用受版权保护的内容来训练生成式 AI 模型是否属于版权法下的合理使用。
OpenAI 表示:最终,真相将会浮出水面,我们会清楚地认识到,ChatGPT 实际上并不是一种极其低效的方式,它可以通过千分之一的非法尝试来获取可以在网上免费获取的旧报纸文章片段。
乔治城大学法学教授克里斯蒂莉亚·加西亚 (Kristelia Garcia) 表示,GPT 产品用户可以直接输出出版商的报纸文章,这一假设可能性足以证明存在版权侵犯。
加西亚在接受《法院新闻》采访时表示:事实证明这种事情有可能发生,只是时间问题,他们不应该等到遭受损失才采取行动。
加西亚补充道,该案件的结果取决于法庭是否认为出版商的诉求足以证明其有权主张版权。
加西亚说:这取决于法院是否决定等待真正的侵权行为,这意味着侵权行为是通过正常或预期的提示自然发生的,或者人为的侵权行为是否足以继续进行。
OpenAI 声称出版商也未能提出损害索赔,因为其 GPT 产品制作的任何受版权保护文章的摘录都提供了出版物名称和链接。
OpenAI 表示:任何看到所识别输出的用户都会毫不怀疑该文本的来源,并且可以轻松地在原告的网站上找到它。
出版商还声称,他们网站的内容总计至少占 Common Crawl 数据库中的 1.24 亿条基本文本,用于训练人工智能开发人员的大型语言模型。
但人工智能开发人员表示,使用出版商的文章作为训练工具不能被视为侵犯版权,因为它是在公众视野之外进行的。
微软表示:投诉并没有合理地指控模型的训练或开发如何以某种方式协助被告或任何其他人的所谓侵权行为。
微软补充道:投诉中没有提供任何信息,说明删除版权管理信息会向谁隐瞒侵权行为,也没有说明在公众视野之外进行训练的情况下,删除信息如何可能让任何人都更容易地使用受版权保护的作品来训练模型。