人工智能科技公司又惹上官司了,当地时间3月11日,美国作家布莱恩·基恩(Brian Keene)、阿布迪·纳泽米安(Abdi Nazemian)和斯图尔特·奥南(Stewart O’Nan)三人集体起诉了科技巨头公司英伟达,称该公司未经许可使用其受版权保护的作品来训练英伟达人工智能平台NeMo。
三位作家表示他们的作品大约是196640本书的数据集的一部分,这些书帮助训练NeMo模拟普通的书面语言。诉讼涉及的作品包括了基恩2008年的小说《Ghost Walk》、纳泽米安2019年的小说《Like a Love Story》、奥南2007年的中篇小说《Last Night at the Lobster》。由于侵犯版权,相关数据集于去年10月被下架。11日,英伟达的一名发言人在一份声明中表示“我们尊重所有内容创作者的权利,并相信我们在创建NeMo时完全遵守了版权法。”英伟达在宣传NeMo平台时称这是一种采用生成式人工智能的一种快速且经济实惠的新选择。
英伟达也不是第一家因为版权侵权陷入诉讼纠纷的科技公司了,去年12月,《纽约时报》向微软发起了诉讼,指控其AI平台对《纽约时报》的版权构成侵害。而在AI技术方面屡屡出头的科技公司OpenAI更是大大小小诉讼官司如浪潮一般接连不断,就在3月4日,美国企业家埃隆·马斯克起诉了OpenAI及其首席执行官萨姆·奥尔特曼,此前包括《纽约时报》在内的多家新闻媒体机构和作家都起诉了OpenAI,指控OpenAI滥用文章来训练其ChatGPT背后的人工智能系统。诉讼称,这些媒体的数千篇文章被用来训练ChatGPT对人类提示做出反应,并且聊天机器人在提示时“逐字或几乎逐字”地复制了他们的版权材料。除文字数据外,图片数据的侵权纠纷也屡屡发生,去年六月,英国的摄影图库网站 Getty Images起诉AI 艺术生成器Stability AI,控诉该平台从其图片数据库中复制了超过1200万张图像,作为其建立竞争业务能力的一部分,并且指出这家 AI 公司侵犯了作者版权和商标保护。
大多AICG的实现基本上由三个节点组成,首先是数据收集,其次是模型训练,最后由用户进行关键词输入,数据收集和模型训练由平台开发者进行,模型训练离不开海量的数据,理想情况下,平台应当通过合法合规的手段取得数据资源网站或者数据版权持有方的授权,通过支付费用来获得数据的使用权,但实际上,AI平台数据的来源长期以来处于“黑箱”状态,平台数据来源是否清晰合法外人难以得知,而用户也并不那么容易能够通过AI生成的作品判断自己的版权作品是否被滥用,作者要根据AI生成的作品举证说明自己的版权作品被AI平台滥用并不容易,更不用说用户还可能在稀里糊涂中勾选同意了平台采集自己在软件中上传的绘画、文字作品,自己的创作莫名其妙的就成了AI模型数据库中的一员。
版权持有方和人工智能平台之间的冲突摩擦不断,越来越多因为AI平台引发的版权侵权纠纷出现在了司法实践中,比如在今年2月底判决的AI平台可生成奥特曼图形被判侵权奥特曼一案。技术发展带来行业的变革,行业的剧变势必会带来新旧势力的冲突交锋,短时间内各种诉讼侵权官司不会少,但从好的一面来看,这些司法实践对于促成双方就版权授权使用边界的界定、个人隐私权益的保护、平台与内容生产者之间利益的协调或许都会有所助益。
扬子晚报|紫牛新闻记者 沈昭
校对 王菲
亚信安慧AntDB数据库 2024-12-20
亚信安慧AntDB数据库 2024-12-20
亚信安慧AntDB数据库 2024-12-20
亚信安慧AntDB数据库 2024-12-20