一直以来,关于AI是否侵权的相关话题的讨论就没有停止。而自从ChatGPT打开了生成式AI(AIGC)新大门,AI侵权的风险被进一步放大。
相比于ChatGPT此类的文字大模型,AI绘画似乎存在更大的争议,已经有图库公司和个人发起侵权起诉,还有国内原创平台推出AI绘画惹得不少画手删号退出。
随着ChatGPT的爆火,对于其信息泄露和侵权的质疑在不断加强。目前意大利已经禁用ChatGPT,德国、法国、爱尔兰等国家已开始准备效仿意大利的做法,加强对ChatGPT的监管。
4月4日,加拿大隐私专员办公室(OPC)宣布对聊天机器人ChatGPT开发公司OpenAI展开调查,该调查涉及“OpenAI未经同意收集、使用和披露个人信息”的指控。
此外, 不少企业也开始限制在业务运营中使用ChatGPT以防止信息泄露。
这些国家对ChatGPT的谨慎态度不是毫无道理的。ChatGPT这样的文字大模型需要大量的训练数据,而这些数据很多都来自公开信息。尽管ChatGPT会对信息进行再加工,但是否侵权这还是个争议话题。
2022年11月,GitHub、微软和OpenAI在一起侵权案中被起诉,程序员指控一款名为GitHub Copilot的AI编程工具抄袭代码。
据了解,这场诉讼的法庭听证会将在今年5月举行。
事实上,已有美国新闻媒体机构对AI使用自己的内容感到不满。据报道,拥有《纽约邮报》、《巴伦周刊》、《华尔街日报》等的美国新闻集团正准备向 OpenAI、微软和谷歌等公司提起诉讼,要求赔偿其内容在ChatGPT、Bard等AI工具中被用来使用的费用。
一位《华尔街日报》的记者曾展示了训练ChatGPT的一份新闻来源清单,路透、纽约时报、卫报,BBC新闻、彭博等一些国际主流媒体均在其中。
AIGC的另外一个侵权隐患就是错误信息,ChatGPT扯起谎来有时逼真的令人惊讶。
今年2月份,一则“杭州3月1号取消限行”的消息流传开来,让不少人信以为真。最后杭州警方证实消息不实,系某人用ChatGPT写的假新闻。
这种虚假信息主要责任还是造假者,但有时AI本身就会数据虚假信息,这也有侵权隐患。
比如,近日一位乔治·华盛顿大学法学院教授就莫名成了“性骚扰者”。据报道,ChatGPT生成的一份“有性骚扰历史的法学学者”名单中,这位教授就在其中。
还有英国《卫报》的一位记者称,ChatGPT杜撰了一篇他署名的文章,文章风格和他很相似,足以以假乱真,但他本人经过确认并没有写过这篇文章。
另据报道,澳大利亚一位市长准备起诉ChatGPT的所有者openAI,因为ChatGPT在介绍这位市长时,称其卷入到了一场贿赂丑闻中,还称其有罪。这位市长已向openAI发出法律信函,要求对方修正错误表述,否则将面临诽谤诉讼。
最近国内也上线了不少类ChatGPT大模型,也爆出不少让人匪夷所思的错误回答。
去年8月份Stable Diffusion向用户免费提供掀起了AI作画的热潮。Midjourney、DALL·E 2、Imagen等热门AI作画平台也都诞生于2022年,可谓AI作画元年。
AI作画的作品到底有没有版权,这是个问题。
去年9月,艺术家卡什塔诺娃为自己的漫画书《黎明的曙光》申请版权保护,但没有透露书中的插图由AI创作。
今年2月,美国版权局做出裁决称,漫画书中的文本仍受版权保护,但由AI作画工具Midjourney创作的插图不受版权保护。
对于创作者来说,AI作画有潜在的版权风险。
此外,AI作画工具能力的提升也是基于大量的图像库进行训练,其实有一定侵权的隐患。
比如图像库中涉及到有版权的图像,而用户生成的图片恰好显示了上述图像的显著部分,这可能涉及到侵权。
有报道指出,Stable Diffusion生成的一些图像似乎带有水印,这表明它的原始训练数据集中可能有一部分图像是受版权保护的。
为了避免版权问题,Getty Images、Shutterstock等知名付费图库纷纷封禁AI生成图片,停止接收所有由Stable Diffusion、DALL·E 2、Midjourney等AI模型生成的画作。
同样,AI作画工具也受到不少画师的抵制,其一是有些人认为AI在免费用他们的作品作为训练数据,还有人认为AI模仿了自己的作画风格,也是一种侵权行为。
去年底知名视觉艺术网站Artstation就发生了用户集体抵制AI的事件,当时引起了广泛关注。
最近,网易图片社区LOFTER上线AI绘画功能,就遭到用户的抵制,担心平台会把自己的画作当做训练数据。
对此,LOFTER两度发布声明称,该功能的训练数据集来自于开源数据,未使用用户作品,并表示始终尊重并保护创作者的知识产权。
但画手们似乎并不满意,不少人发文抵制,甚至有人删号退出平台。3月8日,LOFTER最终下线了该功能。
事实上,今年1月份国外已有三位艺术家状告Stability AI以及Midjourney,侵犯诉讼艺术家的版权。
艺术家指出这些AI工具训练数据涉及到了上亿张受版权保护的图像,他们把AI作画工具称为“侵犯艺术家权利的21世纪拼贴工具”。
除了艺术家,全球知名的图库商Getty Images起诉了AI作画工具的老大哥Stability AI。
Getty Images称Stability AI非法复制和处理了数百万受版权保护的图像”,以此训练名下的Stable Difussion。
Getty Images还展示了多张Stability AI的生成图片,图片上赫然地带有自家的logo。
注:左侧为图库原图,右侧为AI作图
无论是图像还是文字大模型,其实都有不少版权相关的风险隐患。
作为AI作画工具平台方,训练数据可能侵犯他人的版权,比如新闻机构、图库商,内容也可能存在失真情况。
而作为普通使用者,首先创作的内容的版权很难得以保证,目前规则也比较模糊,到底怎样的AI创作才拥有版权还待清晰的规则。
其次,普通使用者也可能制作的内容可能侵犯他人的权利或违规违法,比如虚假新闻、丑化图像。
对于艺术家等专业内容创作者来说,自己的半成品存在被窃取的风险,同时个人风格也容易失去独特性,如何保证自己的利益将变得困难。
对于个人创作者来说,很难像Getty Images这样的图库机构能够找到侵权的确切证据,毕竟AI是经过加工处理的,这也是生成式AI的最大特点,越成熟的平台也是如此。
笔者尝试测试了Midjourney、DALL·E 2、文心一言等AI平台,确实很难发现生成的内容是否与现实作品有多大关联。
但对于弱小的个人创作者,又如何维护自己的版权,而不是在不知不觉间成为AI的训练数据,这也是个问题。
这一切都要求AIGC版权规则的进一步完善。事实上,生成式AI是从2022年才开始爆火,时间还很短,但是我们一系列争议和诉讼中也要看到积极的一面,这些都是促使AI版权完善的重要途径。
本文来自微信公众号“三言财经”(ID:sycaijing),作者:三言,36氪经授权发布。