2023-10-22 11:40:29 作者:姚立伟
据最新报道,社交问答网站Reddit正与一系列生成式AI公司进行洽谈,以商讨付费使用数据的可能性。然而,如果谈判破裂,Reddit考虑禁止谷歌、必应等搜索引擎的爬虫从其平台获取内容。消息人士透露,在Reddit做出这个决定之前,已经有超过535家新闻机构采取了类似做法来防止自己的内容被收集并用于训练AI聊天机器人。
这并不是Reddit第一次对AI问题发出警告。就在今年8月,它曾考虑起诉OpenAI的原因之一是该组织使用《纽约时报》的文章和图片来训练其AI模型,违反了该报的服务条款。如果诉讼成功,OpenAI可能会面临巨大损失,包括删除其数据集和支付高额罚款。
尽管如此,在此之前,《纽约时报》已经宣布与OpenAI达成许可协议,并获得了将美联社的报道内容用于AI模型训练数据的许可。目前尚不清楚 Reddit 是否会与这些公司进行合作或是否会禁止搜索引擎爬虫访问其平台。
值得注意的是,《华盛顿邮报》报道称Reddit否认了关于“用户需强制登录平台才能查看内容”的说法,但并未否认“封杀搜索引擎爬虫”的可能性。“没有搜索功能也能生存。”一位消息人士表示,“(对于)Reddit而言,在不依赖搜索引擎的情况下也能够正常运行。”
除了应对生成式AI带来的挑战之外,Reddit还面临着其他方面的压力。根据一些报道,今年夏天有数百万用户流失了Reddit社区,并指责该网站未能及时采取行动解决有关内容审查和信任度的问题。
本文原稿来源自