数据作为AI技术发展的三大要素之一,一直是这场AI"诸神大战"中,科技巨头们“斗争”的焦点。
7月1日,谷歌更新了隐私权政策,明确表示公司保留了获取用户在网上发布的内容来训练其人工智能工具的权利。
谷歌隐私政策的更新内容如下:
谷歌将利用信息来改进我们的服务并开发新产品、功能和技术,使我们的用户和公众受益。例如,我们将使用公开信息来帮助训练谷歌的AI模型并构建Google Translate、Bard 和 Cloud AI等产品和功能。
而通过对比可知,在前一个谷歌隐私权政策的版本中,谷歌只提到了将这些数据将用于“语言模型”,而不是“人工智能模型”。
媒体分析指出,这一隐私政策条款与以往有很大的不同,通常来说,这些政策将说明企业如何使用用户在公司自己的服务器上发布的信息。但在这一项条款中,谷歌似乎保留了收集和利用在公共平台上发布的所有数据的权利,就好像整个互联网是该公司自己的AI游乐场。
此前尽管任何人都可以看到在线公开发布的内容,但这些信息的使用方式正在发生变化。公众对数据的关注点从谁可以访问数据转向如何利用数据。
谷歌的Bard和ChatGPT可能早已利用了你已经遗忘的博客帖子或几年前的餐厅评论来训练自己。对于大众对于隐私权的担忧,谷歌并未立即发表评论。
谷歌向“卖水人”表达诚意
除了谷歌的用户外,数据提供商们成了想要囤“数据”的谷歌不得不“讨好的对象”。
数据提供商们被看作为AI时代中的“卖水人”。
马斯克不想被AI白嫖数据,限制访问,导致推特大宕机。同样是不想被白嫖数据的美国贴吧Reddit,付费API已经来了。直接导致了几个非常流行的第三方Reddit app下线。由此可见AI时代“卖水人”对自家“水”的保护。
而谷歌已率先向“卖水人”们拿出了自己的诚意。大型新闻出版商们的数据自然是首当其冲的焦点。
最近几个月,围绕AI的版权问题进行讨论从未停止,加剧了大型科技公司与出版界之间本已紧张的关系。而谷歌率先表态,愿意付费购买新闻内容。
媒体援引一位报业集团高管消息称,谷歌已制定了协议,愿意在未来付费购买新闻内容:
AI争霸,谷歌囤“数据”“谷歌已经制定了许可协议,他们愿意接受需要付款购买内容的原则,但我们还没有讨论金额。谷歌方称,未来几个月里会进行金额方面的谈判,这是第一步。”
针对这一报道,谷歌澄清称关于许可协议的报道“不准确”,并补充说“现在还处于早期阶段,我们正在继续与生态系统合作,包括新闻发布商,获取他们的意见。”
据谷歌表示,他们正在与美国、英国和欧洲的新闻机构进行“持续对话”,同时他们的AI工具Bard也正在接受“公开可获得的信息”的培训,这可能包括需要付费的网站。