美国政府希望大型人工智能公司能够披露那些使用人工智能创建的内容。另一边,欧盟即将要求一些科技平台在其人工智能生成的图像、音频和视频上打上“显著标记”,以便告知大众这些东西是合成而来的。
然而,这里有一个大问题:识别人工智能创造的内容是一个巨大的技术挑战。目前可用的最佳选择是采取同样由人工智能驱动的检测工具和水印,但是它是检测结果不一致、不准确等缺点。
事实上,就在本周由于错误率过高,OpenAI 关闭了自己的人工智能检测工具。
(来源:通义万相)
但另一种方法最近引起了人们的注意:C2PA。它于两年前推出,是一种开源的互联网协议,依靠密码学来对内容出处的细节进行编码。
C2PA 的开发人员经常将该协议比作“营养成分标签”,它标明了内容来自哪里,以及是谁或什么创造了它。
该项目是非营利组织联合开发基金会(Joint Development Foundation)的一部分,由 Adobe、Arm、英特尔、微软和 Truepic 发起,它们成立了内容来源和真实性联盟,英文全称为 Coalition for Content Provenance and Authenticity,C2PA 也由此得名。
目前,有 1500 多家公司通过开源社区“内容真实性倡议”(CAI,Content Authenticity Initiative)参与了该项目,其中包括尼康、英国广播公司(BBC)和索尼等多家知名机构。
近来,随着人们对人工智能检测和监管的兴趣增强,上述项目的势头越来越大。C2PA 主席安德鲁·金克斯(Andrew Jenks)表示,在过去六个月里会员数量增加了 56%。
知名媒体平台 Shutterstock 已经作为成员加入,并宣布打算使用这一协议来标记其平台上所有由人工智能生成的内容,包括其由 DALL-E 驱动的人工智能图像生成器。该平台的 CEO 萨耶·阿敏(Sejal Amin)在一封电子邮件中告诉《麻省理工科技评论》,该公司正在通过“支持系统和基础设施的开发来保护艺术家和用户,这些系统和基础架构可以创造更大的透明度,从而轻松识别艺术家的创作与人工智能生成或修改的艺术之间的区别。”
什么是 C2PA,如何使用它?
微软、英特尔、Adobe 和其他主要科技公司于 2021 年 2 月开始研究 C2PA,它们希望创建一个通用的互联网协议,允许内容创作者选择在其视觉和音频内容上标注其来源信息。但就目前而言,该协议还不适用于基于文本的内容。
最重要的是,该项目具有跨互联网的适应性和功能性,并且任何人都可以免费访问其底层计算机代码。
销售内容验证产品的 Truepic 公司已经使用 Revel.ai 演示了该协议到底该如何与深度伪造视频搭配使用。当观众的光标悬停在屏幕右上角的一个小图标上时,会出现一个关于视频的信息框,其中包括“包含人工智能生成的内容”的信息披露。
Adobe 还将 C2PA(又被称为内容凭证)集成到了包括 Photoshop 和 Adobe Firefly 在内的几款产品中。该公司的内容真实性倡议高级总监、C2PA 项目负责人安迪·帕森(Andy Parsons)表示:“我们认为这是一种增值,可能会吸引更多客户使用 Adobe 工具。”
C2PA 是通过密码学来保护内容的,密码学依赖于一系列代码和密钥来保护信息不被篡改,并记录信息的来源。更具体地说,它的工作原理是通过一组加密绑定到每个像素的哈希值,来对出处信息进行编码。
与人工智能检测系统相比,C2PA 提供了一些重要的优势,后者能够更好地逃避检测。
水印,是另一种用于识别人工智能生成内容的典型技术。但是,C2PA 是一个比水印更加标准化的系统,在某些情况下比水印更容易查看。同时,该协议还可以与水印以及其他人工智能检测工具一起使用。
信息来源的价值
在媒体中添加来源信息以打击虚假信息,并不是一个新想法。早期研究似乎表明这是有希望的:例如,此前牛津大学团队在研究中发现,有证据表明用户在获得有关内容的出处信息之后,往往不太容易受到错误信息的影响。
事实上,在 OpenAI 关于其人工智能检测工具的迭代上,该公司表示它正在专注于其他“来源(披露)技术”,以满足相关方面的披露要求。
也就是说,来源信息远不是一个万无一失的解决方案。美国信息完整性中心主任、纽约布法罗大学教授 Siwei Lyu 表示,C2PA 不具有法律约束力,如果不要求在互联网范围内采用该标准,那么未标记的人工智能生成内容就会始终存在。
尽管他强调该项目仍然非常重要,但是他也表示:“缺乏全面的约束力使得这项工作存在内在漏洞。”
此外,由于 C2PA 依赖创作者选择加入,该协议并未真正解决不良行为者使用人工智能生成内容的问题。目前,还不清楚元数据的提供到底能给公众媒体流畅性带来多大帮助。
因此,该联盟最重大的挑战可能是鼓励整个互联网生态系统广泛地采用它的技术,尤其是鼓励社交媒体平台积极使用。
在 C2PA 协议的设计中,它会全方位地追溯出处信息。比如,一张照片的出处信息从相机拍摄、到它进入社交媒体时都会被编码。但是,如果社交媒体平台不使用该协议,它就不会显示照片的出处数据。
目前,尚无主流社交媒体平台采用 C2PA。推特原本已经签署了该项目,但在埃隆·马斯克(Elon Musk)接手后退出了。该公司也暂停了参与其他以自愿参与为基础的项目,而这些项目的重点多数是为了遏制错误信息。
不过,C2PA 并不是“万能药”,它不能解决所有的错误信息问题,但它确实为共有的客观现实奠定了基础。
“(因此)在 Meta 上分享内容之前,你不必知道它是从哪里来的,但如果你想的话你可以选择这样做。鉴于生成媒体的惊人能力,我们认为这样做的能力至关重要。”安迪·帕森表示。
作者简介:泰特·瑞安·莫斯利(Tate Ryan-Mosley),《麻省理工科技评论》的高级技术政策记者。