OpenAI开放色情内容生成？附内容审核方案

作者：分享家137发布时间：2024-05-23

色情内容在网络中几乎无处不在，但由于保护机制、风险规避等原因，很多色情内容会被屏蔽或删除。

可是，据 Wired 报道，OpenAI 发布了一份文档草案，透露出他们正在探索色情和其他露骨内容领域。“我们正在探索是否能够通过 API 和 ChatGPT 负责任地提供在适合年龄的环境中生成 NSFW 内容的能力，我们期待更好地了解用户和社会对这一领域模型行为的期望。”

NSFW 是一个英文网络用语，“Not Safe For Work”或者“Not Suitable For Work”的缩写，意思就是某个网络内容不适合上班时间浏览，通常用于标记包含淫秽色情、暴力血腥、极端另类等内容的邮件、视频、博客、论坛帖子等。

一、网络中的色情内容

无论在传统媒体时代还是网络时代，色情内容一直“野火烧不尽”，漫画、链接、软文、ASMR 等都是色情内容的载体。

早在生成式 AI 火爆全球之前，就有人提出了 AI 生成色情内容的风险问题。“深度伪造色情内容”（Deepfake Porn）是利用人工智能技术生成的虚假色情内容，通常通过深度学习算法，将某个人的脸部图像或身体部位合成到色情视频中，以产生高度逼真的假色情影像。

英国政府网站称，近年来“深度伪造色情内容”变得越来越普遍，全世界每个月的这类图像浏览量达数百万次。2023 年 3 月，微软推出了 AI 图像生成器产品 Copilot Designer，有内部工程师发现其可生成暴力色情图，但微软却拒绝整改，无奈之下该工程师只能将其举报至政府。曾经，Stability AI 开源了根据文本生成图像的 AI 程序，Reddit 和 4chan 上的社区用户开始利用该 AI 生成真实和动画风格的裸体人物图像，其中大部分是女性，以及名人的换脸裸体图像。

目前，OpenAI 发言人格蕾丝·麦奎尔拒绝透露 OpenAI 对显式内容生成的探索涉及哪些细节，也拒绝透露该公司在这一想法上收到了哪些反馈。可是不久前，OpenAI 的首席技术官米拉·穆拉蒂称，“不确定”公司未来是否会允许使用 Sora 制作裸露内容。

二、AI 生成色情内容的现状

色情内容一直有很大的供求市场，为了逃避检测，色情内容不断以各种各样的形式进行伪装，它们表面上可能是无害的或符合一般社交规范的。当人工智能技术突飞猛进后，色情内容的生成、传播更为普遍。

色情内容可能会伪装成多种类型的文本。含有双关意味或暗示性强的“幽默”文本，和包含露骨或不当性暗示的日常生活记叙，是最为常见的色情信息载体。有时候，AI 会伪造新闻摘要、故事情节、聊天记录，并在其中加入引人遐想的描写，从真实性的角度误导读者。尽管较少见，但不排除有人将 AI 生成的色情内容伪装成教育材料，如教科书摘录、科学解释等，以讲解科学知识为幌子，展示不当行为或场景。

色情内容还会隐藏在图片和视频中。利用先进的图像处理技术，AI 能生成高度逼真的、含有性暗示的影像，也可以生成含有不当言论的音频。它们会将真实素材和虚假的合成元素混合在一起，所以往往难以检测。此外，为了更自然地融入社交平台，一些先进的 AI 系统可能会采用流行动漫或插画风格来制作图片，模仿电影、电视剧的片段，甚至模拟真实用户的行为，自动发布、转发或互动涉及色情内容的帖子。

用 AI 生成和传播色情内容是不良的行为，违反了社会公德和法律法规：

色情内容无孔不入、防不胜防，想要更精准高效地识别色情信息，内容审核团队应密切关注行业动态和技术发展趋势，不断更新检测算法，采用更复杂的机器学习模型来识别和过滤不良信息。可是，对于很多公司、个人开发者来说，自建内容审核程序的成本过于高昂。

通过公有云或私有化部署等形式，接入市场上较为成熟的内容审核平台，是高性价比的不二选择。

三、百度 AI 审核色情内容的强大优势

百度内容审核平台由智能机审平台与人机协同审核平台构成，拥有多项业内独家能力、百度亿级数据审核经验，敏感人物库业内最全、更新最快。

图片色情：智能识别图像中的色情和性感内容，包含色情违禁、儿童裸露、女性性感、艺术品色情等 18 个细分标签。
文本色情：对文本中的色情行为描述、色情资源链接、低俗交友、污秽文爱等内容进行识别。
音频色情：包含娇喘声识别和语音内容识别。先通过语音识别将音频内容转换为文字，再审核文本信息，可检测色情、暴恐违禁、政治敏感、低俗辱骂、恶意推广等语音内容，同时利用声纹检测进行娇喘声识别，高效过滤违规语音信息。
视频和直播色情：综合图像、文本审核能力，对视频内的画面、标题进行同步审核，全方位过滤违规视频。

百度内容审核平台，5 分钟即可完成规则配置，零门槛、可视化界面操作，多维度数据导出功能，能让企业快速接入使用、减少开发维护成本。