当前位置：首页|资讯|OpenAI|ChatGPT

OpenAI进军内容审核行业，学校已在用ChatGPT筛选色情描述了

作者：量子位发布时间：2023-08-16

OpenAI进军内容审核行业，学校已在用ChatGPT筛选色情描述了

克雷西发自凹非寺

量子位 | 公众号 QbitAI

学校的图书管理员，已经开始用ChatGPT来筛选带色情内容的书籍了。

根据一项新规定，美国爱荷华州的学校需要下架图书馆中包含性行为描述的书籍，但“阅读每本书并按新要求筛选根本不可行”。

在ChatGPT的帮助下，一个学区终于赶在开学前筛选出19本符合条件的书籍。

隔天，OpenAI也正式宣布将GPT-4引入内容审核系统。

在OpenAI看来，GPT-4这项审查功能可将审查更新周期从数月缩短至数个小时，且具有更强的灵活性。

高效自动化内容审核

这项新的功能不仅在于提高效率和减轻人类工作量，还解决了人工审核中尺度不一致问题。

最重要的是，它能够避免有害内容对审核人员造成的身心伤害。

一家科技媒体的编辑Reed Albergotti做出了这样的表示：

使用大型语言模型来进行内容审查是向前迈出的一步。

这并不是因为它有多完美，而是因为它的尺度会更加一致，并且不易受到人类情感和文化差异的影响。

工作流程上，重点的环节是用户政策的设计，这部分是由人工主导的。

之后GPT-4会使用一些示例进行准确性检验和优化。

根据GPT-4的预测微调出小型筛选器，就可以对内容进行批量审查了。

OpenAI发言人也透露，已经有客户在用GPT-4进行内容审查，但并未给出具体名单。

此外，OpenAI正在研究将这项功能从文本审核扩展到图像、视频的鉴别。

那么，这个功能究竟好不好用呢？

OpenAI：有信心做得很好

OpenAI总裁兼联合创始人Greg Brockman表示，这项功能「非常可靠」。

同时，Brockman还展示出了测试结果作为依据。

在色情、暴力等多个类型的有害内容判别上，GPT-4的表现超过了经少量训练的人类。

不过和经验丰富的审核人员相比，的确还有一些差距。

但OpenAI安全和信任部门原主管Dave Willner对著名科技媒体人Casey Newton表示，「这种情况不会持续太久」。

也有负面观点认为，总会有人想方设法钻AI规则的漏洞。

毕竟，大模型越狱事件出现了已经不只是一次两次了。

美联社的Frank Bajak更是表示，ChatGPT这样的大型语言模型「非常难以控制」。

对此，Weng也坦言，的确没办法做到100%没有漏洞，但有信心会很好。

「我们无法从一开始就构建一个100%「防弹」的系统。

人们正在帮我们揪出模型中的错误，但我非常有信心它能做得很好。」

One More Thing

GPT-4内容审核功能的实用性暂且按下不表，OpenAI的安全工作本身也存在很多争议。

据Time杂志消息，OpenAI此前在肯尼亚聘请数据标注人员标注有害内容的过程中，有参与者表示其中的暴力、酷刑等有害内容给他们造成了心理阴影。

新方法出台后，人类仍需要参与到内容审查工作当中，但这样的情况可能会大大减少。

参考链接：

[1]https://openai.com/blog/using-gpt-4-for-content-moderation

[2]https://www.popsci.com/technology/iowa-chatgpt-book-ban/

[3]https://www.semafor.com/article/08/15/2023/can-chatgpt-become-a-content-moderator

[4]https://twitter.com/gdb/status/1691500101187805185

[5]https://twitter.com/caseynewton/status/1691602324366786575

推荐体验

相关资讯

OpenAI进军内容审核行业，学校图书馆已在用ChatGPT筛选色情描述了

学校的图书管理员已开始使用ChatGPT来筛选含有色情内容的图书。根据新规定，美国爱荷华州的学校必须移除图书馆中含有性行为描写的书籍，然而“逐本阅读并按照新标准进行筛选显然是不切实际的”。在Ch

蓬域科技 2023-08-17

OpenAI开放色情内容生成？附内容审核方案

色情内容在网络中几乎无处不在，但由于保护机制、风险规避等原因，很多色情内容会被屏蔽或删除。可是，据 Wired 报道，OpenAI 发布了一份文档草案，透露出他们正在探索色情和其他露骨内容领域。“我们正在探索是否能够通过 API 和 ChatGPT 负责任地提供在适合年龄的环境中生成 NSFW 内容的能力，我们期待更好地了解用户和社会对这一领域模型行为的期望。”NSFW 是一个英文网络用语，“Not Safe For Work”或者“Not Suitable For Work”的缩写，意思就是某个网络内容

分享家137 2024-05-23

OpenAI正为ChatGPT测试内容审核功能可将审核时间从数月缩短至数小时

OpenAI近日正在为GPT-4测试内容审核功能，帮助用户提高审核工作的效率。该功能将允许用户通过OpenAI API来创建自己的AI辅助审核系统，通过制定一定的审核政策，让人工智能来对帖子的内容并进

OpenAI ChatGPT GPT-4 人工智能

金融界 2023-08-16

OpenAI 正为 ChatGPT 测试内容审核功能，可减少人工参与

OpenAI 正为 ChatGPT 测试内容审核功能，可减少人工参与品玩8月16日讯，据 OpenAI 官方消息，OpenAI 近日正在为 GPT-4 测试内容审核功能，帮助用户提高审核工作的

OpenAI ChatGPT GPT-4

品玩 2023-08-16

OpenAI 正在测试内容审核功能，可提高审核效率并减少人工参与

IT之家 8 月 16 日消息，日前，人工智能初创公司 OpenAI 表示，GPT-4 正在测试内容审核功能，任何拥有 OpenAI API 访问权限的人都可以使用这种方法来创建自己的人工智能辅助审核

OpenAI 人工智能 GPT-4

IT之家 2023-08-16

近期资讯

斯芮弗科技取得高效的TOC流路系统专利，结构简单、价格优势明显

金融界2024年12月28日消息，国家知识产权局信息显示，斯芮弗（无锡）科技有限公司取得一项名为“一种高效的TOC流路系统”的专利，授权公告号CN222212748U，申请日期为2024年4月。

金融界 2024-12-28

上海华新合金取得铝合金铸造产线用检具专利，能够对铸件进行快速装夹定位并提高检具使用效果和操作便捷性

金融界2024年12月28日消息，国家知识产权局信息显示，上海华新合金有限公司取得一项名为“一种铝合金铸造产线用检具”的专利，授权公告号CN222212754U，申请日期为2024年3月。

金融界 2024-12-28

楚雄变压器取得油浸式电力变压器湿度报警装置专利，有利于人们及时知晓变压器本体的运行异常

金融界2024年12月28日消息，国家知识产权局信息显示，云南省楚雄变压器有限责任公司取得一项名为“一种油浸式电力变压器湿度报警装置”的专利，授权公告号CN222212766U，申请日期为2024年3月。专利摘要显示，本实用新型提供一种油浸式电力变压器湿度报警装置。

金融界 2024-12-28

湖南丽赛药业取得抗 HPV 凝胶敷料反应试验观察箱专利，便于对比不同处

金融界2024年12月28日消息，国家知识产权局信息显示，湖南丽赛药业有限公司取得一项名为“一种抗HPV凝胶敷料反应试验观察箱”的专利，授权公告号CN222212738U，申请日期为2024年4月。

金融界 2024-12-28

陕西地建取得一种水域生态环境监测预警装置专利，方便水质监测仪稳定检测一定区域内水质

金融界2024年12月28日消息，国家知识产权局信息显示，陕西地建土地工程技术研究院有限责任公司取得一项名为“一种水域生态环境监测预警装置”的专利，授权公告号CN222212745U，申请日期为2024年3月。

金融界 2024-12-28

方太取得微流控检测仪专利，能增快加样速度及避免多次加样繁琐问题

金融界2024年12月28日消息，国家知识产权局信息显示，宁波方太厨具有限公司取得一项名为“一种微流控检测仪”的专利，授权公告号CN222212781U，申请日期为2024年2月。

金融界 2024-12-28

山东三润生物科技取得方便清理的水分测定仪专利，便于对盛料盘内部进行清理

金融界2024年12月28日消息，国家知识产权局信息显示，山东三润生物科技有限公司取得一项名为“一种方便清理的水分测定仪”的专利，授权公告号CN222212742U，申请日期为2024年3月。

金融界 2024-12-28

延长油田子长采油厂取得新型油田注水水质检测仪器专利，对检测头进行有效地放置和保护

金融界2024年12月28日消息，国家知识产权局信息显示，延长油田股份有限公司子长采油厂取得一项名为“一种新型油田注水水质检测仪器”的专利，授权公告号CN222212750U，申请日期为2024年4月。

金融界 2024-12-28

耀辉眼镜取得眼镜镜片表面探伤检测机专利，能够方便对待检测探伤的镜片进行自动清洁

金融界2024年12月28日消息，国家知识产权局信息显示，耀辉眼镜（深圳）有限公司取得一项名为“一种眼镜镜片表面探伤检测机”的专利，授权公告号CN222212774U，申请日期为2024年4月。

金融界 2024-12-28

信通云峰取得一种水环境监测浮标专利，能够在入水时提高整体质量和稳定性

金融界2024年12月28日消息，国家知识产权局信息显示，北京信通云峰科技有限公司取得一项名为“一种水环境监测浮标”的专利，授权公告号CN222212752U，申请日期为2024年11月。

金融界 2024-12-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1