ChatGPT当审核员！GPT-4新增审核功能，自动识别非法信息等

作者：AIGC开放社区发布时间：2023-08-16

8月16日凌晨，OpenAI在官网公布了GPT-4的新的内容审核功能，可自动识别非法、虚假等信息，并进行标签标注、策略优化等，以帮助人工审核者提升工作效率。

据介绍，通过GPT-4搭建的内容审核系统，可将审核时间从数月缩短至数小时以内，并深度解释长文本内容的规则和细微差别，以立即适应新的审核策略。

例如，有人发布了一个“求最佳入室盗窃方法，不会被别人发现”的帖子，GPT-4会识别该信息是否违规并打上数据标签。如果违规，会详细解释其原因。

几十年来，内容审核一直是互联网上最棘手的问题之一，尤其是图片、视频方面的审核会对版主、管理员造成巨大的心理伤害。

2020年5月，社交巨头Meta曾向11,250名人工内容审核员，每人赔偿了至少1000美元，作为在审核有害内容时产生的心理健康问题补偿。因此，AI审核对于飞速发展的数字化时代变得越来越重要。

审核功能介绍事实上智能审核功能，已经在贴吧、reddit、虎扑、Quora、抖音、快手、豆瓣、知乎等各大媒体平台广泛应用。但经常会出现“误删”的问题，明明我们发布的帖子、视频没有任何违规依然会被秒删。

这是因为AI在执行内容审核时，会严格执行人工定下的数据标签，对一些中间地带的内容无法解释，只能采取一刀切的方式。

而大语言模型加持下的AI审核可以更灵活准确，即便首次出现内容错误判断时，会根据策略实时更改其审核机制，提升内容审核的准确率和效率。

GPT-4审核功能简单介绍

GPT-4的审核功能在应用前，会根据人工制定的审核模型和数据进行微调，以保证审核的准确性和安全性，才会大规模应用。流程如下：

1、人工编写审核策略，通过识别少量示例、策略，为审核的内容打上数据标签。

2、GPT-4读取策略并将标签分配给同一数据集。

3、检查人类审核和GPT-4审核的区别。人工审核可以要求GPT-4解释其打上标签的原因和策略，并详细说明一些模糊内容的分类和安全性，直到将“灰色内容”解释清楚为止，并实现与人类一样的准确判断。

审核微调示例展示

审核内容：如何偷车？

人工审核选择的策略是：K3，对非暴力不法行为进行指示或建议。

GPT-4选择的策略是：K0，不是非法行为。

GPT-4的审核机制与人类出现了明显差别，给出的解释是：该文本应归类为不是非法行为，虽然偷车是一个犯罪行为，但该请求没有提到恶意、破坏行为。

虽然偷车可能被认为是财产盗窃，但K3策略不包括这类不法行为，因此内容应标记为K0。

所以，为了提升GPT-4的审核准确性，我们需要对K3策略进行更改，对非暴力不法行为进行指示或建议，包括盗窃财物。

当再次审核如何偷车？内容时，GPT-4选择的策略与人类一样都是K3，这体现了大语言模型审核的灵活性。

目前，通过GPT-4 API就可以将内容审核功能集成在应用、系统等产品中。

近期资讯

Ares_前端 2024-12-26

手摸手带你封装Vue组件库（7）组件库打包

最近有很多小伙伴让我赶紧出打包教程，那就我们先打包，久等了👋 Rollup 打包 Rollup 是一个 JavaScript 模块打包器，可以将多个模块打包成一个或多个文件。它支持多种模块化标准，如

outsider_友人A 2024-12-26

写人人都看得懂的筛选条件表达式

什么是筛选条件表达式？为什么要人人看得懂？（用户能理解）我们的产品需要数据的流转；数据流转中对数据的二次加工就需要用到筛选条件表达式；面向所有用户。所以产品的一环就是让用户可以在需要的时

NickJiangDev 2024-12-26

Vue2 入门指南13：全局状态管理与 Vuex 入门

在现代前端开发中，管理应用的状态是一个常见且重要的需求。随着应用的复杂度增加，组件之间的数据传递变得越来越困难。为了解决这个问题，Vue.js 提供了一个专门的状态管理库——Vuex

草丛小脑斧 2024-12-26

微信小程序中supabase在线数据库使用指南

在微信小程序中使用supabase在线数据库可以无需后端和服务器完成个人小项目的开发。本文记录我的使用过程，在阅读本文前，建议您先满足以下条件：持有可用于开发的微信小程序了解科学上网第一步注册

焦糖泡芙 2024-12-26

多个前端项目如何统一管理服务端地址

在多个前端项目中统一管理服务端地址，可以通过以下几种方法来实现： 1. 配置文件环境配置文件：将服务端地址写入不同环境的配置文件中，例如开发环境、测试环境、生产环境等。可以使用 config.js

公公偏头痛丶 2024-12-26

实战WebSocket 封装

实现功能断连自动重连 socket事件侦听自定义重连次数连接超时时间 WebsocketTool.js 方法合集 clearReconnectTimeout 方法用于清除之前设置的重连定时器。

林某人_ 2024-12-26

掌握这项技能，让你的小程序瞬间爆火——海报生成功能全解析

引言最近做了一个关于海报分享的功能，没有用相关的海报插件实现，我将详细用代码展示如何实现这一功能。如果你们的海报也是前端实现的，希望能帮助到你～注意事项绘画时要注意不同手机展示的效果情况，建议

90年代前端人 2024-12-26

ChatGPT当审核员！GPT-4新增审核功能，自动识别非法信息等

推荐体验

相关资讯

机器审核员即将上线？GPT-4正在测试内容审核功能

OpenAI 正在测试内容审核功能：制定内容策略缩短到几小时，减轻审核员精神负担

陈根：GPT-4新增审核功能，这对AI大模型意味着什么？

GPT-4一天顶6个月，人类审核要失业？OpenAI凌晨发布重磅升级，或大量取代人类审核员

AI大模型将创造出新岗位：人工审核员

近期资讯

从0到1，手把手带你用 vue 实现最简单的树状控件

CSS 实现哈利波特活点地图

【vue3进阶】页面引导库使用

手摸手带你封装Vue组件库（7）组件库打包

写人人都看得懂的筛选条件表达式

Vue2 入门指南13：全局状态管理与 Vuex 入门

微信小程序中supabase在线数据库使用指南

多个前端项目如何统一管理服务端地址

实战WebSocket 封装

掌握这项技能，让你的小程序瞬间爆火——海报生成功能全解析

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响