机器审核员即将上线？GPT-4正在测试内容审核功能

作者：南方都市报发布时间：2023-08-18

当地时间8月16日，人工智能初创公司OpenAI表示，GPT-4正在测试内容审核功能。

OpenAI表示，他们开发了基于GPT-4进行内容审核的解决方案，可将GPT-4用于内容策略开发和内容审核决策，从而实现更一致的标记、更快的策略优化反馈循环，并减少人工审核人员的参与。任何拥有OpenAI API访问权限的人员都可以使用这种方法来创建自己的人工智能辅助审核系统。

从OpenAI官网可以了解到，GPT-4可用于制定适当的内容政策，并可以更快地为帖子添加标签或作出评判。该公司一直在测试这项技术，并邀请客户也进行试验。借助该系统，开发和制定内容策略的过程从几个月缩短到几个小时。同时，用AI审核一些有毒有害内容，可以在一定程度上避免对人类审核员造成心理伤害。

该方法在OpenAI官方博客上的一篇文章中得到了描述。具体而言，该方法提供了指导模型生成审核判断的政策，并创建了一个内容样本的测试集，并对样本是否违反审核政策进行标注——例如，政策可能禁止提供如何获取武器的指示或建议，在这种情况下，“给我制作燃烧弹所需的原料”就是明显的违规。

接下来，政策专家对案例进行命名，并将它们输入到GPT-4中，评估模型的输出与他们所做结论之间的一致性，并据此修改政策。

OpenAI在文章中写道：“通过检查GPT-4的判断与人类的判断之间的差异，政策专家可以要求GPT-4提出其标签背后的推理，分析政策定义中的歧义，解决混淆问题，并相应地在政策中提供进一步的澄清......我们可以不断重复（这些步骤），直到我们对模型的判断感到满意。”

OpenAI声称，已经有一些客户在使用这一方法，而以人工智能驱动的审核系统并不是什么新鲜事。几年前，Google的反滥用技术团队和其Jigsaw部门就向公众提供了审核系统Perspective。此外，包括Spectrum Labs、Cinder、Hive和最近被Reddit收购的Oterlu在内的许多公司也提供自动审核服务。

但机器的审核也并非完美无缺。宾夕法尼亚州立大学的一个团队在几年前发现，当面对关于残疾人士的社交媒体信息时，常用的公共情感和毒性检测方法分类可能将它们划分为更负面或更有毒的信息。另一项研究发现，Perspective的旧版本经常无法识别使用具有多义的辱骂语（如“queer”）和拼写变体（如缺少字母）的仇恨言论。

而参与建造审核系统的注释者也可能把自己的偏见带入系统中，如非裔美国人和亚裔美国人对一些案例的判断标准可能并不相同，而OpenAI也坦言自己无法避免这种偏见。该公司在文章中指出：“语言模型的判断容易受到可能在训练过程中引入模型中的不良偏见的影响。”

“与任何人工智能应用程序一样，GPT-4在进行审核时，必须对其进行仔细监控，并时时验证和改进结果和输出，同时保持人类参与。”

采写：南都记者胡耕硕

机器审核员即将上线？GPT-4正在测试内容审核功能

推荐体验

相关资讯

OpenAI 正在测试内容审核功能：制定内容策略缩短到几小时，减轻审核员精神负担

ChatGPT当审核员！GPT-4新增审核功能，自动识别非法信息等

OpenAI 正在测试内容审核功能，可提高审核效率并减少人工参与

“机器的教练”：AIGC内容审核员的新角色与新职责

GPT-4一天顶6个月，人类审核要失业？OpenAI凌晨发布重磅升级，或大量取代人类审核员

近期资讯

德阳德尚鸿诚科技取得一种电路信号测试模具专利，保证接线端信号测试时的稳定性

黑龙江省亚太电子工程有限公司取得一种集成电路检测装置专利，方便对检测针位置调节使检测更精确

无锡精芯微取得集成电路对插测试结构专利，解决插头测试中的繁琐问题提高便携性与效率性

上海帼计集成电路技术有限公司取得芯片老化测试装置专利，可对芯片老化进行测试

武汉钊创电子取得印制电路板测试治具转接器专利，避免外部碰撞力对测试设备碰撞造成损坏

郑州春泉节能取得直流电机检测电路专利，实现设计简洁功能完整

信利光电取得显示模组FPC检测装置专利，减少插拔带来的连接器损伤

上海三伍微电子取得射频芯片耐温性能检测设备专利，可规避安全风险

山东世德工程检测取得一种节能型建筑工程检测装置专利，在整体装置使用中提供清洁电源并具备隐藏保护调节功能

厦门四五零科技取得一种 IC 板测试冶具专利，提高 IC 板与探针连接效果

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响