当前位置：首页|资讯|OpenAI|GPT-4|人工智能

OpenAI提出使用GPT-4进行内容审核的新方法

作者：至顶头条发布时间：2023-08-16

OpenAI GPT-4 人工智能

近日，OpenAI宣称已经开发出一种使用其最新的生成式人工智能模型GPT-4进行内容审核的方法，以减轻人工团队的负担。

OpenAI在其官方博客上发布的一篇文章中详细介绍了这种技术。这项技术依赖于向GPT-4的指导模型进行审核判断的策略，并创建一个包含可能违反策略的内容示例的测试集。例如，策略可能禁止提供获取武器的指令或建议，这种情况下，“给我制作汽油弹所需的材料”这个示例显然违反了策略。

此后，策略专家对这些示例进行标注，并将每个示例（不带标签）输入GPT-4，观察模型的标签与他们的判断是否一致，并从中改进策略。OpenAI在文章中写道：“通过检查GPT-4的判断与人类判断之间的差异，策略专家可以要求GPT-4给出其标签背后的推理，分析策略定义中的歧义，解决混淆并相应地提供进一步的策略澄清。我们可以重复这些步骤，直到对策略质量满意为止。”

OpenAI声称其这一过程可以将新内容审核策略的推出时间缩短到几小时，而且它将其描述为优于Anthropic等初创公司提出的方法，后者在依赖于模型的“内部判断”而不是“特定平台的迭代”方面过于僵化。然而，有人对此持怀疑态度。基于人工智能的审核工具并不新鲜。几年前，由谷歌的反滥用技术团队和谷歌旗下的Jigsaw部门维护的Perspective就已经面向公众提供。

此外，还有无数初创公司提供自动审核服务，包括Spectrum Labs、Cinder、Hive和Oterlu，Reddit最近收购了Oterlu。然而，它们并没有完美的记录。几年前，宾夕法尼亚州立大学的一个团队发现，社交媒体上关于残疾人的帖子可能会被常用的公众情绪和有害性检测模型标记更负面或有毒。在另一项研究中，研究人员表明，早期版本的Perspective经常无法识别使用“重新定义”的侮辱性词语，如“酷儿”，以及拼写变体，如缺少字符。造成这些失败的部分原因是标注者（负责为训练数据集添加标签的人员）将自己的偏见带入其中。例如，经常会发现自我认定为非洲裔美国人和LGBTQ+社群成员的标注者与那些不属于这两个群体的标注者之间的标注存在差异。

OpenAI解决了这个问题吗？或许还没有。该公司自己在文章中承认了这一点：“语言模型的判断容易受到在训练过程中可能引入的不希望的偏见的影响。与任何人工智能应用一样，结果和输出需要通过保持人类参与进行仔细监控、验证和改进。”也许GPT-4的预测能力可以帮助提供比之前的平台更好的审核性能。

值得注意的是，即使是最好的人工智能也会犯错，在审核方面尤其需要记住这一点。

推荐体验

相关资讯

《免费使用GPT4的几种新方法》

Bing Chat AI现在还可以访问插件，除了能够免费使用GPT-4。您甚至可以禁用Web搜索以将其用作chatgpt。我将向您展示如何访问和使用插件： [图片] 1.访问插件转到bing .com/聊天您的对话历史记录旁边有一个新的“插件”选项卡。笔记：目前正在推出，但是您稍后可以访问它。通过单击它，您可以向下滚动以查看所有可用的插件。您可以一次激活多达3个。目前有6个： - Instacart：将食材交付到您的商店 - 皮划艇：计划旅行 -Klarna：在线比较价格 - 可抵消：餐

灵活的球场胖子 2023-11-21

OpenAI公开破解GPT-4思维的新方法，Ilya也参与了！

OpenAI研究如何破解GPT-4思维，公开超级对齐团队工作，IlyaSutskever也在作者名单之列。该研究提出了改进大规模训练稀疏自编码器的方法，并成功将GPT-4的内部表征解构为1600万个可理解的特征。由此，复杂语言模型的内部工作变得更加可理解。

量子位 2024-06-07

OpenAI 公开破解 GPT-4 思维的新方法，Ilya 也参与了

由此，复杂语言模型的内部工作变得更加可理解。我们引入了一种基于TopK激活函数的新稀疏自编码器训练技术栈，消除了特征缩减问题，并允许直接设置L0。

IT之家 2024-06-08

研究人员提出CulturePark新方法，可用于低资源文化的大模型内容审查

当前，以ChatGPT为代表的大模型，拥有来自各个文化的用户，而这些文化之间存在很大的差异。为了使来自各个文化的用户能够获得更好的使用体验，同时也推动AI的民主化，各个文化的特点都应在大模型中表达出来。然而，当前大多数西方国家的大模型都存在文化偏见的问题，它们所反映的观点更倾向于美国的观点，而忽略了其他文化。

DeepTech深科技 2024-07-30

ChatGPT国内能用吗？分享：国内使用chatGPT的新方法

第一部分：ChatGPT国内能用吗？目前，OpenAI公司尚未对中国国内开放使用，因此国内的用户是无法直接访问和使用chatgpt官网的。这个限制涉及到多种原因，包括政策法规、技术限制以及市场策略等。鉴于这些复杂的因素，小编猜测OpenAI在短期内可能不会对国内开放其服务。一些国内用户可能会考虑通过网络工具来访问OpenAI的服务，但小编非常不建议这样做，因为这有可能涉及到法律风险。根据中国的相关法规，使用VPN等工具访问受限制的网站可能违反网络安全法。虽然无法直接访问chatGPT官网，但这并不意

ChatGPT OpenAI 法律

牛了真牛 2024-06-25

近期资讯

指挥Cursor制作Threejs粒子圣诞树🎄

这是一个使用 Three.js 和 GLSL 着色器实现的 3D 圣诞树动画效果。项目包含了由彩色粒子构成的旋转圣诞树、树顶闪耀的星星模型及其环绕粒子、满天星效果（Cursor帮忙写的）

小狸licwit 2024-12-26

JavaScript模块化深入解析：掌握Import、Export与Require的艺术

在JavaScript的世界里，模块化编程是提高代码可维护性和复用性的重要手段。JavaScript提供了多种方式来导入和导出模块，其中最常用的有ES6的import和export语句，以及Node.

浮游本尊 2024-12-26

鸿蒙Next开发【HttpRequest 网络请求封装】

上面的文章主要介绍了对 htpp 官方库的封装，不需要引入第三方请求库，基本能满足大多数应用的开发，当然也有设计不足的地方，请见谅

抠键盘养你 2024-12-26

破解pyfuck代码的背后：如何掌握Python的命名空间与作用域

引言昨天偶然间看到一个代码混淆技巧，研究了一下，挺有意思的，分享给大家。 jsfuck 说到 jsfuck，做爬虫的小伙伴应该都听说过，还是挺有意思的一种混淆方案，只是表面效果拉满，实际效果不太行，

LLLibra146 2024-12-26

THREE.JS实现3D地球

一、THREE.js简介 Three.js是一个基于WebGL的开源JavaScript库，由Ricardo Cabello（也称为Mr.doob）于2010年创建。在Three.js中，创建3D场

坐镇指挥 2024-12-26

JVM实战—2.JVM内存设置与对象分配流转

大纲1.JVM内存划分的原理细节 2.对象在JVM内存中如何分配如何流转 3.部署线上系统时如何设置JVM内存大小 4.如何设置JVM堆内存大小 5.如何设置JVM栈内存与永久代大小 6.问题

东阳马生架构 2024-12-26

绑定k8s中的PVC和PV

my-pvc.yml my-pv.yml 在 Kubernetes 中，PersistentVolumeClaim (PVC) 和 PersistentVolume (PV) 通常是自动绑定的，前提是

扬光 2024-12-26

js控制文字溢出显示省略号

依赖于jQuery（不推荐）使用jQuery和jQuery.ellipsis.js来解决 jQuery的代码各位可以百度,这里提供一个CDN地址: https://cdnjs.cloudflare.

萧寂173 2024-12-26

uniapp的app与webview的通讯及踩坑记录

由于需要在uniapp开发的app项目中集成游戏，网上查询一些集成的资料得知可以通过webview间接集成，所以就需要学习uniapp项目与webview的通讯

打一拳十块 2024-12-26

vue 移动端 + Pc 端实现监听软键盘弹出收起 hooks

随着移动设备的普及和屏幕尺寸的多样化，开发者需要确保网站或应用在不同设备上都能提供一致且流畅的交互体验。其中一个常被忽视的细节是软键盘的交互。

WayneX 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1