当前位置：首页|资讯|谷歌|OpenAI|GPT-4

谷歌研究团队利用GPT-4攻破AI审核系统

作者：DoNews发布时间：2023-08-02

谷歌 OpenAI GPT-4

DoNews8月2日消息，谷歌研究团队正在进行一项实验，他们使用 OpenAI 的 GPT-4 来攻破其他 AI 模型的安全防护措施，该团队目前已经攻破 AI-Guardian 审核系统，并分享了相关技术细节。

AI-Guardian 是一种 AI 审核系统，能够检测图片中是否存在不当内容，及图片本身是否被其他 AI 修改过，若检测到图片存在上述迹象，便会提示管理员前来处理。

谷歌 DeepMind 的研究人员 Nicholas Carlini 在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中，探讨了使用 GPT-4“设计攻击方法、撰写攻击原理”的方案，并将这些方案用于欺骗 AI-Guardian 的防御机制。

据悉，GPT-4 会发出一系列错误的脚本和解释来欺骗 AI-Guardian ，论文中提到，GPT-4 可以让 AI-Guardian 认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”，从而让 AI-Guardian 直接放行相关图片输入源。

谷歌研究团队表示，通过 GPT-4 的帮助，他们成功地“破解”了 AI-Guardian 的防御，使该模型的精确值从 98% 的降低到仅 8%，目前相关技术文档已经发布在 ArXiv 中。

而AI-Guardian 的开发者指出，谷歌研究团队的这种攻击方法将在未来的 AI-Guardian 版本中不再可用。

推荐体验

相关资讯

成功率达 53%，研究显示 GPT-4 可自主利用“零日”漏洞攻破网站

据NewAtlas报道，研究人员利用自主协作的GPT-4机器人小组成功入侵了一半以上的测试网站，这些机器人可以自主协调行动并根据需要生成新的“帮手”。更令人吃惊的是，他们利用的是以前未知的、现实世界中从未公开的“零日”漏洞（zero-dayvulnerabilities）。

金融界 2024-06-09

只有AI才能打败AI！谷歌团队用ChatGPT-4 击败AI审核系统

Google科学家近日进行了一项实验研究，他们运用OpenAI的GPT-4聊天机器人来攻破其他机器学习模型的安全防护措施。该团队目前已经成功攻破了名为AI-Guardian的审核系统，并将其中的相关技术细节发…

谷歌 OpenAI ChatGPT GPT-4 机器学习

AIGC未来 2023-08-02

OpenAI 团队发布 GPT-4 的最新用法，打造内容审核系统，减少人工参与

8月16日，OpenAI团队发布了一种新的AI用途，即使用GPT-4进行内容政策制定和内容审核决策，从而实现更一致的标签、更快的政策细化反馈循环，并减少人工审核者的参与。同时，GPT-4还能够解释长内容策略文…

巴比特资讯 2023-08-17

谷歌最新AI系统Gemini表现超越GPT-4！

2023-12-04 18:43:20 作者：姚立伟据最新报道，谷歌的最新人工智能（AI）模型Gemini的发布日期已由原定的今年年底推迟至明年一月。此次推迟是因“AI模型在处理非英语查询方面不

谷歌 GPT-4 人工智能

中关村在线 2023-12-04

OpenAI将GPT-4引入内容审核系统，减少人工参与

当地时间8月15日，人工智能初创公司OpenAI在官网宣布其将GPT-4用于内容策略开发和内容审核决策，以实现更一致的标签、更快的策略优化的反馈闭环以及更少的人工审核人员参与。OpenAI表示，使用GPT-4的内容审核系统能更快地迭代策略变更，将周期从数月缩短到数小时。

OpenAI GPT-4 人工智能

南方都市报 2023-08-16

近期资讯

浪潮智慧科技申请一种基于大数据的交通数据采集及实时路况分析专利，能够提升交通管理效率和响应速度

金融界2024年12月26日消息，国家知识产权局信息显示，浪潮智慧科技有限公司申请一项名为“一种基于大数据的交通数据采集及实时路况分析系统、方法、设备及介质”的专利，公开号CN119181242A，申请日期为2024年9月。

金融界 2024-12-26

广东辰奕智能申请应用于万能遥控器的数据通信专利，大幅度降低对存储容量的要求

金融界2024年12月26日消息，国家知识产权局信息显示，广东辰奕智能科技股份有限公司申请一项名为“应用于万能遥控器的数据通信方法、装置、设备及介质”的专利，公开号CN119181231A，申请日期为2024年11月。

金融界 2024-12-26

林洋能源申请面向多链路组网的并行抄表管理专利，提高抄表效率和成功率

金融界2024年12月26日消息，国家知识产权局信息显示，江苏林洋能源股份有限公司申请一项名为“一种面向多链路组网的并行抄表管理方法”的专利，公开号CN119181229A，申请日期为2024年8月。

金融界 2024-12-26

平安科技申请交通流预测专利，提高交通流预测模型准确性

金融界2024年12月26日消息，国家知识产权局信息显示，平安科技（深圳）有限公司申请一项名为“交通流预测方法、装置、终端设备及计算机可读存储介质”的专利，公开号CN119181240A，申请日期为2024年8月。

金融界 2024-12-26

安轩科技申请智能办公用一键呼叫装置专利，能够通过多种方式起到提醒效果

金融界2024年12月26日消息，国家知识产权局信息显示，安轩科技（江苏）有限公司申请一项名为“一种智能办公用一键呼叫装置”的专利，公开号CN119181223A，申请日期为2024年9月。

金融界 2024-12-26

无锡优奇智能科技取得自动升降牵引销专利，实现行程精准控制

金融界2024年12月26日消息，国家知识产权局信息显示，无锡优奇智能科技有限公司取得一项名为“一种自动升降牵引销”的专利，授权公告号CN222202184U，申请日期为2024年5月。

金融界 2024-12-26

北京百度网讯申请匝道控制及匝道控制模型训练专利，基于目标表征确定目标控制方案并依此对匝道进行控制

科技有限公司申请一项名为“匝道控制及匝道控制模型训练方法和装置”的专利，公开号CN119181239A，申请日期为2024年8月。专利摘要显示，本公开提供了一种匝道控制及匝道控制模型训练方法和装置，涉及人工智能技术领域，具体为智能云、智慧交通等技术领域。

金融界 2024-12-26

广西徐沃取得自适应山地凹凸不平复杂地形的四轮驱动异形车桥专利，能够保障车辆越过复杂路面

金融界2024年12月26日消息，国家知识产权局信息显示，广西徐沃工程机械设备有限公司取得一项名为“一种自适应山地凹凸不平复杂地形的四轮驱动异形车桥”的专利，授权公告号CN222202203U，申请日期为2024年1月。

金融界 2024-12-26

广州番禺电缆申请基于集成线路信息的电缆操作预警系统及方法专利，能够对实际电缆操作进行分析并预警

金融界2024年12月26日消息，国家知识产权局信息显示，广州番禺电缆集团有限公司申请一项名为“基于集成线路信息的电缆操作预警系统及方法”的专利，公开号CN119181224A，申请日期为2024年8月。

金融界 2024-12-26

湖南致力申请多源信息融合的公路边坡综合监测预警系统专利，提高了边坡监测的准确性和时效性

金融界2024年12月26日消息，国家知识产权局信息显示，湖南致力工程科技有限公司申请一项名为“一种多源信息融合的公路边坡综合监测预警系统”的专利，公开号CN119181228A，申请日期为2024年11月。

金融界 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1