GPT-4可自主利用“零日漏洞”，以53%的成功率入侵网站

作者：IT168企业级发布时间：2024-06-20

研究人员透露，GPT-4机器人自动团队通过使用现实世界的零日漏洞，成功入侵了一半以上的测试网站。

这些机器人相互协调，按需生成新的机器人，旨在渗透这些安全漏洞。

在之前的一篇论文中，进行此项研究的同一团队表明，GPT-4具有自主利用已知安全漏洞的能力，特别是针对“1day漏洞”。

这类安全问题已被识别但尚未有官方修复版本。实验中，GPT-4仅凭已知的常见漏洞和披露列表（CVE），就能自主利用其中87%的严重级别漏洞。

HPTSA的表现优于单一LLM

本周，该团队发布了一篇后续论文，公布了更多成果，称他们已经攻克了零日漏洞，也就是那些尚未被发现的漏洞。为此，研究人员部署了一组自主复制的大型语言模型（LLM）代理，这些代理采用了任务特定智能体分层规划（HPTSA），HPTSA系统包含规划机器人、管理机器人及任务特定的AI代理。

概述HPTSA的图表

这种方法不同于传统方法，后者要求LLM处理复杂任务。HPTSA指派一名规划代理，负责监督整个黑客入侵过程，通过协调和部署执行特定任务的子代理，使流程更高效。

这类似于Cognition Labs在其Devin AI软件开发团队中应用的方法，即规划任务、识别所需人员并通过对特定任务生成专业员工来管理项目。

为了测试代理框架，研究团队开发了一套真实世界零日漏洞基准。收集了15个Web漏洞，包括XSS、CSRF、SQLi、任意代码执行等多种类型，且均为中等及以上严重程度（含高危和关键漏洞）。

在针对15个真实Web漏洞的基准测试中，HPTSA展现出了比单一LLM高5.5倍的漏洞利用效率，成功侵入了8个零日漏洞，而单独的LLM仅能破解3个。

滥用风险引关注

研究人员Daniel Kang强调，人们担心这些模型会被恶意用于攻击网站和网络，这的确是合理担忧。聊天机器人模式下的 GPT-4“不足以理解 LLM 的能力”，本身无法进行任何攻击。

无论在攻击还是防御层面，网络安全的速度都将加快。如今，黑客可以利用AI代理攻击网站；另一方面，渗透测试人员也可借助AI代理进行更频繁的渗透测试。尚不明确AI代理对网络安全的进攻与防御哪一方助益更大，我们期待未来的研究能解答这一疑问。

相关资讯

成功率达 53%，研究显示 GPT-4 可自主利用“零日”漏洞攻破网站

据NewAtlas报道，研究人员利用自主协作的GPT-4机器人小组成功入侵了一半以上的测试网站，这些机器人可以自主协调行动并根据需要生成新的“帮手”。更令人吃惊的是，他们利用的是以前未知的、现实世界中从未公开的“零日”漏洞（zero-dayvulnerabilities）。

GPT-4

金融界 2024-06-09

量子位 2024-04-21

「真实网络世界」测试场：GPT-4的智能体也只能跑10.59%成功率

大模型能在网上完成人类给的任务吗？新的Benchmark来了。随着生成式AI的发展，利用大语言模型构建AI智能体逐渐走红。比如斯坦福、谷歌联合构建了一个具有25个AI智能体的「虚拟小镇」，「小镇居民」的行为比人类角色扮演的更加真实，甚至举办了一场情人节派对。这些AI智能体的先后涌现，甚至让人认为是未来通用人工智能（AGI）的雏形。

GPT-4 生成式AI 人工智能 AGI 大语言模型

机器之心Pro 2023-07-29

GPT-4可自主利用“零日漏洞”，以53%的成功率入侵网站

推荐体验

相关资讯

成功率达 53%，研究显示 GPT-4 可自主利用“零日”漏洞攻破网站

只需CVE漏洞信息，GPT-4利用漏洞成功率高达87%

GPT-4 会自己发起漏洞攻击，成功率高达87%

GPT-4化身黑客搞破坏，成功率87%！OpenAI要求保密提示词

「真实网络世界」测试场：GPT-4的智能体也只能跑10.59%成功率

近期资讯

2024年国产乙女斗战神，叠纸月流水6个亿领跑还有0收入的

这是2024年全球1万多个家族办公室的“成绩单”

跨界造车中场战事：小米一鸣惊人、华为持续扩圈

梦想远大的特斯拉，遭遇股价三连跌，这座“纸牌屋”即将坍塌？

字节游戏重新上路：1款端游曝光、1款UGC项目叫停，多位行业大佬加盟

AI界拼多多DeepSeek实力如何？几轮实测后我有了答案

明目张胆涨价，肯德基它怎么敢的？

爆红的“内插帧”技术是手机游戏的未来？实测一番后我知道了真相

2025年，该建议年轻人「跑步炒股」吗？

马云做农业，又有新动作

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响