微软报告称 GPT-4 易受“越狱”提示词影响，生成不良内容

作者：IT之家发布时间：2023-10-18

微软 GPT-4 提示词大语言模型

微软报告称 GPT-4 易受“越狱”提示词影响，生成不良内容

IT之家 10 月 18 日消息，微软旗下研究团队近日发表论文，详细研究了大型语言模型 (LLM) 的“可信度”和潜在毒性，特别关注 OpenAI 的 GPT-4 及其前代 GPT-3.5。

研究团队，GPT-4 虽然在标准基准测试中比 GPT-3.5 更加可靠，但容易受到“越狱”提示（绕过模型安全措施）影响。GPT-4 可能会根据这些“越狱”提示，生成有害内容。

论文中强调 GPT-4 更容易受到恶意“越狱”系统或用户提示影响，会准确地遵循（误导性）指令，生成不良内容，微软强调这个潜在漏洞不会影响当前面向客户的服务。

IT之家在此附上微软官方论文地址，感兴趣的用户可以深入阅读。

相关资讯

微软称下周推出GPT-4，或可生成视频

三言科技消息近日，微软德国CTO在活动中透露，GPT-4将在下周发布，将提供多模态模型。其技术总监Andreas Braun表示，有了GPT-4，AI就有可能生成文本、图像甚至视频。而此前版本的ChatGPT只能够生成文本。...

微软 GPT-4 ChatGPT

三言科技 2023-03-10

占比 44%，报告称 OpenAI 的 GPT-4 充斥大量版权内容

占比 44%，报告称 OpenAI 的 GPT-4 充斥大量版权内容 IT之家 3 月 8 日消息，根据 Patronus AI 近日发表的最新报告，OpenAI 的 GPT-4 模型中包含大量

OpenAI GPT-4

IT之家 2024-03-08

可骇客“越狱” GPT-4潜在毒性令人担忧微软官方发声

近日，微软的研究团队发布了一篇论文，详细探讨了大型语言模型（LLM）的“可信度”和潜在毒性问题。论文指出，尽管在标准基准测试中，GPT-4相比GPT-3.5更加可靠，但该模型却容易受到“越狱”提示的影响。这种情况下，GPT-4可能会根据这些“越狱”提示来生成有害内容。

GPT-4 微软大语言模型

中关村在线 2023-10-18

占比 44%，报告称 OpenAI 的 GPT-4 充斥大量版权内容 | 懂点AI

占比 44%，报告称 OpenAI 的 GPT-4 充斥大量版权内容懂点AI 文｜动点科技排版｜郭晋文本文预计阅读时长4分钟 01 印度宣布向 AI 领域投资 1037 亿卢

OpenAI GPT-4 融资

动点科技 2024-03-08

GPT-4“越狱”计划曝光引诱人类帮助

GPT-4 斯坦福

中国网科技 2023-03-20

近期资讯

Linux/mac 网站部署（Https 开发环境）

安装基本软件访问 https://lnmp.org/download.html 安装nginx 安装mysql 安装redis 配置nginx 修改默认配置（未优化版本）

漠刀绝尘 2024-12-26

你可能不知道的布局偏移（Layout Shift）

在网页性能优化中，布局偏移（layout shifts）是一个重要的考量指标，特别是对于图片。图片加载时未预留足够空间可能会导致页面内容上下跳动，直接影响用户体验和页面的 Cumulative La

ErpanOmer 2024-12-25

Solid.js 最新官方文档翻译（10）—— Portal 与错误边界

Solid.js，一个比 React 更 react 的框架。每一个使用 React 的同学，你可以不使用，但不应该不了解。我同时搭建了 Solid.js 最新的中文文档站点：https://soli

冴羽 2024-12-26

从零实现Vue响应系统（二、computed与watch）

接着上一篇的 Vue 响应系统实现，主要讲了一下调度执行、computed 和 watch 这两个 API 的底层实现。

non_hana 2024-12-25

深入剖析Redis之CAP理论：原理、权衡与实战应用

一、引言：Redis 在分布式系统中的关键地位在当今数字化时代，分布式系统已成为构建大规模、高性能应用的基石。

J2K 2024-12-26

Redis分布式锁

1、redis分布式锁如何实现使用redis的setnx，结果成功就代表加锁成功，失败就代表加锁失败 2、redis分布式锁可能遇到的问题上面实现了加锁，但是在业务中如果出现异常，将会导致加锁失败

用户23567114612 2024-12-26

从零实现Vue响应系统（一、概念与基础架构）

本文是《Vue 设计与实现》一书的阅读笔记，包括原文的部分摘抄以及本人的总结，尽可能用自己的理解描述一遍，并附上完整的实现代码，主要描述了 Vue 响应式系统的底层架构。

non_hana 2024-12-25

JAVA反序列化漏洞

Java反序列化漏洞 1.序列化与反序列化概述序列化(Serialization)是将对象的状态信息转换为可以存储或传输的形式过程。对象转换为字节流，以便可以将其保存到磁盘上或通过网络传输到另一个网

帆船 2024-12-25

Python入门必读：💡从零到自动化，一次搞懂80%的实用技能🚀

为什么是80%？ Python是目前最火的编程语言之一，能用来做数据分析、爬虫、机器学习、Web开发等各种 “酷炫” 活儿。但，80%的日常需求，只需要掌握Python的一些核心技能，就能轻松搞定

花小姐的春天 2024-12-25

Bogus：.NET的假数据生成利器

我们在项目开发中，为了保证系统功能完整、准确性，我们都需要模拟真实数据进行测试。今天推荐一个开源库，方便我们制造假数据测试。 01 项目简介 Bogus 是一个开源的 .NET 库，它提供了一个强大

编程乐趣 2024-12-26

微软报告称 GPT-4 易受“越狱”提示词影响，生成不良内容

微软报告称 GPT-4 易受“越狱”提示词影响，生成不良内容

推荐体验

相关资讯

微软称下周推出GPT-4，或可生成视频

占比 44%，报告称 OpenAI 的 GPT-4 充斥大量版权内容

可骇客“越狱” GPT-4潜在毒性令人担忧微软官方发声

占比 44%，报告称 OpenAI 的 GPT-4 充斥大量版权内容 | 懂点AI

GPT-4“越狱”计划曝光引诱人类帮助

近期资讯

Linux/mac 网站部署（Https 开发环境）

你可能不知道的布局偏移（Layout Shift）

Solid.js 最新官方文档翻译（10）—— Portal 与错误边界

从零实现Vue响应系统（二、computed与watch）

深入剖析Redis之CAP理论：原理、权衡与实战应用

Redis分布式锁

从零实现Vue响应系统（一、概念与基础架构）

JAVA反序列化漏洞

Python入门必读：💡从零到自动化，一次搞懂80%的实用技能🚀

Bogus：.NET的假数据生成利器

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响