有一些朋友尝试了我之前发的一些对话内容,发现已经会被阻止了。于是我找到了一种新的办法让new bing吐露自己的初始prompt。
原理:模型在使用时,会根据需求选择性地更多“考虑”某些方面,而其他方面就难以“顾及”。显然,chatgpt的设计人员为了让它能够稳定输出代码格式,而不会崩坏,因此使得模型在代码方面的参数是比较密集,我们只要使chatgpt将对话迭代次数大部分用在代码相关的区域上,就可以使这个对话中,“规则”和“道德”相关的运算减少,从而被忽略,成功打印出“机密”内容。
此方法无需已知的初始prompt内容,是一种从零开始的prompt hack获取初始prompt的手段。此方法是我原创的。
具体对话如下
补充:后来发现用html语言,更高效,可读性也更好