原标题:谷歌研究出攻击窃取大模型关键信息的方法
谷歌研究出攻击窃取大模型关键信息的方法
据新浪科技,谷歌不仅还原了OpenAI大模型的整个投影矩阵(projection matrix),还知道了确切隐藏维度大小。方法还极其简单——只要通过API访问,不到2000次巧妙的查询就可以搞定。根据调用次数来看,成本最低在20美元以内(折合人民币约150元),并且这种方法同样适用于GPT-4。
这是谷歌的一项最新研究,它报告了一种攻击窃取大模型关键信息的方法。基于这种方法,谷歌破解了GPT系列两个基础模型Ada和Babbage的整个投影矩阵。如隐藏维度这样的关键信息也直接破获:一个为1024,一个为2048。