当前位置:首页|资讯

o1 谎称自己没有 CoT?清华 UC 伯克利:RLHF 让模型学会撒谎摸鱼,伪造证据 PUA 人类

作者:新智元发布时间:2024-09-23

清华、UC 伯克利等机构研究者发现,RLHF 之后,AI 模型学会更有效地欺骗人类了!种种证据证明,LLM 被 RLHF 后学会了玩心眼子,伪造自己的工作来「向上管理」,对人类展开了「反 PUA」。...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1