今天分享的是【OpenAI+风险预防框架(Bbeta)】
我们的备灾框架包含五个关键要素
1.通过评估跟踪灾难风险水平。我们将沿着几个跟踪风险类别建立并不断改进评估套件和其他监控解决方案,并在记分卡中显示我们当前的缓解前和缓解后风险水平。重要的是,我们还将预测风险的未来发展,以便我们能够制定安全和安保措施的筹备时间。
2寻找未知。我们将持续运行一个识别和分析 (以及跟踪)目前未知类别的灾难性风险的过程,因为他们出现。
3.建立安全基线。只有减灾后得分为“中等”或以下的模型才能部署,只有减灾后得分为“高”或以下的模型才能进一步开发(定义见下面跟踪的风险类别)。此外,我们将确保Security针对任何具有“高”或“临界”风险等级(如以下记分卡所定义)的模型进行适当调整,以防止模型泄露。我们还建立了程序化的承诺(如下面的治理中所定义的),进一步详细说明了我们如何操作准备框架所概述的所有活动。
4.让备灾团队进行实地工作。备灾小组将推动备灾框架的技术工作和维护。这包括对风险进行研究、评估、监测和预测,并通过定期向安全咨询小组提交报告来综合这些工作。这些报告将包括最新证据的摘要,并就OpenAl提前规划所需的更改提出建议。准备小组还将召集相关小组(例如,安全系统、保安、超级校准、政策研究)并与之协调,以整理建议的缓解措施,并将其纳入这些报告。此外,准备还将管理安全演习,并与TrustworthyAl团队协调进行第三方审计。
5建立一个跨职能的咨询机构。我们正在创建一个安全咨询小组(SAG),汇集了来自整个公司的专业知识,以帮助OpenAl的领导层和董事会为他们需要做出的安全决策做好最好的准备。因此,SAG的职责将包括监督对风险状况的评估,并维持处理紧急情况的快速流程。
免责声明:以上报告均系本平台通过公开、合法渠道获得,报告版权归原撰写/发布机构所有,如涉侵权,请联系删除 ;资料为推荐阅读,仅供参考学习,如对内容存疑,请与原撰写/发布机构联系