随着 ChatGPT 的发布,大型语言模型应用正在加速大范围铺开。OpenAI 的安全系统团队已经投入了大量资源,研究如何在对齐过程中为模型构建默认的安全行为。但是,对抗攻击或 prompt 越狱依然...【查看原文】
选自Lil’Log作者:LilianWeng机器之心编译编辑:PandaLLM能力强大,倘若别有用心之人用其来干坏事,可能会造成难以预料的严重后果。虽然大多数商用和开源LLM都存在一定的内置安全机制,但却并不一定能防御形式各异的对抗攻击。OpenAI的安全系统团队已经投入了大量资源,研究如何在对齐过程中为模型构建默认的安全行为。
OpenAI
机器之心Pro 2023-11-20
IT之家 7 月 22 日消息,OpenAI 信任与安全负责人戴夫・威尔纳(Dave Willner)昨天在其 LinkedIn 发布动态,宣布已经离开 OpenAI 公司。威尔纳在 OpenAI
IT之家 2023-07-22
“机器学习中的对抗性攻击”是一个备受关注的话题,因为它可能会对人工智能系统的安全性和可靠性造成威胁。本文将介绍机器学习中的对抗性攻击及其威胁,并探讨一些防御方法。
人工智能机器学习
xuyuelin88117 2023-03-21
简·雷克(Jan Leike)是OpenAI安全团队的前联合负责人,专注于长期风险。雷克周二在社交媒体宣布,他将加入OpenAI的竞争对手Anthropic。 来源:金融界AI电报
OpenAI金融
金融界 2024-05-29
鞭牛士报道,5月29日消息,据外电报道,刚刚从OpenAI安全团队(专注于长期风险)离职的前联席主管JanLeike宣布将加入OpenAI人工智能竞争对手Anthropic。5月14日,OpenAI联合创始人…
OpenAI人工智能
鞭牛士 2024-05-29
金融界2024年12月28日消息,国家知识产权局信息显示,山东豪迈机械制造有限公司取得一项名为“一种压力容器筒体坡口剥离面钛残留的检验装置”的专利,授权公告号CN222212657U,申请日期为2024年1月。
金融界 2024-12-28
金融界2024年12月28日消息,国家知识产权局信息显示,济南泛华电气有限责任公司取得一项名为“一种有冲击清洗功能的绝缘油介损损耗及电阻率测试仪”的专利,授权公告号CN222212654U,申请日期为2024年11月。
金融界2024年12月28日消息,国家知识产权局信息显示,斯芮弗(无锡)科技有限公司取得一项名为“一种自清洁式COD检测装置”的专利,授权公告号CN222212607U,申请日期为2024年4月。专利摘要显示,本实用新型涉及地下水检测领域,具体为一种自清洁式COD检测装置。
金融界2024年12月28日消息,国家知识产权局信息显示,南京好世通电气有限公司取得一项名为“一种线束连接器端子用外观检测仪的自动转动结构”的专利,授权公告号CN222212637U,申请日期为2024年3月。
金融界2024年12月28日消息,国家知识产权局信息显示,合肥核约达仪表科技有限公司取得一项名为“一种新型硅酸根分析仪”的专利,授权公告号CN222212612U,申请日期为2024年4月。
金融界2024年12月28日消息,国家知识产权局信息显示,山东恒超消防技术有限公司取得一项名为“一种建筑材料检测装置”的专利,授权公告号CN222212652U,申请日期为2024年4月。
金融界2024年12月28日消息,国家知识产权局信息显示,山东中创安防科技有限公司取得一项名为“一种非接触式激光甲烷检测仪”的专利,授权公告号CN222212606U,申请日期为2024年4月。
金融界2024年12月28日消息,国家知识产权局信息显示,常州赛格电子仪器有限公司取得一项名为“一种油色谱气样注入器”的专利,授权公告号CN222212694U,申请日期为2024年4月。
金融界2024年12月28日消息,国家知识产权局信息显示,华电国际电力股份有限公司莱城发电厂取得一项名为“一种协同脱硝的新型水冷壁热流密度监测系统”的专利,授权公告号CN222212651U,申请日期为2024年4月。
金融界2024年12月28日消息,国家知识产权局信息显示,深圳市普晟传感技术有限公司取得一项名为“一种气体传感器”的专利,授权公告号CN222212656U,申请日期为2024年1月。
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1