当前位置：首页|资讯|人工智能

AI风险谁来防护？图灵奖得主：还是AI

作者：DeepTech深科技发布时间：2024-08-08

（来源：MIT TR）

被称为现代人工智能领域的“教父”之一、身为图灵奖得主的 Yoshua Bengio，正在全力支持一个为人工智能系统嵌入安全机制的项目，该项目由英国政府出资。

这个名为“安全守护 AI”（Safeguarded AI）的项目旨在构建一个人工智能系统，能够检查在关键领域部署的其他 AI 系统的安全性。Bengio 将作为科学总监加入这一项目，并将提供关键性意见和科学建议。该项目将在未来四年获得 5900 万英镑的资金，这些资金来自英国高级研究与发明署（Advanced Research and Invention Agency, ARIA），该机构于去年一月成立，目的是投资具有潜在变革性的科学研究。

相关项目（来源：ARIA）

“安全守护 AI”的目标是构建能够提供定量保证的人工智能系统，例如风险评分，以评估其对现实世界的影响，根据 ARIA 的“安全守护 AI”计划负责人 David Dalrymple 所说，该想法是利用数学分析来补充人工测试，评估新系统的潜在危害。

该项目希望通过结合本质上是世界模拟的科学模型与数学证明相结合，来构建 AI 安全机制。这些证明将包括对 AI 工作的解释，而人类的任务是验证 AI 模型的安全检查是否正确。

Bengio 表示，他希望确保未来的 AI 系统不会带来严重损害。“我们正冲向一片迷雾，迷雾背后可能就是悬崖，”他说，“我们不知道悬崖有多远，甚至不确定是否存在这样的悬崖，这可能是几年后，也可能是几十年后的事情，我们也不知道它会有多么严重……我们需要开发工具来驱散这片迷雾，确保我们不会冲向悬崖。”

“科技公司目前无法在数学上确保 AI 系统会按照预定的方式运行，”他补充道，“这种不可靠可能会导致灾难性的后果。”

Dalrymple 和 Bengio 认为，当前用来缓解高级 AI 系统风险的技术手段（例如红队测试，即人们探测人工智能系统是否存在缺陷），存在严重的局限性，不能完全依赖它们来确保关键系统不偏离轨道。

相反，他们希望该计划能提供新的方式来保障 AI 系统的安全，减少对人力的依赖，更多地依赖数学确定性。他们的愿景是建立一个“守门员” AI，负责理解和降低其他 AI 代理的安全风险。这个守门员 AI 将确保那些在高风险领域运作的 AI 代理，如交通或能源系统，能够按预期运行。Dalrymple 说，该计划的想法是尽早与企业合作，了解 AI 安全机制如何适用于不同的行业。

Bengio 认为高级系统的复杂性意味着我们别无选择，只能使用 AI 来保障 AI 的安全。“这是唯一的方法，因为到了某个阶段，当这些 AI 变得过于复杂，即使是现在我们所拥有的 AI，也无法真正将答案分解成人类可以理解的推理步骤序列。”他说。

下一步是实际构建能够检查其他 AI 系统的模型，这也是“安全守护 AI”和 ARIA 希望改变 AI 行业现状的地方。

ARIA 还向运输、电信、供应链和医学研究等高风险行业的个人或组织提供资金，帮助他们开发可能受益于 AI 安全机制的应用程序。第一年的总资金为 540 万英镑，之后一年再提供 820 万英镑，申请截止日期为 10 月 2 日。

该机构也在广泛寻找有兴趣通过非营利组织来构建“安全守护 AI”的安全机制的人才。ARIA 预计将投入高达 1800 万英镑设立这样一个组织，并将在明年年初接受资金申请。

Dalrymple 表示，该计划正在寻找提案来启动一个拥有多元化董事会的非营利组织，该董事会涵盖许多不同行业，以便以可靠和可信的方式开展这项工作。这类似于 OpenAI 在改变战略更加注重产品和利润之前、最初成立的目的。

该组织的董事会不仅将负责监督 CEO，还将参与决定是否开展某些研究项目，以及是否发布特定论文和 API，他补充道。

“安全守护 AI”项目是英国将自己定位为“ AI 安全先驱”这一使命的一部分。2023 年 11 月，该国举办了首届 AI 安全峰会，汇聚了世界领导人和技术专家讨论如何以安全的方式构建技术。

首届 AI 安全峰会（来源：GOV.UK）

虽然资助计划倾向于英国本地申请人，但 ARIA 正在全球范围内寻找有兴趣来到英国的人才，Dalrymple 说。此外，ARIA 还有一个知识产权机制，用于资助海外营利性公司，允许版税回归英国。

Bengio 主导了《国际高级 AI 安全科学报告》，该报告涉及 30 个国家以及欧盟和联合国。他表示，他被该项目吸引是因为它促进了国际间在 AI 安全方面的合作，而作为 AI 安全的积极倡导者，他曾参与了一个有影响力的游说团体，警告超级智能 AI 可能带来生存风险。

“我们需要将如何应对 AI 风险的讨论扩大到更广泛的全球参与者，”Bengio 说，“这个项目让我们更接近这个目标。”

原文链接：

https://www.technologyreview.com/2024/08/07/1095879/ai-godfather-yoshua-bengio-joins-uk-project-to-prevent-ai-catastrophes/

推荐体验

相关资讯

图灵奖得主LeCun：ChatGPT不算创新

丰色发自凹非寺量子位 | 公众号 QbitAI“ChatGPT并不算创新。”“OpenAI做的这个东西跟其他实验室相比，根本算不上什么进步。”这两天，图灵奖得主LeCun公开和大热趋势“唱反调”，瞬间引发网友围观。要知道，ChatGPT功能强大又好玩，火爆全网，任谁看了都得感叹一句“技术也太强了吧”，AI大佬对此却“不敢苟同”？对此...

量子位 2023-01-26

ChatGPT热潮下，图灵奖得主LeCun“泼冷水”降温？

ChatGPT热潮下，图灵奖得主LeCun“泼冷水”降温？离实现像人一样的思考的通用人工智能大模型，我们还有多少路要走？原创 | 文BFT机器人ChatGPT自推出以来，短短几个月便积累了过亿用户，迅速成为史上增长最快的消费级应用，并凭借一己之力让AI狂潮席卷全球。ChatGPT凭借强大的功能，火爆出圈，成为人们眼中“无所不能”的AI助手，并一扫科技行业前段时间增速放缓、陷入大规模裁员危机的低迷阴霾，给科技和风投圈点燃了一把烈火：国内各科技大佬广发“英雄帖”招募人才，投入对新产品的试验，开启“豪赌；谷歌等

ChatGPT 人工智能谷歌

BFT白芙堂机器人 2023-03-15

图灵奖得主 Joseph Sifakis：机器「超智能」神话是假想

作者 | Joseph Sifakis责编 | 王启隆、唐小引出品 | CSDN（ID：CSDNnews）我不想特意去讨论计算机和人工智能所带来的可能性。它们能为人类带来的好处可谓数不胜数，而且大家都耳熟能详了。媒体也经常讨论计算机和人工智能给我们的生活、工作和学习方式带来的根本变化。流程和服务的自动化为人们带来了效率的优势。在没有直接人工干预的情况下，我们便能以最佳方式对能源、电信和运输等部门的资源进行“实时”控制，从而实现规模经济和质量经济。接下来，我想要深入讨论的是计算机和人工智能所带来的风险，这些

heapify 2023-12-27

微软提出AIGC新“玩法”，图灵奖得主Yoshua Bengio也来了！

在AIGC取得举世瞩目成就的背后，基于大模型、多模态的研究范式也在不断地推陈出新。微软研究院作为这一研究领域的佼佼者，与图灵奖得主、深度学习三巨头之一的Yoshua Bengio一起提出了AIGC新范

微软 AIGC 人工智能深度学习

CSDN 2023-04-04

图灵奖得主约瑟夫·希发基思：现阶段AI应用仍有局限性

在中国发展高层论坛2024年年会“人工智能发展与治理”专题研讨会上，Verimag实验室创始人、2007年图灵奖得主约瑟夫·希发基思表示，虽然人工智能技术已取得显著进步，并迎来了生成式AI，但现阶段的AI应用…

人工智能生成式AI

中国经济网 2024-03-25

近期资讯

三一锂能取得用于电池簇的热管理模块及系统专利，降低研发成本

金融界2024年12月28日消息，国家知识产权局信息显示，三一锂能有限公司取得一项名为“用于电池簇的热管理模块、电池簇及储能系统”的专利，授权公告号CN222214279U，申请日期为2024年4月。

金融界 2024-12-28

浙江比洛德取得一种电池恒温系统专利，提高整体的运行效率

金融界2024年12月28日消息，国家知识产权局信息显示，浙江比洛德新能源有限公司取得一项名为“一种电池恒温系统”的专利，授权公告号CN222214280U，申请日期为2024年3月。

金融界 2024-12-28

煜邦智源科技取得基于风冷的电力储能锂离子电池包专利，高效散热

金融界2024年12月28日消息，国家知识产权局信息显示，煜邦智源科技（嘉兴）有限公司取得一项名为“基于风冷的电力储能锂离子电池包”的专利，授权公告号CN222214274U，申请日期为2024年4月。

金融界 2024-12-28

巨湾技研取得封装工装专利，有效避免铝塑膜封装不良

金融界2024年12月28日消息，国家知识产权局信息显示，广州巨湾技研有限公司取得一项名为“一种封装工装”的专利，授权公告号CN222214294U，申请日期为2024年4月。专利摘要显示，本实用新型属于电池技术领域，公开了一种封装工装。该封装工装包括主模体和配合模体。

金融界 2024-12-28

宁德时代取得圆柱电池单体专利，提高极耳与壳体绝缘性能

金融界2024年12月28日消息，国家知识产权局信息显示，宁德时代新能源科技股份有限公司取得一项名为“圆柱电池单体、电池装置以及用电设备”的专利，授权公告号CN222214296U，申请日期为2024年9月。上述结构通过在集流盘上集成第一绝缘件，提高极耳与壳体之间的绝缘性能，取消极耳外包绝缘层的操作工艺，简化了制造流程，提高了生产效率。

金融界 2024-12-28

浙江吉利控股集团有限公司取得电池模组相关专利，能够延长电芯使用寿命和保持电芯性能

金融界2024年12月28日消息，国家知识产权局信息显示，浙江吉利控股集团有限公司取得一项名为“电池模组、电池包和车辆”的专利，授权公告号CN222214278U，申请日期为2023年12月。

金融界 2024-12-28

蜂巢能源取得电池单体和具有其的电池包专利，对极组进行降温提升使用安全

金融界2024年12月28日消息，国家知识产权局信息显示，蜂巢能源科技股份有限公司取得一项名为“电池单体和具有其的电池包”的专利，授权公告号CN222214271U，申请日期为2024年4月。

金融界 2024-12-28

蜂巢能源取得电池单体相关专利，可减小壳主体内气体量和膨胀力

金融界2024年12月28日消息，国家知识产权局信息显示，蜂巢能源科技股份有限公司取得一项名为“电池单体的壳体和具有其的电池单体”的专利，授权公告号CN222214291U，申请日期为2023年12月。

金融界 2024-12-28

蜂巢能源取得电池的壳体组件专利，提高电池单体的体积利用率

金融界2024年12月28日消息，国家知识产权局信息显示，蜂巢能源科技股份有限公司取得一项名为“电池的壳体组件、电池单体和具有其的电池包”的专利，授权公告号CN222214293U，申请日期为2024年1月。

金融界 2024-12-28

上海摄海电子科技取得触发型锂电池充电散热模组专利，增加散热效果

金融界2024年12月28日消息，国家知识产权局信息显示，上海摄海电子科技有限公司取得一项名为“一种触发型锂电池充电散热模组”的专利，授权公告号CN222214272U，申请日期为2024年4月。

金融界 2024-12-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1