当前,人工智能技术对科学研究变革性创新效益逐渐显现,催生一系列生物、材料、物理、化学等领域突破性研究创新,使人类社会进入新的快速发展期。美国作为人工智能强国,已将人工智能纳入政府政策管理的核心,在发展人工智能技术的同时,正全力推动人工智能对科研创新效果的提升,以期形成人工智能对科技前沿探索的最大乘数效应,保持美国未来科技优势。本文全面回顾近一段时期美国政府人工智能管理政策,从政策设计、机构管理、配套设施等不同维度分析美政府如何激发人工智能赋能科研创新的战略性举措,以期带来新的思考与启示。
一、美政府对人工智能驱动科研创新的理解
美政府在推广人工智能技术过程中对技术赋能的本质理解不断加深,既关注正向创新作用,也关注研究风险与安全,笔者分析近一段时期美国政府期间政策,总结其对人工智能促进科技创新的理解。
理解一:人工智能对科技实验的变革是颠覆性的
美总统科技顾问委员会2024年4月提出“负责任地应用人工智能,将从根本上改变科学研究方式,人类科学家有望解决当下社会最为紧迫的挑战”。科研领域应用人工智能可以拓展人类知识的边界,对人类科技研究将产生颠覆性变革。从实验层面看,人工智能对科技创新的提升可体现在三个方面:
一是人工智能快速迭代,作为科研工具的实用性大幅增强。随着人工智能技术研究不断深入,处理问题的能力不断提升,深刻带动科技研究创新升级。以深度学习为例,谷歌旗下DeepMind在2018年推出AlphaFold 1后,6年间版本迭代三次,2024年推出的AlphaFold 3能力大幅升级,已可辅助科学家预测蛋白质与其他分子相互作用时的结构。
二是人工智能应用深入,作为创新工具的效率进一步提升。一方面,机器人科学家或成为现实。2023年11月,美国劳伦斯伯克利国家实验室发布基于机器人的自主材料实验室(A-lab)最新成果, A-Lab可处理比人类实验员多50-100倍的材料样本,并可在没有人为干预的情况下自主进行24小时不间断实验;另一方面,模型大范围应用后,成本更低。例如天气预测领域,美科学家发现人工智能算法训练完成后,运行成本低于传统计算公式建模的天气系统。
三是人工智能创新加速,有利于拓宽科技研究边界。2023 年7月,Google前CEO埃里克·施密特在MIT Technology Reviews发表评论称:“目前,跨领域知识融合与生成式人工智能或超大型深度学习模型已扩展科学的可能性”。例如,深度神经网络、深度强化学习等人工智能已应用于托卡马克核聚变的等离子体研究,拓宽科研边界,缩短科学家对前沿未知领域认识过程;基于现有材料数据训练人工智能,可快速研制发现未知的材料结构。
理解二:人工智能推动科研创新关键在于数据
2023年5月,美发布《国家人工智能研究与开放战略计划(2023版)》提出,要“推进以数据为中心的知识发现方法”。结构化数据训练直接影响模型使用结果,在科研领域,人工智能驱动创新成为新科技范式,关键在于数据使用。
一方面,采用统一原则推广数据集。美学界目前普遍认可“可查找性、可访问性、互操作性、可重用性”(FAIR)原则,并基于此开发相应政府所辖领域数据库。例如,美国国立卫生研究院数据科学战略办公室在2021年至2023年间基于FAIR原则,资助83家机构共108个项目,为研究人员提供生物与医疗领域数据资源研究项目。并且,美国国立卫生研究院基于大数据到知识(BD2K) 计划设立bioCADDIE、CEDAR等生物数据领域研究社区,推广数据使用与研究。
另一方面,高度关注科研领域人工智能数据管理。2023年10月,美总统拜登在“关于安全、可靠和可信地开发和使用人工智能的行政命令”中,针对科技研究中的数据管理向各主管机构提出多项要求:一是向公众提供联邦政府数据访问;二是加强数据清单审查与管理,防止数据被应于危害安全的研究;三是进一步向研究领域开放涉及高性能和数据密集型计算的资源;四是探索提高生物与医疗领域数据质量的举措,在确保隐私与安全条件下,进一步放开临床研究所需的数据;五是在法律允许框架下向小企业开放研究所需的数据集。
理解三:人工智能在科研领域应用或产生安全风险
尽管人工智能发展迅猛,现阶段人工智能对科技实验并非都是正向结果。2023年10月,美国国家人工智能咨询委员会(NAIAC)发布一份最新的人工智能未来潜在风险调查结果,对人工智能研究与应用持审慎态度。
其一,囿于对人工智能基础运算理解不深入,人工智能在科研领域应用存在“黑箱问题”,导致人工智能应用在实验领域存在谬误。美国国家科学院在2022年提出“学术界在使用人工智能工具过程中,人工智能质量难以评估,可能对科学领域及其应用造成危害”。2023年6月,美国政府问责局提示生成式人工智能在使用中存在“幻觉现象”,科研人员在构建人工智能系统过程中往往面对的是未知的应用结果,在训练模型的数据中或存在偏见,会放大生成式人工智能输出造成危害的可能性。
其二,随着人工智能普及,多数人员在人工智能安全管理存在不专业现象,导致人工智能算法安全漏洞与外泄风险。美国国家人工智能咨询委员会指出,在人工智能使用中存在规避安全现象,有些安全规避现象并非本人主观意愿,是使用人员对安全理解不到位,编辑和使用过程中存在应用“绕过”监管的风险。并且,美国国家人工智能咨询委员会提出,开源模型在生物、化学、网络等领域应用被恶意使用或产生新的国家安全风险。
其三,人工智能成果推广是一个系统工程,需严格界定数据与模型伦理道德边界。美国国家人工智能咨询委员会在2024年5月就促进人工智能在科技领域应用发布研究报告,其中将数据使用“知情同意”纳入关键政策建议,提出要在尊重数据使用人与被使用人知情权的前提下,允许日常数据收集及应用于科学研究领域。
此外,面对人工智能快速应用,美国民众对政府人工智能管理存在一定焦虑。美国皮尤中心2023年11月在全美发起一项人工智能应用调查,结果显示:超过60%受访者对医疗过程中使用人工智能感到不适;在使用ChatGPT受访者中,约67%人希望政府采取更加严厉监管举措;78%受访者对人工智能应用造成的风险感到不安。
二、美已开展一系列举措加强人工智能驱动科研创新
为进一步将人工智能优势转化为实际科研创新成果,美政府已开展一系列举措,促进人工智能驱动科研创新。
举措一:启动国家人工智能研究资源试点项目
美政府推出国家人工智能研究资源 (NAIRR) 试点项目,机构工作组由白宫科技政策办公室与美国国家科学基金会共同管理,围绕人工智能研究与科研发现所需资源进行统筹,侧重于支持美学术界研究和教育。NAIRR试点项目于2024年1月24日启动,为期两年。
具体来看,NAIRR试点项目旨在通过增加对各种人工智能相关基础设施资源(计算能力、数据集、预训练模型、软件系统、平台)访问,满足研究人员需求。第一阶段,NAIRR将为美科研人员提供高性能计算机、人工智能特定资源(如:预训练模型、数据集等)。
目前,NAIRR 试点项目已涵盖14家政府机构(国防部、能源部、航空航天局、国立卫生研究院等)与26家科技企业(微软、谷歌、OpenAI、IBM、亚马逊、英伟达、AMD等)。
根据NAIRR 工作组建议,目前NAIRR 试点项目实施以下管理和治理结构:
图1:NAIRR 试点项目治理框架
举措二:简化联邦政府数据访问程序
人工智能科研领域模型训练需要相应领域科研数据,美政府已在《国家人工智能研究与开放战略计划(2023版)》中,将数据访问与开发列入关键举措之一,进一步鼓励并促进联邦数据开放。
对于政府拥有研究数据,美政府已将可公开数据放置在data.gov、science.gov等公开网站。对于非敏感可公开的数据,已经开放在各大政府网站。例如,国家航空航天局已将地球科学等数据集开放在网站中,供研究人员使用;国家科学基金会推出共访问计划2.0,其中进一步提高科研数据开发与公共访问便捷性。对于需要申请或授权使用数据,在实施身份访问管理基础上,也进一步支持与研究人员共享数据;根据癌症登月计划,国立卫生研究院正建设并扩大癌症研究数据生态系统,鼓励数据间共享,以支持对个体患者癌症治疗,并推动新疗法发现;美国家科学技术委员会表示,出于隐私或安全需要,联邦政府可以提供政府数据安全平台,目前相关部门正研究涉及国家安全数据服务授权。
举措三:加强人才培养与学科建设
人工智能驱动科技创新对科学家与人工智能专家提出新的需求,广泛需要大量交叉领域复合人才。战略层面,美国人工智能研发战略将人工智能人才培养拆分为十项具体工作,分别牵头实施。其中,既考虑自身劳动力再教育、学生多元化培养、学科建设等问题,也涉及如何吸引全球人工智能人才赴美工作。
各联邦机构也积极开展相应STEM人才培养。美国国家科学基金会2023年10月宣布拨款 1600 万美元加强和多样化人工智能研究能力;2023年12月启动未来人工智能劳动力教育计划(EducateAI),进一步扩大人工智能领域教育规模,覆盖K12及本科生阶段。美能源部与国家科学基金会合作,依托高性能计算网络,为科学家及研究人员提供人工智能学习服务,目标到2025年培训500名研究人员,满足研究领域人才需求。
举措四:进一步加大项目与投资引导
美政府多部门已设立基于人工智能科研项目,进一步通过政府资金引导人工智能推动科研创新。
一方面,设立投资项目引导人工智能与科技方向。例如,2023年国家科学基金会投资7250万美元,用于推动解决重大社会挑战所需的先进材料的设计、发现和开发;2023年美国能源部已在未来五年内为量子科学中心提供1.15亿美元资助,其中包括支持人工智能辅助量子材料发现和设计;2024年,国家标准与技术研究院启动人工智能在制造业领域应用研究项目并宣布设立新机构,将在未来五年投资7000万美元加强人工智能在制造业领域研究;国立卫生研究院设立“通向人工智能桥梁”(Bridge2AI)基金项目,推动生物医药与人工智能结合领域研究发展。
另一方面,政府部门就所管辖领域可开展人工智能研究进行分析并发布方向报告,为各机构研究提供方向性参考。例如,美能源部2024年发布《人工智能与能源:现代电网和清洁能源经济机遇》《能源领域人工智能高级研究方向》,进一步引导能源领域人工智能科研发现方向。
2.加强人工智能基础设施投资
公共服务方面,2024年美能源部宣布成立“人工智能和数据中心基础设施供电工作组”。将在今年年中发布关于满足人工智能等基础设施建设能源供给政策研究报告;能源部宣布在今年内召开电力负荷增长利益相关者会议,涉及公用事业公司、数据中心、清洁能源开发及运行企业。此外,美政府正研究量化全美数据中心能耗与水耗。受美能源部委托,劳伦斯伯克利国家实验室目前正在对全美数据中心区域能源和水资源使用情况分析与调研。
数字基础设施方面,拜登政府自执政以来,大力推动基础设施投资项目,依托《两党设施投资法案》《芯片和科学法案》《通胀削减法案》等一系列法规,在高性能计算、数据中心、宽带、电网等领域持续投资并为其提供税收抵免,加强数字基础设施建设。例如,能源部2023年拨款4000万美元,用于提高数据中心冷却效率;卫生与公众服务部推出数据中心优化多年期计划(2023-2026),进一步提高数据中心运行效率,整合替换优化其管辖数据中心。
举措五:引导学术界与其他合作伙伴开展多元化研究
美政府高度重视人工智能研究领域合作生态建设。自2016年奥巴马政府首次发布国家人工智能研发战略规划以来,如何创建和培养适应人工智能发展创新环境一直是美政府管理者高度关注
政策方面;2019年特朗普政府首次修订国家人工智能研发战略规划,其中增加一项战略重点,将进一步促进人工智能研究与应用领域公私伙伴关系,重点是“政府—大学—产业研发伙伴”关系;2023年拜登政府第二次修订国家人工智能研发战略规划,其中合作生态建设是修订重点,在原有战略基础上,将“政府—大学—产业研发伙伴”战略方向扩大为“与学术界、产业界、国际伙伴和其他联邦实体合作”,并新增“建立原则性和协调性人工智能研究国际合作方法,优先开展人工智能研发国际合作”。
各联邦部门积极通过细分领域研究计划,加快推动美人工智能研究合作生态构建。例如,美国家科学技术委员会在2021年修订“材料基因组计划战略计划”(MGI)提出,为美研究人员创建一套统一的跨学科研究工具与方法,包括:计算(理论、建模、模拟)工具、实验(合成、特性、处理)工具、综合研究平台、数据基础设施等。美国家科学基金会整合2016年至2020年间研究资源,创建材料创新平台,由一套实验和计算工具组成,支持全国研究人员访问,可对晶体生长、材料与生物学融合开发等领域开展研究。
举措六:引导科研人员加强人工智能风险管理
围绕人工智能应用风险,美政府已开展一系列举措,从科研角度看,美政府正逐步引导和规范科研人员使用人工智能。
一是行业主管部门明确道德边界。人工智能应用风险最多领域目前集中在生物研究中,2022年10月,美国卫生及公共服务部针对人体实验中人工智能使用原则制定明确规定,并围绕规则解释进行详尽说明。例如,数据收集层面,人类受试者或数据提供者应被明确告知信息范围。
二是围绕研究伦理问题展开项目培训。美国国家科学基金会已启动国家研究培训(NRT)计划,其中就人工智能伦理问题展开多学科研究与培训。例如,德克萨斯大学奥斯汀分校NRT计划涉及“负责任使用合乎道德人工智能”,涉及计算机科学、机器人技术、航空航天工程等领域。
三是针对应用推出风险管理手册与指南。2022年8月,美国能源部人工智能和技术办公室(AITO)发布人工智能风险管理手册 (AI RMP),鼓励人工智能研究人员与应用者采取主动风险管理措施;2023年12月,美国国家科学基金会就研究成果评估中生成式人工智能使用发布规则说明,要求审查环节不得将成果内容上传至未经批准的大模型中;2024年4月,美国国家标准与技术研究院发布人工智能风险管理框架,建议研究人员按照管理框架就生成式人工智能风险进行合理管控,其中就“获取与化学、生物、放射性或核武器相关的信息”风险进行详细分析,并提出相应管理措施。
三、总结与思考
人工智能驱动科研创新是未来技术创新关键路径,已成为全球创新前沿,更是影响大国科技竞争关键之一。美国作为全球人工智能强国之一,在发展人工智能的同时也在全面推动人工智能在科技研究中的创新应用。梳理美政府人工智能驱动科研创新领域的政策、规划后,发现:
一是加强人工智能对科技创新赋能的过程与机理研究。如何理解人工智能赋能科技创新的过程与本质机理,直接影响政府机构对人工智能工作的管理分工,也影响对人工智能的风险管理。目前,美国已开展“人工智能安全”建设,以期建立完整的研究框架,分析人工智能在各类应用中作用机理与风险传导机制,以便更有针对性管理人工智能风险。
二是引导数据适度开放。在保障隐私安全的前提下,美国将各研究领域数据进行分批开放,进一步促进美材料、生物、医药等领域人智能应用发展。人工智能赋能科技创新的核心在于“以数据为核心的知识发现”,随着人工智能技术创新加速,许多不同的模型算法不断涌现,可以发现新的知识,为科学家在高不确定性的前沿研究中提供高确定性的解决路径。
三是提供成熟工具。在保障自身需求的前提下,美国将相关领域成熟计算工具与研究平台适度对外开放,一方面,有利于集约化开发成熟人工智能模型,减少美研究人员研究壁垒、研发成本,提高研究有效性;另一方面,将成熟工具适度对外开放,有利于美政府层面管控人工智能研究,引导科技创新,减少安全风险。
四是丰富研究生态。在保障技术创新的前提下,美国通过交叉领域项目投资、发起研究联盟、促进国际合作等形式加强交叉领域应用创新与培训,一方面,可以引导科技合作与研究方向,有利于巩固美人工智能全球创新领导地位;另一方面,借政府资金引导研究人员规范人工智能使用,特别是按照美政府人工智能原则开展人工智能实验,减少人工智能使用风险。
参考文献:
[1]PCAST Releases Report on Supercharging Research: Harnessing Artificial Intelligence to Meet Global Challenges [EB/OL]. https://www.whitehouse.gov/pcast/briefing-room/2024/04/29/pcast-releases-report-on-supercharging-research-harnessing-artificial-intelligence-to-meet-global-challenges/
[2]AlphaFold 3 predicts the structure and interactions of all of life’s molecules [EB/OL]. https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/
[3]NATHAN J. SZYMANSKI, BERNARDUS RENDY, YUXING FEI, et al. An autonomous laboratory for the accelerated synthesis of novel materials[J]. Nature,2023,624(7990):86-91.
[4]Eric Schmidt:This is how AI will transform the way science gets done [EB/OL]. https://www.technologyreview.com/2023/07/05/1075865/eric-schmidt-ai-will-transform-science/
[5]GS-DeepNet: mastering tokamak plasma equilibria with deep neural networks and the Grad–Shafranov equation
[6]DEGRAVE, JONAS, FELICI, FEDERICO, BUCHLI, JONAS, et al. Magnetic control of tokamak plasmas through deep reinforcement learning[J]. 2022,602(Feb.17 TN.7897)
[7]Science & Tech Sptlight:Generative AI [EB/OL]. https://www.gao.gov/products/gao-23-106782
[8]NATIONAL ARTIFICIAL INTELLIGENCE RESEARCH AND DEVELOPMENT STRATEGIC PLAN 2023 UPDATE [EB/OL]. https://www.nitrd.gov/national-artificial-intelligence-research-and-development-strategic-plan-2023-update/
[9]Executive Order on the Safe, Secure, and Trustworthy Development and Use of Artificial Intelligence [EB/OL]. https://www.whitehouse.gov/briefing-room/presidential-actions/2023/10/30/executive-order-on-the-safe-secure-and-trustworthy-development-and-use-of-artificial-intelligence/
[10]GAO:Artificial Intelligence’s Use and Rapid Growth Highlight Its Possibilities and Perils [EB/OL]. https://www.gao.gov/blog/artificial-intelligences-use-and-rapid-growth-highlight-its-possibilities-and-perils
[11]National Artificial Intelligence Research Resource Pilot [EB/OL]. https://new.nsf.gov/focus-areas/artificial-intelligence/nairr#about-the-nairr-pilot-bcb
[12]About the Administrative Supplements to Support Collaborations to Improve the AI/ML-Readiness of NIH-Supported Data [EB/OL]. https://datascience.nih.gov/artificial-intelligence/initiatives/Improving-AI-readiness-of-Existing-Data
[13]HHS Data Center Optimization Multi-Year Plan 2023-2026 [EB/OL]. https://www.hhs.gov/web/governance/digital-strategy/it-policy-archive/hhs-data-center-optimization-multi-year-plan-2023-2026.html#4
[14]NSF launches EducateAI initiative [EB/OL]. https://new.nsf.gov/news/nsf-launches-educateai-initiative
[15]Supercharging America's AI Workforce [EB/OL]. https://rgy.gov/cet/supercharging-americas-ai-workforce
[16]DOE Announces New Actions to Enhance America’s Global Leadership in Artificial Intelligence [EB/OL]. https://www.energy.gov/articles/doe-announces-new-actions-enhance-americas-global-leadership-artificial-intelligence
[17]Bridge to Artificial Intelligence [EB/OL]. https://www.commonfund.nih.gov/bridge2ai
[18]The 2021 Materials Genome Initiative Strategic Plan [EB/OL]. https://www.mgi.gov/
作者简介
白路 国务院发展研究中心国际技术经济研究所研究一室
研究方向:科技战略、科技安全
编辑丨郑实
研究所简介
国际技术经济研究所(IITE)成立于1985年11月,是隶属于国务院发展研究中心的非营利性研究机构,主要职能是研究我国经济、科技社会发展中的重大政策性、战略性、前瞻性问题,跟踪和分析世界科技、经济发展态势,为中央和有关部委提供决策咨询服务。“全球技术地图”为国际技术经济研究所官方微信账号,致力于向公众传递前沿技术资讯和科技创新洞见。
地址:北京市海淀区小南庄20号楼A座
电话:010-82635522
微信:iite_er