Npj Comput. Mater.: 打开黑盒子—可解释的机器学习

作者：知社学术圈发布时间：2023-01-13

传统材料科学研究依赖于个体专家的知识，并发展出了专家系统。但是其预测的准确性有赖于长期的研究积累，需要专业的经验或者有较高专业背景的设想，这不利于解释与发现新材料。这是因为如果材料研究的时间较短，未能积累起足够的知识与经验，那么专家或专家系统所给预测的有效性并不高。

Fig. 1 Different scopes and aspects of explainability.

近年来兴起的机器学习可以克服这种局限性，因为它可以直接分析数据而不依赖特有的高深知识或者奇思妙想，而且研究表明，从原子水平的形成能到宏观尺度的电导率，经过训练的机器学习模型都可以出色地给出预测。但是“知其然而不知其所以然”不符合科学精神，因此这种预测是否真的可靠，还需要明确其机制，或者说要求它的预测机制是“可解释的”。

Fig. 2 Overview of approaches to achieving explainability within DNNs.

然而实践表明，预测结果越准确的机器学习模型，比如当前最准确的深度学习神经网络等机器学习方法，其模型的可解释性反而越差，通常被看作是“黑盒子”，这就意味着其预测的可靠性乃至外延预测会存在问题，或者说针对当前训练数据和检验数据的成功并不意味着可以无限制地用于其他数据。2017年DARPA提出的可解释人工智能（XAI）可以解决这个问题。

Fig. 3 Example heat map explanations for a CNN with image inputs.

由于XAI对材料研究人员而言还是较为生疏的领域，因此本文围绕材料科学介绍XAI，以便他们更好地实现机器学习预测的准确性与可解释性之间的均衡。

Fig. 4 Example heat map explanations for a CNN with spectral input.

来自美国劳伦兹-利弗莫尔国家实验室材料科学部的Han和Zhong教授团队对XAI在材料科学领域的发展做了回顾，从背景、概念、示例以及挑战与机遇的角度分别进行了详细介绍。

Fig. 5 Example of data distribution shift resulted machine learning model mistakes.

他们首先从分级、时间和特征的角度解释了“可解释”的含义，强调受限于现有条件，对于复杂的机器学习模型，“可解释”并不意味着像线性回归等简单的机器学习模型那样可以完全“透明”，而是允许模型中仅有一部分模块或功能得到解释。

Fig. 6 Example of prototype and criticism explanations.

随后他们以深度神经网络模型在材料科学中的各种应用为主要示例，进一步介绍了如何设计与应用XAI技术。

Fig. 7 Example surrogate decision tree model.

本文的结尾给出了该领域目前仍存在的问题，比如缺乏背景事实或者忽略对可解释性自身的评价等，并且建议在通用代码库的建设，不确定性的量化以及可视化等方向加强发展，从而推进XAI的进步。

Fig. 8 Performance comparison for different models.

该文有助于材料科学工作者理解XAI的概念、理论与作用，进而提高机器学习在材料研究中的有效性，同时也展示了XAI在研究材料多尺度结构与性能之间关系上的重要作用。

Fig. 9 Illustration of the hierarchical feature representation within CNNs.

论文链接：

相关资讯

Npj Comput. Mater.：基于机器学习方法的通用混合分子体系力场的训练策略及其评估

原创声明：本文为【新威智能】原创文章，转载及相关事宜请联系小智（微信号：nwMobi背景介绍在分子模拟的发展方面，机器学习为以从头计算为基础的高精度模拟提供了一个可靠的途径，使得大尺度和长时间尺度的模拟成为了可能。目前，机器学习方法已经成功应用于孤立分子、无机固体以及小分子液体的模拟，其中方向性分子内的相互作用占主导地位，并且相互作用是均匀的。然而，在分子混合物体系中，由于分子内和分子间相互作用之间存在着大的尺度分离，导致分子间环境呈现异质性，为分子模拟带来进一步的挑战。分子液体的许多重要性质（如密度、粘

机器学习

新威智能 2023-11-01

Npj Comput. Mater.: 打开黑盒子—可解释的机器学习

推荐体验

相关资讯

Npj Comput. Mater.：基于机器学习方法的通用混合分子体系力场的训练策略及其评估

分享一个chatGpt高效连接的黑盒子

机器学习的可解释性详尽介绍

机器学习模型的解释性与可解释性研究

《可解释机器学习》复旦大佬翻译中文版！

近期资讯

面试官：不会“不定高”虚拟列表，你在简历上面提他干嘛？

一文了解 INNER JOIN 和 WHERE 在 SQL语句中的区别

css滤镜

javascript中的==、===

成本下降100倍！非营利组织E11 Bio新成果，绘制大脑数百万细胞连接关系

🔥《手把手教你》系列基础篇之2-python+ selenium自动化测试-打开和关闭浏览器（详细）

基于Java异步处理的 USB 设备监控系统设计与实现：技术架构与业务场景分析

flex常见内容介绍

如何理解 CNN 中的 RGB 图像和通道？

鸿蒙开发：适配系统深浅色模式

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响