加州大学伯克利分校Omar M. Yaghi院士等人提出了一个新的框架,将人工智能模型GPT-4集成到网状化学实验的迭代过程中,利用人工智能与人类研究人员之间的互动合作工作流。这个GPT-4网状化学家是一个由三个阶段组成的综合系统。每一种都以不同的方式使用GPT-4,其中GPT-4提供化学实验的详细说明,人类提供实验结果的反馈,包括成功和失败,以便在下一个迭代中人工智能的上下文学习。
这种迭代的人机交互使GPT-4能够通过快速学习策略从结果中学习,就像一位经验丰富的化学家一样。重要的是,该系统基于自然语言进行开发和操作,消除了对编码技能的需要,因此,所有化学家都可以使用它。作者与GPT-4 Reticular Chemist的合作指导、发现了一系列MOF,每个合成都通过迭代反馈和专家建议进行微调。通过利用像GPT-4这样的大型语言模型的能力来提高研究活动的可行性和效率,该工作流在科学研究中具有更广泛应用的潜力。
相关工作以《A GPT-4 Reticular Chemist for Guiding MOF Discovery》为题在《Angewandte Chemie International Edition》上发表论文。值得注意的是,这也是Omar M. Yaghi院士在《Angewandte Chemie International Edition》上发表的第30篇论
文。
往期报道可见:他,MOF鼻祖,运用ChatGPT发表第88篇JACS!
图文导读
图1. 基于GPT-4框架的示意图
本文设计了一个新的快速学习策略框架,将GPT-4整合到网状化学中,利用人类反馈来加速发现新的MOF。令人印象深刻的是,这种基于双向学习过程的共生人类-人工智能协作导致了四种具有相同通用化学式[Al3(μ-OH)3(HCOO)3(BTB-X)]的MOF的连续发现,并在下面进一步定义和阐述。值得注意的是,这些MOF及其连接物的合成以及随后的优化和表征都是由GPT-4设计并由人类研究员执行的。
本文开发的框架允许快速适应大型语言模型(LLMs),如GPT-4,通过提示工程和上下文学习,在人类反馈的驱动下,网状化学领域。该过程包括三个相互关联的阶段,每个阶段都使用GPT-4作为网状化学试剂,通过定制的提示与人类对应物进行不同程度的交互,将其称为ChemScope、ChemNavigator和ChemExecutor,如图1所示。
图2. 基于GPT-4网状化学家指导发现MOF-521
MOF发现的完整过程包括使用图1中概述的GPT-4网状化学家工作流程,并包括四种新的MOF(图2a:MOF-521-H,-oF,-mF,-CH3)的创建。值得注意的是,其中一种化合物MOF-521-H是之前在合成另一种MOF-520时意外发现的副产物,但尚未发表。然而,GPT-4网状化学家不知道并因此不受先前研究的合成细节的影响,独立设计了这四种新型MOF的策略,包括MOF-521-H。有趣的是,由GPT-4建立的优化合成条件与人类之前单独发现的条件略有不同。
表1 GPT-4网状化学家通过迭代学习和推理过程获得MOF-521的合成条件
简而言之,在初始阶段,第一阶段是ChemNavigator主要通过全面的文献综述来指导人类研究人员寻找合成路线以获得连接体。根据初步的合成计划,对话指导人类进行有机合成反应,克服挑战,最终确认连接体。有了连接体,并指导人们总结文献检索,第二阶段的研究重点是确定MOF形成的最佳条件,包括对金属-连接体比例、温度、反应时间、调节剂及其比例的修改。
图3. 合成的MOF-521化合物的结构表征
在Reticular ChemNavigator的建议指导下,经过多轮优化,得到了所有化合物的单晶。除了MOF-521-CH3由于棒状单晶太小,无法进行单晶X射线衍射(SXRD)外,其余三种化合物都足够大,可以用SXRD进行结构表征。随着进一步研究,GPT-4和人类发现模拟和实验的PXRD模式之间有很好的一致性,这表明所有四种MOF-521化合物都是在相同的拓扑结构下构建的(图3a)。
第三阶段是关键阶段,Reticular ChemNavigator开始研究获得的MOF- 521化合物的永久孔隙度。对测量的设置和分析结果的解释提出了有益的建议。通过氮吸附测量证实了MOF-521家族的永久孔隙率,实验测量的4种MOF的比表面积与Material Studio的预测一致(表2)。所有化合物均表现为I型等温线,没有明显的滞后现象,从计算数据和实验数据来看,孔隙率与框架中官能团大小的关系有一个大致的趋势。
表2 MOF-521化合物的孔隙率数据
图4. 多种MOF-521化合物完成每个阶段的提示迭代次数
如图4所示,四种MOF-521化合物的提示迭代总数是相似的。提示迭代的次数是衡量每种化合物的合成、表征和分析的效率和复杂性的有价值的指标。这一观察结果值得注意,因为它强调了GPT-4作为网状化学家发现新MOF的有效性的可重复性和稳定性。
考虑到每种化合物的发现途径在有机连接体制备、合成条件优化和性质表征等方面不同,化合物之间迭代的相似性尤其值得注意。从这个角度来看,这四个连接体可以被概念化为不同的发现叙述,每个叙述都证明了GPT-4在作为MOF探索的网状化学家方面具有可重复的功效。此外,即使在相同的阶段,GPT-4也遇到了不同的路线。
例如,在合成条件筛选阶段,一种途径可能优先考虑温度,而另一种途径可能强调金属与连接体的比例。这种灵活的方法由GPT-4进行调整并提供量身定制的建议,对于不同的场景,展示了其应对不同挑战的能力。每个化合物的迭代次数一致表明,无论不同的路线和决策如何,实现最佳阶段目标的步骤和工作量都是相似的。这种一致性强调了GPT-4避免陷入优柔寡断或无效途径的能力。
文献信息
A GPT-4 Reticular Chemist for Guiding MOF Discovery,Angewandte Chemie International Edition,2023.https://onlinelibrary.wiley.com/doi/10.1002/anie.202311983