利用大型语言模型进行预测化学

作者：惟研发布时间：2024-03-07

机器学习已经改变了许多领域，最近在化学和材料科学中得到了应用。化学中常见的小型数据集引发了复杂的机器学习方法的发展，这些方法将化学知识纳入每个应用，因此需要专业知识来开发。研究人员展示了通过对GPT-3进行微调以正确答案以自然语言回答化学问题，从而轻松适应解决化学和材料科学中的各种任务。他们将这种方法与专用的机器学习模型进行了比较，用于许多应用，涵盖分子和材料的特性以及化学反应的产率。令人惊讶的是，微调的 GPT-3 版本可以与传统的机器学习技术相媲美，甚至优于传统的机器学习技术，尤其是在低数据限制方面。

关键词

大型语言模型 (LLM)、分子性质预测、分子设计、逆向设计、GPT-J模型

正文内容

实验设计与方法

1.任务选择和目标设定

研究人员选择了涵盖材料特性、分子设计等方面的一系列任务，并设定了解决这些任务的主要目标，包括评估GPT-3模型在化学领域的性能和适用性。

2.GPT-3模型微调

使用选定的任务和数据集对GPT-3模型进行微调，采用了提供问题和答案示例的方式，以使模型适应化学领域的特定任务。。

3.性能评估指标

研究人员确定了用于评估模型性能的主要指标，包括分类准确率、回归误差等，以及与传统机器学习模型进行性能比较的方法。

4.数据需求

相对于传统机器学习模型，GPT-3模型通常需要更少的数据就能达到相似的性能水平，这对于化学领域中数据稀缺的情况尤为重要。

实验结果与分析

实验结果表明，GPT-3模型在化学领域展现出了出色的性能和广泛的适用性。与传统机器学习模型相比，GPT-3模型在各种化学任务上表现出至少相当的性能水平，甚至在某些情况下表现更好。尤其值得注意的是，GPT-3模型通常需要更少的数据就能达到相似的性能水平，这对于化学领域中数据稀缺的情况尤为重要。此外，实验结果还表明，GPT-3模型具有良好的泛化性能，能够适应新领域和任务，而对于不同的分子表示方法，模型的性能影响不大，使得微调GPT-3模型相对简单。综上所述，GPT-3模型在化学领域具有巨大的潜力，可以成为解决各种化学问题的有效工具。

‍‍‍‍

论文地址：https://www.nature.com/articles/s42256-023-00788-1

相关资讯

机器之心 2023-04-30

OpenAI首席架构师预测大型语言模型将实现巨大飞跃

鞭牛士报道，6月12日消息，据外电报道，OpenAI首席架构师科林·贾维斯(ColinJarvis)在周三的伦敦人工智能峰会主题演讲中预测大型语言模型将取得重大进步。贾维斯强调了四个他期待取得重大进展的关键领域：更智能、更便宜的模型、更强的模型定制化、更多音频和视频等多模式以及市场领先的聊天机器人在同样高的水平上的表现。

OpenAI 大语言模型人工智能

鞭牛士 2024-06-12

利用大型语言模型进行预测化学

推荐体验

相关资讯

什么是大型语言模型？大型语言模型是否对盗版内容进行了训练

构建命令行工具以利用大型语言模型生成 README

从零开始构建大型语言模型——理解大型语言模型

表现优于 GPT-4，ChemCrow 集成 13 种化学工具，增强大型语言模型的化学性能

OpenAI首席架构师预测大型语言模型将实现巨大飞跃

近期资讯

浙江万胜智能申请具有远程无线传输的微型智能网关专利，提高智能网关的通信效果

余承东：华为明年有大家想不到的产品，未来还有大家不敢想的产品

浙江雨林申请用于组合LED灯的自适应照明方法及系统专利，解决现有照明技术问题，提高照明舒适度、能效和用户满意度

绍兴宏强印染取得一种染料混合装置专利，提高染料混合效率

浙江八咏取得交通废旧回收料处理用基碳负极材料混搅制备机专利，能够有效方便使用者对搅拌机清理结构进行拆装和清理

合肥信安申请便携式5G通讯基站专利，便于设备整体件拆装携带

西蒙电气申请用于灯具实现切相调光调色温的系统专利，实现调光兼容性

上海上诺科技发展取得一种分散剂助剂生产罐专利，降低能源的损耗

武义盛景英石申请石英提纯用微波处理装置专利，有效避免微波朝外泄漏

镇江东方电热申请电磁感应线圈外置的电磁加热器及使用方法专利，提高加热效率

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响