8月22日消息,科技媒体The Decoder发布的一篇文章揭示了一项由罗格斯大学进行的研究。该研究表明,OpenAI公司的GPT-4语言模型能够以高精度模拟简单的氨基酸及蛋白质结构。这项研究的结果已发表在《Scientific Reports》期刊上。科研团队利用GPT-4这一先进的AI语言模型,对其在基本结构生物学任务中的表现进行了探索。实验结果显示,GPT-4模型能准确预测分子结构。
科学家们让GPT-4构建了20种标准氨基酸的三维结构模型。GPT-4不仅准确预测了原子组成、键长和角度,还在一定程度上模拟了环状结构和立体化学构型,尽管这部分存在一些误差。此外,GPT-4被要求模拟常见的蛋白质结构元素——α-螺旋结构,实验中还集成了Wolfram插件进行必要的数学计算,结果表明,GPT-4所构建的模型与实验确定的α-螺旋结构相似度很高。
GPT-4还被用于分析抗病毒药物Nirmatrelvir与SARS-CoV-2主要蛋白酶之间的结合情况。它成功识别出参与结合的氨基酸,并准确指定相互作用原子间的距离。值得注意的是,GPT-4并非专门为了结构生物学任务而设计,因此其表现出的这些能力令人印象深刻。
然而,研究人员指出,GPT-4的建模方法尚不清楚。它可能使用了训练数据集中的现有原子坐标,也可能从头开始重新计算结构。要得出确切结论,还需进一步深入研究。尽管如此,GPT-4已经在基本结构生物学任务方面展现了潜力,尤其是在处理简单结构的情况下。
相比之下,像AlphaFold 3这样的专业人工智能工具可以预测更为复杂的结构。尽管GPT-4的建模能力目前还处于初级阶段,但这项研究标志着将此类技术应用于结构生物学的一个重要开端。研究人员建议进一步探究生成式人工智能的能力和局限性,以及其在生命科学领域其他潜在应用的可能性。