参考消息网11月19日报道据美国《科学》周刊11月15日报道,DNA只用四个“单词”,即四种核苷酸就编码了细胞中所有层面调控活动所需的基本信息。这些指令指导着每个细胞的功能并在代际之间传递信息。基因组序列的变化驱动着进化,使有机体通过自然选择有利的DNA序列来适应其所在的环境。因此,通过比较不同进化背景的基因组中的DNA序列,就可能使大语言模型学会DNA的语法。Evo是一个用270万个进化程度各异的原核生物和噬菌体基因组训练成的基础模型。掌握了基因组逻辑的Evo能够解码自然基因组,在DNA、RNA和蛋白质层面上完成预测和设计任务并在全基因组尺度上生成DNA。
美国《科学》周刊11月15日一期封面
前言迅播 2024-01-29
Halcom中国 2023-09-07
前言迅播 2024-05-13