当前位置:首页|资讯|机器学习|ChatGPT

科学家建立全脑甲基化和三维基因组图谱,为大脑提供分子百科全书

作者:DeepTech深科技发布时间:2024-02-08

原标题:科学家建立全脑甲基化和三维基因组图谱,为大脑提供分子百科全书

为生成完整的人类的大脑图谱,自 2013 年开始,美国国立卫生研究院开启了“美国脑计划”项目——大脑细胞普查网络联盟(Brain Research through Advancing Innovative Neurotechnologies Initiative-Cell Census Network,BICCN)。

“美国脑计划”项目的整体时间从 2013 年至 2028 年,以 5 年期为一个阶段,BICCN 作为其中承上启下的中间部分,从 2017 至 2022 年,主要目标为建立完整的小鼠脑计划图谱,并利用从中发展出的技术初步开启人类脑细胞图谱的研究。

2023 年 10 月,BICCN 的合作单位在 Science 及其子刊齐发 21 篇论文,报道了该计划中人类大脑相关的首部分结果。

近期,BICCN 一系列研究成果在 Nature 同天发布 10 篇论文[1]。科学家们对小鼠大脑大概 3200 万个细胞进行分析,共鉴定 5300 种左右的细胞类型,为领域提供了小鼠大脑的单细胞分子以及空间图谱。

(来源:Nature)

在前文提及的 10 篇 Nature 论文中,一项成果来自美国索尔克生物研究所,以大脑的单细胞表观遗传学为主要方向。

如果将大脑比喻为交响乐团,每种细胞就像在合奏同一曲目、但各有分工的乐器。对应到基因表达调控或表观遗传学,大脑的细胞都有近乎相同的基因组序列,但是每个细胞的基因组在不同的位置活性不同,所以导致它们的基因表达呈现出多样性,并且最终变成不同的细胞。

为了充分理解大脑细胞复杂的多样性,该团队的核心思路是通过开发单细胞表观遗传组学技术,来阅读出单个小鼠大脑细胞的精确分子信息。

最终,这样高分辨率且涵盖全脑神经元的大数据资源,将为神经生物学领域提供一个全面的、广泛的基础数据库,相当于为大脑提供“百科全书”或“地图”。

大脑的细胞类型可以被多种分子层面的信息去定义,并且它们之间能够互相验证。利用多种单细胞单组学测序手段,该研究囊括了 DNA 甲基化、染色体可及性、RNA 等各种不同层面的分子信息,并通过计算手段进行数据整合,来定义出统一的细胞图谱。

在该研究中,研究人员还通过单细胞多组学测序技术,在同一细胞测甲基化的同时,还检测了三维基因组结构或 RNA 等多种不同的信息。最终,通过覆盖成年小鼠大脑的 117 个解剖区域,建立 301626 个甲基化组以及 176003 个染色质构象/甲基化联合图谱。

“各种表观遗传学信息代表着基因的调控,而 RNA 代表了基因的表达,这些信息被 BICCN 的不同研究独立检测,然后再通过计算整合。

通过这样的多层面证据互相印证,我们可以更有信心地定义出大脑中多达几千个的细胞类型。”该论文共同第一作者、索尔克研究所刘翰青博士(现哈佛大学青年研究员)表示。

图丨刘翰青(来源:刘翰青)

在定义出复杂的细胞类型之后,为了让这一数据集更加有实际意义,还需要知道不同细胞类型在大脑中的精确空间位置。

因为哺乳动物大脑具有极为精细的解剖结构,具体的空间位置往往也意味着细胞的特定神经活动和功能。为了做到这一点,该研究还进一步使用空间转录组学技术。

大多数常见的单细胞测序技术需要破坏组织来获得单个细胞,但细胞的具体空间信息也因此丢失。相比之下,空间转录组技术能够在不破坏大脑细胞的前提下,让它处于原位,然后进行 RNA 转录表达检测。

基于这两种互补的技术,该研究开发了一系列计算整合手段,使得丢失了空间信息的小鼠大脑单细胞组学数据,也能够通过与空间转录组学数据相匹配,来得到较为精确的空间信息。

该结果对于进一步了解各种细胞类型在大脑的位置分布,以及研究基因表达调控与大脑解剖结构形成的关系具有重要意义。刘翰青表示,这些海量的空间位置信息,让“大脑地图”真正地具有指导意义。

图丨相关论文(来源:Nature)

近日,相关论文以《成年小鼠大脑的单细胞 DNA 甲基化组和 3D 多组学图谱》(Single-cell DNA methylome and 3D multi-omic atlas of the adult mouse brain)为题发表在 Nature[2]。

索尔克研究所刘翰青博士(现哈佛大学青年研究员)和博士研究生曾秋瑞为论文共同第一作者,约瑟夫·R·埃克尔(Joseph R. Ecker)教授为论文通讯作者。

图丨单细胞 DNA 甲基组和多组图谱显示细胞和整个小鼠大脑的基因组多样性(来源:Nature)

随着单细胞组学等生物技术的突飞猛进,分子神经生物学和表观遗传学领域已经积累了足够多的大数据。相比于传统的统计分析方法,前沿的机器学习模型将有可能更全面理解我们所观察到的大脑细胞和分子多样性。

如果模型能够充分理解 DNA 序列等信息如何决定这些细胞特异性,我们就可以利用它来预测 DNA 序列功能,从而判断疾病突变的影响和预测治疗脑疾病的具体效果等。

刘翰青表示,已经有不少研究在使用类似 ChatGPT 这样的模型,去理解大脑不同细胞类型的基因调控元件模式,并且在此基础上生成自然界中不存在的序列,但却可以具有在特定细胞或者组织中调控基因表达的功能。

图丨大脑中一致的空间表观基因组和转录组多样性(来源:Nature)

例如,最近在 Nature 发表了两篇论文,用机器学习的方式来从头生成基因调控元件,并且在果蝇胚胎中进行验证[3,4]。“我认为,接下来在老鼠和人类大脑中都可以基于 BICCN 的大数据进行类似的尝试,为科学研究和临床治疗带来新的希望。”他说。

现在,刘翰青在哈佛大学担任青年研究员。未来,他计划继续以表观遗传学和分子神经生物学为主要研究方向。

“美国脑计划的下一个阶段将以多组学测序技术作为主要检测手段,全面构建人脑细胞图谱。除此之外,多组学技术也将更直接的帮助我们理解各种分子调控的关联性,省去了目前通过计算整合的步骤。”刘翰青说。

需要了解的是,该研究相当于提供了一个大脑的“地图”,但并不是为生物学问题直接提供解决问题或进行系统性分析。因此,这也给神经生物学领域在“大脑地图”如何具体使用方面,提供了探索空间。从小鼠和大鼠到非人灵长类模型,最终到指导治疗人类脑疾病。

参考资料:

1.https://www.nature.com/collections/fgihbeccb

2.Liu, H., Zeng, Q., Zhou, J. et al. Single-cell DNA methylome and 3D multi-omic atlas of the adult mouse brain. Nature 624, 366–377 (2023). https://doi.org/10.1038/s41586-023-06805-y

3.de Almeida, B.P., Schaub, C., Pagani, M. et al. Targeted design of synthetic enhancers for selected tissues in the Drosophila embryo. Nature (2023). https://doi.org/10.1038/s41586-023-06905-9

4.Taskiran, I.I., Spanier, K.I., Dickmänken, H. et al. Cell-type-directed design of synthetic enhancers. Nature (2023). https://doi.org/10.1038/s41586-023-06936-2

运营/排版:何晨龙


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1