
实验猴。脑智卓越中心供图
■本报见习记者 江庆龄
2021年,毛亚飞即将回国加入上海交通大学Bio-X研究院时,他已经想好了组建实验室后要开展的研究,其中之一是解答“人为什么是人”这个问题。
要回答这个问题,仅凭一己之力显然是不够的。毛亚飞经中国科学院脑科学与智能技术卓越创新中心/神经科学研究所(以下简称脑智卓越中心)研究员刘真介绍,给该中心研究员孙强发送了一封邮件,表达了合作意愿,孙强很快答复。素未谋面的两人在线上会议室沟通后,合作随即展开。
其中一项合作研究近日在《自然》发表。团队首次完成了非人灵长类端粒到端粒(T2T)完整基因组组装,系统解析了猕猴属与人类的大尺度基因组差异,共鉴定出93个人类与猕猴属之间的固定结构变异,包括78个倒位、11个着丝粒重定位和4个染色体内易位,其中21个结构变异为首次报道。同时,研究揭示了猕猴属种间分化的遗传学特征,为非人灵长类生物医学模型奠定了关键遗传基础。
《自然》指出,该工作完成了世界上首个非人灵长类完整基因组,解析了猕猴基因组的独特特征以及人类与猕猴间的关键遗传差异。相关工作为灵长类演化医学和猕猴生物医学模型构建奠定了重要遗传基础。
解决“不到10%”的问题
哲学上有3个非常经典的问题——“你是谁”“你来自哪里”“你要到哪里去”。演化生物学正是通过回溯人类的“来时路”,解答“人是什么”,并由此推测“未来去向”。
若想获得物种的完整基因组,只能先通过测序得到数万条序列片段,再由科学家“找不同”“找相似”,把它们拼接起来。毛亚飞将之形容为“拼图”。人类等物种拥有复杂的基因组,就像是一幅巨大的拼图,其上既有纹理分明的小桥、流水、人家,也有大片色块相同的蓝天和白云,即着丝粒、片段重复、回文序列等复杂结构。
传统测序技术的拼图“图块”特别小,当遇到大片蓝色或白色时,很难判断它所在的位置,只能空着。测序技术发展过程也是“图块”不断变大的过程,倘若整朵白云都在同一片图块上,难题将迎刃而解。
然而,尽管第三代测序技术的读长已经达到100kbp以上,但对于动辄几十Mbp数量级的重复片段,“图块”仍然不够大。
“对于这不到10%的部分,可以利用合适的基因组局部组装工具进行弥补。”毛亚飞介绍,这类工具可帮助科研人员找到一大堆同色“图块”中的细微差异,从而把拼图拼得更准确。
随着“图块”逐渐变大以及科研人员的“拼图技巧”越发熟练,包括人类在内,多个灵长类物种T2T基因组被组装完成。
在此过程中,演化医学的概念应运而生。毛亚飞介绍:“这是一门高度交叉的学科,深度融合了生物信息学、演化生物学、医学遗传学等,旨在通过演化视角解释遗传疾病的发生机制、人体生理特征的脆弱性以及人类对疾病的易感性。”
从结构变异中“挖宝”
猕猴属的食蟹猴和恒河猴是与人类遗传距离最近的非人灵长类实验动物,广泛应用于生物医学和人类演化研究。然而,猕猴属现有参考基因组仍存在大量未知序列,而这些未知区域可能起着控制染色体稳定性、基因调控等关键作用。以往人们不了解个中差异时,只能以碰运气的方式反复尝试。
毛亚飞团队和孙强团队的这项工作,则试图把这些未知序列补全,探明猕猴与人类之间存在差异的原因,进而寻求构建更合适的生物医学模型、理解人类特殊性的路径。
孤雌生殖细胞系具有两套染色体遗传信息近乎纯合的特性,是构建参考基因组的理想材料。然而,构建孤雌细胞系涉及多个环节,每个环节都可能影响最终成功率。
结合脑智卓越中心非人灵长类研究平台的长期积累,孙强团队首先构建了一套食蟹猴孤雌生殖胚胎干细胞系。“对于每个实验步骤和操作环节,都必须保持高度的细致与耐心,以确保最终成功获得稳定的孤雌细胞系。”孙强强调。
2022年5月,毛亚飞正式加入上海交通大学,开展后续的基因组组装工作。当年下半年,还是大四本科生的张世龙专程从武汉来到上海,几乎把所有精力都放在开发一套好用的局部组装工具上。
“我们自主开发了一套‘基于特有k-mer标记的分型迭代替换局部组装工具’,能够把基因组中复杂区域的序列单独提取出来并进行优化和拼接。”论文第一作者、上海交通大学博士生张世龙告诉《中国科学报》。
利用这个工具,团队成功解决了现有组装软件未能或错误组装上百个复杂结构区域的问题,构建了包括Y染色体在内的食蟹猴T2T基因组。无论是基因组的完整度还是碱基的准确性,其均与目前质量最高的人类T2T基因组相当——每100万个碱基中有一个错误位点。这是首个非人灵长类完整参考基因组,为深入理解复杂基因组区域提供了重要材料。
为进一步探明结构变异是如何在演化中固定下来的,团队以最为复杂的大脑为对象进行了探索。结果显示,在灵长类脑演化过程中,相关结构变异可能影响了超过400个基因在不同脑细胞类群中的表达差异,FOLH1基因是其中之一。
“我们发现,在人类与猕猴属的演化过程中,人类的FOLH1基因由于重复事件引起染色质三维结构的变化,进而改变了该基因的细胞类群表达模式。同时,由于调控区关键片段丢失,与猕猴FOLH1直系同源的FOLH1B在脑内无法表达而‘假基因化’。”张世龙说。
当把演化时间范围缩小,观察基因组结构变化如何影响同属内物种的变化时,同样得到了有趣的发现。研究团队在食蟹猴与恒河猴中鉴定得到240Mbp的物种间复杂结构差异区域、16.76Mbp的遗传分化区域,这些区域从不同维度引起了两个物种表型上的差异。
日益完整的“拼图”
“在生物制品药物研发蓬勃发展的当下,食蟹猴作为临床前研究中不可替代的非人灵长类实验动物,价值日益凸显。其完整基因组的成功组装为这一核心非人灵长类动物模型提供了一份高精度的‘分子说明书’,不仅为构建更精准的人类疾病动物模型奠定了分子基础,也为药物研发提供了可靠的基因组参考框架。”孙强指出,这项进展将显著提升药物安全性和有效性的评估精度,从而提高临床前研究成功率,并有望缩短药物研发周期,为行业带来深远影响。
“在符合国家生物安全及遗传资源管理政策框架下,我们公开了实验中所有相关数据和技术,希望更多人可以使用这套遗传资源。”毛亚飞补充说,“这项研究得到了国内外多个灵长类联盟的数据支持及技术分析方面的协助。”
日益丰富的数据资源,不断丰富着人们对人类演化及疾病发生的理解。对于非人灵长类,目前已经发布的T2T基因组涵盖了黑猩猩、倭黑猩猩、大猩猩、苏门答腊猩猩、婆罗洲猩猩、合趾猿和食蟹猴。包括毛亚飞、孙强等在内的国内外科学家,正在持续填补“演化医学”这一大“拼图”。
猕猴属完整基因组解析,只是毛亚飞和孙强两个团队合作的起点。“我们建立了非常好的长期合作机制,除了项目组间的沟通,两个课题组会每月开一次线下会议,分享各自的进展,再围绕相关科学问题进行交流。”毛亚飞表示,“在此过程中,学科的界限被打破,萌生出很多新的灵感。”
他们已着手下一步的研究。一方面向临床诊疗扩展,通过持续提高“拼图”技巧,分析更多灵长类T2T基因组,进一步探明复杂结构变异相关疾病的机理;另一方面聚焦科学问题,充分利用已有数据,结合功能实验揭示复杂结构基因调控的生物学意义。
“我们一直在思考,如何把自己的研究方向同实现国家战略需求与全球科技前沿对接,从演化中挖掘更多与人们生命健康息息相关的问题。”毛亚飞表示。
相关论文信息:
https://doi.org/10.1038/s41586-025-08596-w
《中国科学报》 (2025-03-13 第3版 综合)