近日,浙江大学生命演化研究中心张国捷课题组与深圳农业基因组研究所阮珏团队,以及华大 研究院合作,自主完成了首个人类“端粒到端粒”二倍体完整参考基因组“CN1”,相关成果以封面论文形式发表于《细胞研究》,为精准医学研究及应用提供重要参考数据支撑。
“端粒位于人类染色体的两端,从端粒到端粒的无间隙测序,意味着获得了每条染色体的完整遗传信息。”张国捷说。
2022年,“端粒到端粒(T2T)”国际研究联盟基于细胞系构建了第一个完整的从头到尾无间隙人类参考基因组T2T-CHM13,填补了最后缺失的约2亿碱基对的测序。
“但是,T2T-CHM13基因组在来源上不属于生物学上的正常个体,并不具有从父母遗传获得的两套存在差异的基因组。这一工作离真正构建二倍体人类完整基因组的目标还有一步之差。”张国捷表示。
在这项研究中,科研人员基于课题组此前在二倍体基因组和复杂基因组组装方面积累的经验,通过开发算法,以个体的父本和母本数据作为参考系,能够完美地将不同染色体上的数据区分开,将人的46条染色体的数据分别组装出来。此后,对因为数据过于复杂而仍然存在的69个缺口进行了手工补洞。最终,获得了健康个体完整的二倍体基因组。
研究显示,与现有参考序列相比,利用该完整基因组作为东亚人群遗传学研究的参考序列,可以提高东亚人群的序列比对并降低错误率,对单碱基多态性的检测准确率也会更高。该完整图谱的绘制,为我国开展精准医疗研究提供了更准确的参考基因组。(来源:中国科学报 胡珉琦)
相关论文信息:https://doi.org/10.1038/s41422-023-00849-5