本报讯据《自然》报道,世界上最大、最完整的人类基因组数据库11月30日上线。英国生物银行当天发布了50万名英国志愿者的全基因组序列。世界各地的研究人员都可以申请访问这些数据,并利用它们探索与健康和疾病相关的遗传基础。
2021年,英国生物银行曾公开20万名英国志愿者的全基因组数据,供全世界科学家研究使用。这项耗资2亿英镑的研究由生物医学研究基金惠康基金会、英国政府以及几家制药公司资助,作为回报,这些公司在数据对外发布前9个月就能获得数据。
此前,英国生物银行公布的遗传信息包括整个外显子组。每个外显子组占基因组的2%,负责编码蛋白质以及分布在基因组中的85万个常见的单碱基DNA变异。后者的信息为将健康和基因联系起来的全基因组关联研究(GWAS)提供了支持。
但是,当研究人员寻找遗传与疾病或其他性状之间的关联时,大多数“位点”出现在基因组的非编码区域,这些区域在外显子组序列中缺失,并且在现有的全基因组数据中仅以低分辨率覆盖。
英国埃克塞特大学的人类遗传学家Michael Weedon说,全基因组还能帮助研究人员发现非常罕见的突变,这些突变往往比全基因组数据中包含的常见变异对某个性状的影响大。
事实已经证明了这一点。在11月20日公布的一篇预印本文章中,Weedon团队挖掘了英国生物银行公开的首批20万个完整基因组数据,发现了29种罕见的DNA变异,这些变异与高达7厘米的身高差异有关,而且在以前的基因研究中从未被发现。
一项由美国政府资助的名为“我们所有人”的研究,计划最终公布100万人或更多美国人的全基因组和健康数据。此前,这项工作已经公布了25万个基因组,但直到今年8月才开始接受非美国研究人员的数据研究申请。
根据英国生物银行之前公开的20万个基因组数据的情况,芬兰赫尔辛基大学的统计遗传学家Andrea Ganna指出,完整的基因组序列可能会帮助研究人员更准确地绘制出疾病与结构变异之间的联系。(辛雨)
《中国科学报》 (2023-12-01 第1版 要闻)