人类注解基因组是指经过注解的人类基因组。如今,科学家们发现,即使已经正式完成了10年的人类注解基因组,但仍然含有难以填补的缺隙,在近期在线出版的《自然—方法学》(Nature Methods) 期刊上,研究人员描述了发现这些缺失片段的一种方法,更好地反映出人类遗传的多样性。
通过将基因组分解成小片段的高能量技术,越来越多的人类基因组被测出。为了将这些碎片基因组装配成染色体,用马赛克方式拼装起人类注解基因组是这个蓝图的关键。这种注解方法准确地解释了90%以上的人类基因组,然而仍然有部分区域没有被代表,而且没有获得任何与疾病有关的遗传信息。
为了测出这些失踪的区域,Evan Eichler和他的团队在碱基基因区域中,用了一套包含9个人全基因组的克隆片段,利用双脱氧测序法,他们测出了整个克隆片段或是其末端的基因组序列。在将这些序列与人类注解基因组序列结合在一起后,他们在基因组中鉴别出720个新插入位点。其中大约25%的新序列在欧洲、亚洲和非洲人群中表现出更多的变异。表明为了研究人类群体真正的多样性,需要更多的群体作为样本并进行分析。(来源:科学时报 王丹红)