现代人类起源于非洲,相比于其他大陆,现代人类在非洲居住时间最长,并且在迁徙,融合和对环境适应性进化过程中形成了超过3000个民族和2100种语言。目前非洲人群不仅具有世界上最丰富的遗传多样性和表型多样性,且现代人类近1/3的语言都在非洲。
然而,目前的遗传学和基因组学研究中,只有不到3%的样本来自非洲。研究非洲人群遗传多样性,不仅能加深我们对现代人类起源、早期遗传结构及适应性进化的理解,也为健康和诊断研究提供丰富的新遗传信息。
复旦大学与宾夕法尼亚大学一支国际科学团队历时7年,对极具代表性的12个非洲群体进行全基因组测序分析,揭示了非洲人群的复杂演化历程与对环境的适应性进化。3月3日,相关研究以封面文章形式在线发表于《细胞》。
《细胞》封面。复旦大学供图
部分群体遗传多态性低
基于人类参考基因组,研究人员发现3200万个单核苷酸多态性位点(SNP),其中约530万个位点是在之前没有发现的。这些新发现的突变广泛的存在于增强子、启动子以及转录因子结合位点等基因组功能区域。
研究发现,12个非洲民族(这些民族地理分布广泛,以种植农业、打猎收集和游牧等不同方式为生,且涵盖非洲四个主要的语系)的平均SNP个数和遗传多态性(遗传多样性)均具有显著的差异。以打猎和收集为生的桑人和热带雨林小矮人的SNP数量和遗传多态性最高,而另一些等民族的遗传多态性则最低。
“大量非洲外人群的基因渗入,以及严重的群体瓶颈是造成部分非洲人群体遗传多态性低的主要原因。”该论文第一作者、复旦大学 学院和人类表型组研究院研究员樊少华说,“例如,生活在坦桑尼亚的Hadza和埃塞俄比亚的Chabu群体,人口数量已经少于1000人。”
发现“最早分歧”
研究中,科学家利用邻近距离法对本研究中的12个民族,和来自“千人基因组计划”的欧洲人群(CEU)、北方汉族人群(CHB)、托斯卡纳人群(TSI)以及来自“西蒙斯基因组多态性研究计划”中的巴布亚人群(Papuan)进行了系统计划分析,结果显示现代桑人的遗传学祖先是现代人类最早发生分歧的一支,随后发生分歧的是热带雨林小矮人的祖先。现代桑人和小矮人祖先的早期分歧的现象也被主成分分析(PCA)和ADMIXTURE(种群结构分析)所支持。
研究发现,不同民族在系统进化树的聚类模式与他们目前所处的地理环境显著相关,这说明地理环境是制约不同民族间基因交流的重要因素。
当然,由于存在基因交流和遗传重组等因素的影响,上述邻近距离法、主成分分析和ADMIXTURE无法用来构建现代人类早期遗传结构。而当科学家将这些因素全部纳入到复杂模型中进行计算分析时却进一步发现:现代桑人和小矮人的共同祖先,而不是现代桑人的祖先,是现代人类最早分歧的一支。
“由此我们推断,现代人类的分歧发生在28万年前,这与之前的考古和基于古DNA检测推断的时间一致。”樊少华说。
同时,科学家们利用PCA和ADMIXTURE分析,在坦桑尼亚目前使用Kheosan语的两个族群基因组中,发现了桑人相关的祖源成分。虽然仅有南部非洲的桑人以及东非坦桑尼亚的族群说这种语言,但本项研究利用PCA分析,将全球之前已发表的来自不同地区的55个古非洲人样本投射到现代非洲人样本中后发现,大量的来自不同地区的古非洲人样本投射位于桑人和东非的这两个人群之间。
该结果提示,Khoesan语系在非洲的地域分布曾经很广,遍及整个非洲, 但可能受到班图大迁徙的影响,目前说Koesan语的古非洲人群大都灭绝了。
全面绘制进化图谱
研究中,科学家结合正选择分析算法、功能基因组学手段及大规模全基因组关联分析,对12个非洲民族特异的适应性进化进行研究,全面绘制了非洲人群适应性进化图谱。
肤色多样性是现代人类对于不同维度地区适应性进化的一个重要标志。桑人是非洲人群中肤色最浅的民族,但是研究对于桑人浅肤色的遗传学基础仍然缺乏了解。
利用功能基因组学等方法,本研究发现一个基因内部增强子的突变(rs77665059-C)是影响桑人浅肤色的决定性因素。该增强子仅在黑色素细胞中特异活跃,如果沉默该增强子会降低该基因表达量和黑色素和合成。进一步研究发现,rs77665059-C在桑人部分人群中频率超过了80%;但是在其它非洲(平均频率14%)和非洲外民族中(平均频率3%)频率却非常低。研究人员发现,rs77665059-C突变导致该基因增强子在黑色素瘤细胞系中活性降低,由此与桑人的浅肤色表型显著相关,这为桑人浅肤色进化研究提出了新的遗传学解释。(来源:中国科学报 张双虎 李晨阳)
相关论文信息:https://doi.org/10.1016/j.cell.2023.01.042