|
|
QB | 人类健康表型相关的微生物组分类单元与宿主表示学习研究 |
|
论文标题:Reorganizing heterogeneous information from host–microbe interaction reveals innate associations among samples
期刊:Quantitative Biology
作者:Hongfei Cui
发表时间:29 November 2023
DOI: https://doi.org/10.1002/qub2.25
微信链接:点击此处阅读微信文章
肠道微生物对人体健康至关重要,同时也可能受到宿主健康状态、日常行为或饮食习惯的影响。16S rRNA测序是了解微生物群落结构和分析微生物组样本间差异的重要方法之一,从中获得的分类操作单元(operational taxonomic units,OTU)丰度谱可以帮助我们理解不同微生物群落之间的相似性与差异。在以往的研究中,OTU丰度向量往往直接被用于代表微生物群落进行下一步的机器学习建模,其中每一个OTU都被当做完全等价的特征,忽略了其本身的生物学内涵。一些研究基于OTU丰度谱构建共出现网络,试图理解OTU背后的生物功能,但由于OTU丰度谱的稀疏性和共出现关系的相关性门槛,导致实际能利用共出现网络进行研究的OTU比例往往极其稀少,甚至小于5%。除了“物种标签”本身,16S rRNA的OTU丰度谱到底能为我们提供多少信息?该研究试图对此问题进行探索解答。
近期,北京科技大学崔鸿飞在Quantitative Biology期刊发表了一篇题目名为“Reorganizing heterogeneous information from host–microbe interaction reveals innate associations among samples”的研究性论文,文章提出了一种将OTU丰度谱重组成宿主-微生物异构网络,通过异构图嵌入表示来研究群落中微生物的功能特征的方法,帮助深入理解宿主与微生物之间的生物学关联。
全文概要
作者利用AGP项目中超过10,000个样本和20,000个OTU,直接将OTU在样本中的丰度作为一种相互作用信息,构建了样本-微生物相互作用网络,提出一种基于异构图嵌入特征的数据分析方法(图1),对宿主和微生物功能空间进行可视化研究,并构建宿主表型预测深度学习模型IMETA,用于对样本的表型进行预测,可以获得稳定的优异性能。
图1 本文整体研究框架
该方法可以避免传统共出现网络方法中绝大多数OTU无法被研究的问题,有效地对数据集里的样本和微生物进行可靠的生物功能分析。在本文建构的OTU空间中,虽然网络表示学习的过程中没有任何显性的微生物功能信息,但嵌入结果依然从微生物在不同宿主的丰度变化中抓取了丰富的生物学语义特征。微生物根据其功能和生态学特性而非物种特性,聚集于空间中(图2)。
图2 OTU按功能聚集的示例:(A)该区域微生物普遍来自土壤和叶际,常常在鲜切蔬菜中被检测到。(B)该区域的微生物往往源自乳制品、鱼类和肉类等蛋白质来源食物。(C)该区域的微生物通常与纤维素和糖的消化吸收有关。(D)该区域的微生物主要与污染物的降解有关,常被用于塑料、石油、抗生素污染等的生物修复中。
针对样本空间,作者定义了“局部聚集系数(Local Aggregation Index,LAI)”,衡量宿主表型是否可以显著影响微生物群落结构的整体变化,LAI值越低,说明局部聚集性越强,也就意味着该亚表型倾向于对微生物群落产生的影响方向较为一致。作者对三大类疾病相关表型进行了分析,包括21种身体疾病表型,12种神经系统疾病表型,以及14种过敏表型,发现大多数疾病的“健康”亚表型对应的样本往往局部聚集性更强,而“疾病状态”亚表型出现样本局部聚集的情况则非常少,这说明健康人群的肠道微生物结构,在个体之间的一致性比患特定疾病人群的肠道微生物结构一致性强。尽管如此,仍有一些疾病表现出了对不同个体肠道微生物结构影响方向的一致性(表1),它们倾向于与胃肠道、代谢和神经系统相关,提示了特定疾病可能与肠道的特定失调机制相关。
表1 具有显著局部聚集性的疾病亚表型
此外,本研究建立了一个整合OTU和样本嵌入向量的深度学习模型IMETA(Integrated Model of Embedded Taxonomies and Abundance),该模型同时将样本的OTU丰度信息纳入进来,对样本的表型进行分类。与仅使用OTU丰度的基线方法相比,IMETA可以获得优越而稳定的性能,且与传统模型相比,IMETA在大规模数据上速度更快,并具有更佳的可解释性。
该研究提出的方法可以为更深入地理解OTU的功能与样本表型背后的生物机制、揭示样本与表型之间的潜在关联方面提供灵感。
QB期刊介绍
Quantitative Biology (QB)期刊是由清华大学、北京大学、高教出版社联合创办的全英文学术期刊。QB主要刊登生物信息学、计算生物学、系统生物学、理论生物学和合成生物学的最新研究成果和前沿进展,并为
与计算机、数学、物理等交叉研究领域打造一个学术水平高、可读性强、具有全球影响力的交叉学科期刊品牌。
QB期刊目前已被ESCI, Scopus, CSCD等国内外重要数据库收录。Citescore2021=4.6,2023年将获得第一个影响因子(IF)。
《前沿》系列英文学术期刊
由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、
、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。
中国学术前沿期刊网
http://journal.hep.com.cn
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。