来源:Quantitative Biology 发布时间:2023/5/12 11:18:01
选择字号:
QB | 前沿研究:基因表达与突变特征间的关系建模

论文标题:Modeling the relationship between gene expression and mutational signature(基因表达与突变特征间的关系建模)

期刊:Quantitative Biology

作者:Limin Jiang, Hui Yu, Yan Guo

发表时间:15 Mar 2023

DOI:10.15302/J-QB-022-0309

微信链接:点击此处阅读微信文章

体细胞突变被认为是肿瘤发生的主要直接原因之一,癌症患者基因组中不同突变特征(mutational signatures)贡献的组合可根据其突变基序(motif)来建模。从体细胞突变中计算突变特征,可深入了解肿瘤的发生,并可为早期预防提供策略。

近日,来自美国新墨西哥大学阿尔伯克基分校的Yan Guo教授团队提出假设,认为突变特征与基因表达之间存在潜在联系,并由此设计了一种基于RNA-seq数据的突变特征预测方法。该方法首次将基因表达与49个已确立的突变特征建立了关联。随后,在精度和AUC (Area-Under-Curve)均大于0.8的条件下,共获得了涵盖31种癌症类型的587个成功模型。最后,作者将这些所有成功的模型组装成了一个在线工具(EMSI),并作为MutEx分析的一个组件,相关工具可在innovebioinfo网站上进行访问。

全文概要

突变特征的概念最初于2013年提出,并在癌细胞系中得到了验证。随后,学者们开展了一系列研究探索突变特征与癌症间的关系。人类癌症基因组测序结果揭示了癌症与突变特征间存在因果关系。突变特征被誉为可以精确预测癌症与所暴露环境的关键工具。目前预测突变特征的方法是基于96-motif的方法,这些方法包括非负矩阵分解和最小二乘线性回归。但这些方法在稀疏突变(sparse mutations)的情况下其表现的性能不佳,因此有必要开发新的方法来从新的角度揭示突变特征。

本文作者开发了一种基于基因表达对突变特征预测的模型-EMSI (geneExpression and Mutational Signature Inference)(如图1)。结果发现一部分参考突变特征与基因表达具有相关性,并且该模型可用于稀疏突变的定位。

图1. EMSI框架图

作者首先收集了来自9096个样本,含56716个基因表达的数据集,并对这个数据集做单变量线性回归,以评估不同癌症类型中一个基因和一个突变特征间的相关性(图2)。继单变量线性回归之后,使用了三种机器学习方法(RF,XGBoost和SVM)来对突变特征和基因表达之间的关联进行建模。结果发现在利用这33种癌症类型的体细胞突变和基因表达数据来模拟突变特征和基因表达之间的关系时, SVM的AUC最高,另外两种方法(RF和XGBoost)性能一般。大约65%的已知突变特征可以通过每种癌症类型的基因表达来建模。这说明体细胞突变对基因表达改变的调节作用并不是普遍存在的,并不是每一个体细胞突变都能对基因表达产生影响。体细胞突变也可以异常调节non-coding RNA的表达。通过将non-coding RNA数据整合到数据集后,模型的整体适应性大幅提高,并且三种机器学习方法的性能变化取决于场景,如XGBoost在较大的样本量下表现更好,SVM则在较小的样本量下表现更好。

图2. EMSI模型结果分析及比较

最后作者分析了其模型的一些局限,如这项研究重点关注了单碱基替换突变特征,忽略了相对难以建模的双碱基替换特征和小的插入和删除特征;在验证时使用了一个现有的肺鳞状癌基因表达数据集来比较吸烟者和非吸烟者用于验证吸烟相关的突变特征,而非一个独立的数据集。但由于既包含体细胞突变又包含基因表达的数据集比较罕见,而EMSI模型在现有基因表达数据集中所表现的良好性能,证明了该模型可在未来RNA-seq研究中用于推断突变特征。

QB期刊介绍

Quantitative Biology (QB)期刊是由清华大学、北京大学、高教出版社联合创办的全英文学术期刊。QB主要刊登生物信息学、计算生物学、系统生物学、理论生物学和合成生物学的最新研究成果和前沿进展,并为 与计算机、数学、物理等交叉研究领域打造一个学术水平高、可读性强、具有全球影响力的交叉学科期刊品牌。

QB期刊目前已被ESCI, Scopus, CSCD等国内外重要数据库收录。Citescore2021=4.6,2023年将获得第一个影响因子(IF)

《前沿》系列英文学术期刊

由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、 、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。

中国学术前沿期刊网

http://journal.hep.com.cn

特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
打印 发E-mail给:
相关新闻 相关论文
图片新闻
大规模调查揭示万余种食物相关微生物 科学家揭示超铁元素核合成新机制
6000年古迹揭示石器时代建筑者的工程智慧 森林可持续经营:给陆地碳汇扩容
>>更多
一周新闻排行
编辑部推荐博文
Baidu
map