中国科学技术大学
与医学部教授瞿昆课题组系统性评估了7种在测序数据中鉴定染色体外环状DNA(eccDNA)的分析算法及7种不同实验建库方法的性能和差异,为进一步提升eccDNA检测方法奠定基础。相关研究日前成果发表于《自然-通讯》。
eccDNA作为一种在真核细胞内广泛存在的环状DNA,在肿瘤发生发展过程具有重要作用。它参与了癌基因的扩增、基因表达的调控,以及肿瘤内部异质性的形成。因此,对eccDNA的深入研究可以推动人们对肿瘤发病机制的理解,也为靶向药物的开发提供新的方向。
目前,已有多种测序建库方法和生物信息学算法用于eccDNA的鉴定,但由于eccDNA片段的大小多样,并且来自不同基因组区域,导致实验和分析结果在不同方法中存在较大差异,这给研究人员选择最适的分析算法和实验方法带来挑战。同时,现有的评估通常只关注准确性或计算需求等单一因素,并且往往基于过于简化的模拟数据,难以反映真实测序数据的复杂性。因此,各类实验方法在检测eccDNA效率方面的显著差异,更加凸显出系统性评估这些方法的重要性。
研究结果表明,在各类分析算法中,Circle-Map和Circle_finder算法在短读长测序数据中检测eccDNA具有更高的效率。然而,Circle_finder容易生成冗余结果,即在相同eccDNA的鉴定上出现重复。CReSIL算法在长读长测序数据的eccDNA检测中表现最佳;在实验方法方面,Circle-Seq-LR特别适用于检测长度超过10 kb且具有拷贝数扩增的eccDNA 。此外,不同实验方法检测到的eccDNA在长度、癌基因组成和基因重复元件的包含等方面展现出显著的异质性。
研究人员介绍,该研究不仅深入分析了各种检测eccDNA的分析算法和实验方法的优势和局限性,还在GitHub平台上提供了完整的分析流程、代码和模拟数据集,这有助于研究人员根据自身数据特点选择最优的分析流程,为进一步提升eccDNA检测方法奠定了参考基础。(来源:中国科学报 王敏)
相关论文信息:https://www.nature.com/articles/s41467-024-53496-8