免疫T细胞是人体免疫系统消灭肿瘤细胞的主要执行细胞。免疫T细胞对癌细胞的攻击始于T细胞对肿瘤抗原(antigen)的特异性识别。肿瘤抗原在人体的癌细胞被免疫T细胞识别的过程中起着非常重要的作用。肿瘤新生抗原(neoantigen)是肿瘤抗原的一类。他们来自于肿瘤的体细胞突变,是引发T细胞反应的主要成分。结合了特异的新抗原之后,免疫T细胞能够发挥清除肿瘤的功能。
美国德州大学西南医学中心(UT Southwestern)定量生物研究中心(QBRC)王涛课题组建立了一套人工智能模型(pMTnet),应用于肿瘤新生抗原和免疫T细胞受体(T cell receptor)结合特异性的预测。
2021年9月23日,该工作发表于Nature Machine Intelligence。通讯作者是助理教授、博士生导师王涛博士,共同第一作者是王涛课题组博士生卢天时和张泽。
文章共同第一作者卢天时介绍:“对于免疫系统来说,肿瘤新生抗原是癌细胞和非癌细胞的最大区别之一。如果我们能识别出与T细胞相互作用从而引发免疫系统反应的肿瘤新生抗原,那我们就可以利用这样的抗原来通过多种途径来治疗癌症。” 然而人体中产生的肿瘤新生抗原由于目前尚未清楚的原因,只有一小部分可以被免疫T细胞识别。并且免疫T细胞对于肿瘤新生抗原的结合也有着极强的序列特异性。但是目前检测肿瘤新抗原和T细胞识别特异性的实验手段(如MHC 四聚体检测,tetramer assay)技术要求较高,成本高昂且耗时极长。
鉴于此,王涛课题组建立了一套深度学习模型,pMTnet,用于预测肿瘤新生抗原和免疫T细胞的相互结合的特异性。pMT的训练和预测是基于T细胞-肿瘤细胞结合时相互识别的抗原序列,主要组织相容复合体(MHC)的序列,和T细胞受体的序列,这三项数据。pMTnet应用了迁移学习(transfer-learning)完成了深度学习的模型的训练。
图一 pMTnet模型的结构
课题组从30项之前发表的研究数据集中收集了619对被实验验证的抗原和T细胞相互结合的数据作为独立的测试集。pMTnet模型的受试者工作特征曲线(ROC curve)的去线下面积(AUC)达到了0.827的高精确度。pMTnet与其他的类似的生物信息学预测模型(TCRex,TCRGP,netTCR)相比,在预测精确度上有着明显的提高。
本文作者将pMTnet应用于研究四种有强免疫效应(immunogenic)的人体癌症,包括皮肤黑色素瘤(skin cutaneous melanoma),肾细胞癌(renal cell carcinoma),肺腺癌(lung adenocarcinoma),鳞状细胞肺癌(lung squamous carcinoma)。他们发现不同种类的抗原的免疫效应存在着明显的差异。其中肿瘤新生抗原的免疫效应强于自身抗原(self antigen);而一种只存在于肾细胞癌的内源性逆转录病毒(human endogenous retrovirus) 的免疫效应强于肿瘤新生抗原和自身抗原。接下来本文作者利用pMTnet预测了可以和肿瘤抗原结合的免疫T细胞。他们发现pMTnet预测的病人体内与肿瘤抗原高概率相结合的T细胞,与没有结合的T细胞相比,有着明显的更强的扩增的现象。通常情况下,成功识别抗原并引起下游免疫信号应答的T细胞会出现类似的高度扩增的现象。这项结果也从另外一个角度,进一步验证了pMTnet的精确性。
图二 肿瘤新生抗原,自身抗原,内源性逆转录病毒的免疫效应的比较
王涛课题组进一步研究了肿瘤新生抗原和免疫T细胞之间的相互作用对于肿瘤预后和免疫疗法(immunotherapy)的治疗效果的影响。他们将pMTnet应用于4个有预后(prognosis)信息的癌组织数据集,3个经过免疫治疗的皮肤黑细胞瘤数据集,和1个经过免疫治疗的胃癌细胞集。他们发现当pMTnet预测的能够结合大量扩增的T细胞的肿瘤新生抗原来自于肿瘤的主干突变(truncal mutation)的时候,病人都表现出更好的预后和免疫治疗效果。
预测和判断肿瘤新生抗原与T细胞的特异性结合是现代免疫学中的一个尚未被解决的重要问题。王涛课题组希望在这篇文章的基础上,继续提高pMTnet的预测精度,并希望将pMTnet作为一项平台技术,应用在跟肿瘤免疫治疗有关的临床应用上。这一深度学习算法将极大地推动基于肿瘤病人个体遗传学特征的精准免疫疗法,特别是以癌细胞为靶点的T细胞疗法的成熟和进步。(来源:科学网)
相关论文信息:https://doi.org/10.1038/s42256-021-00383-2