|
|
新AI模型可大幅提高化合物-蛋白质相互作用预测可靠性 |
|
中国科学院上海药物研究所研究员郑明月,副研究员张素林、李叙潼,提出了基于知识图谱的人工智能计算模型PertKGE,并以数据驱动的形式从微扰转录组数据中解耦出化合物-蛋白质相互作用(CPI)。9月19日,相关研究发表于《细胞基因组学》。
对化合物和蛋白质之间的相互作用进行建模,是药物发现的基础。目前,研究人员可以利用不同的生物数据,从多种研究视角构建化合物-蛋白质相互作图谱。其中,微扰转录组学联系起了化合物和组学数据之间的联系,提供了化合物微扰受试体(单细胞、细胞系、病人)后产生的直观微扰结果,为解耦CPI提供了全新的视角。然而,CPI通常不会直接反应在差异表达基因上,为微扰转录组数据的分析带来了挑战。
基于微扰组学分析中的因果推断模型以及知识图谱在药物发现中的广泛应用,研究人员提出了PertKGE模型,从因果视角构建新型的生物知识图谱。模型包含原因(化合物与受试体中的特定靶标发生CPI)、过程(生物系统中多层级的调控事件对CPI信号进行放大)、结果(微扰结果以差异表达基因的形式被观测)这3个组成部分。
在此基础上,研究人员结合知识图谱嵌入技术建模因果链接,从差异表达基因中解耦CPI。广泛的计算实验表明,PertKGE在化合物和靶标的冷启动场景中均取得了最好的CPI预测性能,并且缓解了CPI数据集中代表性偏差对模型学习的影响,从而大幅提高了预测的可靠性。
PertKGE的工作流。图片来源于《细胞基因组学》
进一步地,研究团队将PertKGE分别整合进基于表型靶标的药物发现流程中,发现了TNKS抑制剂K-756的新靶标胞外核苷酸焦磷酸酶/磷酸二酯酶1(ENPP1),为其独特的抗肿瘤免疫效应提供了分子层面的机制解释。此外,研究团队以10.8%的高命中率,为治疗结直肠癌和胰腺癌的新型靶标人醛脱氢酶1家族成员B1(ALDH1B1)筛选到了5个具有全新骨架的苗头化合物。
研究团队介绍,将CPI预测任务对应到药物发现的真实场景中,计算模拟和实验验证均证明了PertKGE在药物发现流程中的作用,为CPI图谱的构建和推理提供了一种全新的策略。
相关论文信息:https://doi.org/10.1016/j.xgen.2024.100655
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。