8月6日,《细胞报告》(Cell Reports)发表了广东工业大学生物医药学院教授林章凛团队与华南理工大学生物学院副教授杨晓锋团队合作的最新研究成果。他们在人工智能的生物学应用方面取得重要进展,成功构建一种新型的人工智能框架——DeepMineLys,并发现迄今为止在人类微生物组中最有效的溶菌酶。
DeepMineLys的示意图。研究团队供图
?
论文第一作者、华南理工大学生物科学与工程学院2018级博士生付一然表示,作为概念验证,该研究使用了人类微生物宏基因组数据,从中识别和挖掘有治疗耐药菌潜力的溶菌酶,它标志着人工智能在生物学领域应用的一个重要突破。
“DeepMineLys不仅能够挖掘溶菌酶,它具备蛋白质挖掘的广泛应用潜力,为未来的生物学研究提供了一个有力的工具。”论文共同通讯作者林章凛表示,DeepMineLys的成功得益于构建了涵盖广泛噬菌体溶菌酶的全面训练数据集,集成了TAPE等先进算法和编码技术,采用了三层卷积神经网络和双轨架构等几个关键因素,极大地提升了模型的预测性能。
在性能评估方面,研究团队使用了精确度、召回率和F1分数等多种指标,在独立数据集的验证中,DeepMineLys的F1分数达到84.00%,相比现有方法提升了20.84%。他们成功从三个不同的人类微生物宏基因组数据集中识别出一千多种新的溶菌酶(相似度小于60%)。
研究团队还从前100个候选溶菌酶随机选择了16个进行了实验验证,其中11个被证实具有活性,最强的一个溶菌酶的活性甚至比传统溶菌酶高出6.2倍,成为迄今为止在人类微生物组中发现的最有效的溶菌酶。同等重要的是,研究团队指出了人工智能用于生物学问题的若干限制和拟待解决的关键问题。
一是,生物问题涉及的可能数据库要远大于物理问题的数据库。比如,人口目前的总数只有80亿左右,所以人脸识别是相对容易的;但单个蛋白质的三突变株数就高达千亿。二是,目前人工智能技术的验证基本局限于内推,而生物学问题更需要外推能力,因此使用独立数据集验证更显重要。三是,大部分人工智能的生物学研究目前缺乏实验验证。
“这些问题的解决,将极大推动人工智能在生物学领域的应用。”林章凛说。(来源:中国科学报 朱汉斌)
相关论文信息:https://doi.org/10.1016/j.celrep.2024.114583