|
|
FCSE | 前沿研究:基于量子化学和定量结构—性质关系方法的分子性质预测计算工具箱 |
|
论文标题:A computational toolbox for molecular property prediction based on quantum mechanics and quantitative structure-property relationship(基于量子化学和定量结构—性质关系方法的分子性质预测计算工具箱)
期刊:Frontiers of Chemical Science and Engineering
作者:Qilei Liu, Yinke Jiang, Lei Zhang, Jian Du
发表时间:15 Feb 2022
DOI:10.1007/s11705-021-2060-z
微信链接:点击此处阅读微信文章
研究背景及意义
分子性质预测在化工产品的概念设计与生产制造过程中发挥着重要作用。据估计,化学空间中分子数量达到1060个。如此庞大数量的化学空间无法通过实验方法一一进行性质的测量。因此,基于模型的分子性质预测方法受到了学者们的广泛关注,其中包括定量结构—性质关系方法和分子模拟方法。然而,这两种方法均有各自的缺陷,例如定量结构—性质关系方法需要大量的(伪)实验数据进行模型参数的回归。虽然分子模拟方法可以从第一性原理出发,无需大量实验数据回归模型参数即可预测分子性质,但其计算时间成本往往要高出定量结构—性质关系方法几个数量级。针对上述问题,本文提出了一个集成量子化学与定量结构—性质关系的分子性质预测框架,该框架通过建立分子数据库、量子化学计算与定量结构—性质关系开发三个步骤,实现了分子性质快速预测目标,并将其编译为一个名叫“QM-QSPR”工具包。本文通过反应热与固—液相平衡性质预测这两个算例,验证该框架的可行性与有效性。
研究内容及主要结论
通过数据库建立、量子化学计算、定量结构—性质关系开发三个步骤,提出了一个分子性质预测框架(图1);分子性质预测框架编译为“QM-QSPR”工具包(图2);建立了适用于预测小分子药物与有机溶剂热力学性质的含2859个分子的数据库,通过量子化学方法可定量预测标准状态下的气/液相生成焓、气/液相熵、气/液相生成吉布斯自由能、蒸发焓、蒸发熵、蒸发吉布斯自由能,并通过定量结构—性质关系方法中的基团贡献法拟合量子化学预测得到的伪实验数据,实现快速预测热力学性质目标,以反应热为例对所提模型进行了验证;建立了适用于预测有机溶剂气—液、液—液、固—液相平衡性质的含1120个分子的数据库,通过量子化学方法可定量预测活度系数性质,并通过定量结构—性质关系方法中的基于机器学习的原子贡献法拟合量子化学预测得到的伪实验数据,实现快速预测相平衡性质目标,以固—液相平衡降温结晶过程为例对所提模型进行了验证。得到了以下主要结论:
(1)图3表明,量子化学方法在预测标准状态下的气相生成焓、气相熵、气相生成吉布斯自由能性质时具有较高的预测准确度,与实验测量结果非常接近。但量子化学方法中现有的一些计算方法在预测标准状态下的液相生成焓、液相熵、液相生成吉布斯自由能、蒸发焓、蒸发熵、蒸发吉布斯自由能时还是存在一定的误差,仍需进一步改进。
(2)通过量子化学方法,可为定量结构—性质关系方法提供大量分子性质数据。图4表明,针对标准状态下的气相生成焓、气相熵、气相生成吉布斯自由能,传统基于实验数据回归的基团贡献法中含基团参数的基团个数远小于由量子化学提供的伪实验数据回归的结果,说明耦合量子化学方法可提高定量结构—性质关系方法的适用范围。另外,定量结构—性质关系方法可降低量子化学方法计算时间成本。
(3)通过本文提出的“QM-QSPR”工具包,可快速预测反应热性质(图5)。以合成阿司匹林为例,量子化学与定量结构—性质关系方法的结合可弥补实验数据缺失和传统结构—性质关系方法参数缺失的不足,成功预测得到合成阿司匹林反应的标准气相反应热。
(4)通过本文提出的“QM-QSPR”工具包,可快速预测固—液相平衡性质(图6)。以布洛芬降温结晶为例,量子化学与定量结构—性质关系方法的结合可快速预测活度系数与固—液相平衡降温结晶曲线,且与实验结果接近(图7)。
图1 分子性质预测框架
图2 “QM-QSPR”工具包工作流程示意图
图3 量子化学方法在预测标准状态下的气相生成焓、气相熵、气相生成吉布斯自由能性质时的准确度
图4 传统基团贡献法(ICAS中MG1)与本文基团贡献法(MG1-RDKit)含基团参数的基团个数对比
图5 基于“QM-QSPR”工具包预测合成阿司匹林反应热的工作示意图
图6 “QM-QSPR”工具包预测布洛芬固—液相平衡降温结晶曲线的工作示意图
图7 “QM-QSPR”计算布洛芬固—液相平衡降温结晶曲线结果与实验结果对比
研究亮点
建立了结合量子化学与定量结构—性质关系方法的分子性质预测框架,并编译为“QM-QSPR”工具包。该框架可用于预测焓、熵、吉布斯自由能相关性质以及相平衡相关性质。量子化学与定量结构—性质关系方法优势互补。相比于基于实验数据的定量结构—性质关系方法,本文框架通过量子化学方法提供的伪实验数据,大幅提高了定量结构—性质关系方法的适用范围。相对于单独使用量子化学方法,本文框架通过定量结构—性质关系方法加快了量子化学方法计算进程。
相关成果以“A computational toolbox for molecular property prediction based on quantum mechanics and quantitative structure-property relationship”为题,已发表在Frontiers of Chemical Science and Engineering上(DOI: 10.1007/s11705-021-2060-z)。
作者和团队介绍
刘奇磊(第一作者),博士,大连理工大学化工学院助理研究员,主要从事基于深度学习与量子化学的分子设计与合成的应用基础研究,旨在高通量智能化设计新型分子产品、高效精准揭示分子构效关系;在AIChE J.、Chem. Eng. Sci.、Ind. Eng. Chem. Res. 等国内外学术刊物发表SCI收录论文10余篇。
张磊(通讯作者),博士,大连理工大学化工学院副教授,主要从事化工产品设计(包括溶剂、聚合物、药物、香精等)、过程模拟与优化等应用基础研究,旨在开发低成本高性能精细化学品、揭示分子构效关系、模拟生产流程;在Annu. Rev. Chem. Biomol. Eng.、Curr. Opin. Chem. Eng.、AIChE J.、Chem. Eng. Sci.等国内外学术刊物发表SCI收录论文20余篇。
《前沿》系列英文学术期刊
由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、 、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。
中国学术前沿期刊网
http://journal.hep.com.cn
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。