中国科学院南海海洋研究所研究员林强团队在海洋生物物种分布模型构建中如何选择交叉验证方法取得新的研究进展。相关成果9月17日在线发表于《生态学》(Ecography)。
基于随机交叉验证和空间交叉验证方法的模型预测能力和变量重要性。研究团队供图
?
在全球生物多样性持续丧失的背景下,准确评估生物多样性的空间分布模式对于制定有效的保护和管理策略至关重要。物种分布模型(SDMs)已成为评估生物多样性的一种重要工具,它通过分析物种分布数据与生态因子之间的关系来预测目标物种的适宜栖息地分布。
在模型构建过程中,交叉验证是评估模型预测性能的关键步骤。交叉验证通过在不同数据集上反复训练和验证模型,帮助研究人员选择最佳模型参数。虽然随机交叉验证方法是最常见的选择,但最近一些研究者提出了空间交叉验证方法,以解决随机交叉验证忽视空间自相关性的问题。
该研究在国家自然科学基金项目、国家重点研发计划项目等的联合资助下,通过随机交叉验证与空间交叉验证方法,以海洋近海典型鱼类—羊鱼(Actinopteri:Syngnathiformes:Mullidae)为对象进行模型的参数优化和性能评估。
该研究发现,两种交叉验证方法在95%的物种中得出了不同的最佳模型参数组合,并且在预测当前和未来的栖息地分布方面存在显著差异。随机交叉验证方法在预测性能上可能存在过高估计的风险,而空间交叉验证方法倾向于保守。
该研究首次系统性地比较了随机交叉验证与空间交叉验证方法对SDMs结果的影响,揭示了选择交叉验证方法对SDMs预测性能和结果的重要影响,为生物多样性评估研究提供了新的视角。(来源:中国科学报 朱汉斌 黄红伟)
相关论文信息:https://doi.org/10.1111/ecog.07354