中国科学院南海海洋研究所(以下简称南海海洋所)仪器中心联合山东科技大学,在海洋模式并行异构加速研究方面取得新进展,成功开发出基于OpenACC的GPU加速并行POM(Princeton Ocean Model)模式。近日,相关成果发表于《环境建模与软件》(Environmental Modelling & Software)。
“该项技术为高精度海洋数值模拟与实时预报提供了一种新的高效能计算解决方案。”论文通讯作者、南海海洋所高级工程师周巍表示,随着海洋建模对空间分辨率与物理过程复杂度的双重需求不断提升,传统串行POM的计算效率已难以满足实际应用需求。
该研究相较于原始POM代码的优势。研究团队供图
?
研究团队通过并行计算区域选择、数据传输优化和计算模式调整等多维度优化策略,对经典POM代码实施系统性重构。实测数据显示,该并行版本在不同时空尺度的模拟实验中均实现45倍加速比,较传统并行方法展现出显著优势。
研究进一步揭示了GPU加速性能的关键制约因素——通过引入Nsight Systems性能分析工具,团队发现数据传输环节存在显著瓶颈,进而针对性优化了CPU-GPU间的数据传输策略,成功将冗余数据拷贝降低37.2%。
此外,研究对比论证了OpenACC相较于其他并行方案的技术特性,其独特的指令制导并行模式在保证代码可维护性与跨平台移植性的同时,大幅降低了并行化改造成本,使得非专业开发人员也能快速构建高效并行计算环境。
研究团队下一阶段将重点推进三方面工作:深化POM代码架构优化,构建多GPU协同计算架构;拓展该并行系统在强非线性海洋过程的模拟应用;开展跨平台硬件适配测试,全面评估OpenACC方案的扩展性与普适性。
不同分辨率下串行和并行实现的运行时间。研究团队供图
?
上述研究得到中国科学院仪器设备功能开发技术创新项目、热带海洋环境国家重点实验室自主研究项目以及国家自然科学基金项目的联合资助,关键技术验证依托南海海洋所超算平台完成。
相关论文信息:https://doi.org/10.1016/j.envsoft.2025.106370
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。