2018年超算领域的变化,给2019年乃至未来超算技术的发展,留下了哪些注脚?
E 级计算将是2019 年讨论热点。
■本报记者 赵广立
刚刚过去的2018年,全球超算领域发生了一些变化:美国凭借IBM研制的Summit高性能计算机重新夺回阔别5年之久的全球超算TOP500榜首;人工智能(AI)应用逐渐成为超算追逐的新目标;“超算云”被越来越频繁地提及……
2018年超算领域的这些变化,给2019年乃至未来超算技术的发展,留下了哪些注脚?
2018:异构、AI应用、超算云
中国国家高性能计算机工程技术研究中心副主任、中科曙光副总裁何铁宁注意到,2018年重夺全球超算TOP500榜首的Summit超算和排名第二的Sierra超算,都是典型的CPU+GPU的异构体系架构。他认为,这种异构结构已成为主流。
“部署在美国橡树岭国家实验室的Summit超算实测效率很高,超过70%,这可能在已有的异构系统里是最好的。”近日,中科院计算机网络信息副主任迟学斌在接受《中国科学报》采访时说,未来要发展E级计算(每秒百亿亿次),异构是重点,其他实现途径或许要让位于异构结构。
更让迟学斌感到触动的是,超算加速芯片对人工智能应用的适配。“英伟达公司推出的DGX-2,在支持人工智能算法特别是推理方面做得比较好,性能确实高,很好地将高性能和人工智能结合起来了。”他认为,这对中国超算而言是个挑战,“目前我们做的处理器里面缺少这方面的硬件。”
在2018年世界超算大会上,美国相关团队展示了基于Summit超算的地震预测应用。何铁宁介绍说,其地震整体部分的计算用的是传统科学计算方法,而单点破坏严重的地方则使用了测量数据+推理相结合。“等于是将一个大问题的局部用了人工智能计算,整体则仍是传统科学计算,二者合在一起把机器用到了完美。”
该应用摘得了2018年的“戈登贝尔奖”。何铁宁说,这一应用最值得学习的地方是,如何把这两种计算有机结合起来,并达到负载均衡的完全匹配。
针对越来越频繁被提及的“超算云”概念,迟学斌解释说:“超算云英文叫做HPC in Cloud,HPC还是HPC,只不过服务在云上面。简而言之,就是用云服务的形式,为用户提供高性能计算能力,只是服务形式不像以前那么单一。”
何铁宁认为“超算云”是未来超算获得更广泛应用的一个机会,只不过概念上要搞清楚,“超算云其实是‘超算服务云’的缩写,云化的是服务平台,并非真正的超算。”
2019:E级、应用提升、绿色超算
展望2019年,迟学斌认为“讨论最多的还将是E级计算这个事”,实现的途径“无非是异构或众核”,两条路径都可以通往E级。
“中国三台E级原型机都已经在2018年研制成功并通过了验收,2019年会继续往下做。”何铁宁说,在实现E级之后,中国有望短期内夺回全球超算TOP500的榜首。
另外,迟学斌认为,2019年中国超算将在软件和应用方面继续加强,相关投入也将逐渐增加。
“我估计2019年在应用和软件这些软实力的建设上会有更多投入,不然我们和发达国家的差距还会继续拉大,只有在软件上下一番功夫才可能进一步缩短差距。”迟学斌对《中国科学报》说,如果美国对软件使用实施管控,可能将导致很多设备成为摆设。
“很多应用软件不是一朝一夕可以做出来的,我们要持续投入。”迟学斌说。
尽管多年来屡屡被提及,“绿色超算”仍是迟学斌等人关注的重点。“总体上我们的处理器功耗还是最大的问题,如果能把功耗降下来,会节约很多成本。”
“功耗墙”其实正是E级计算的一大瓶颈。此前,国际超算领域的共识是,在实现百亿亿次超级计算机时,要将系统能耗控制在20兆瓦的合理范围内,后来该数字被调整为30兆瓦。但就目前来看,要实现这一目标并非易事。
当然,降低能耗也有着显著的商业价值。何铁宁认为,为了降低能耗成本,把超算中心或者数据中心建设在能源资源丰富、电价较低的地区或将在2019年成为主流。在内蒙古的呼和浩特,电价低至0.26元/度,比京津地区便宜一半还多。
“地方政府也正在转变观念。从传统的黑色能源(煤炭)输运变成了向外输运计算力,将节省不少中间环节。”何铁宁说,中科曙光目前正在与呼和浩特等地区接洽,在当地建设计算中心。
《中国科学报》 (2018-01-03 第7版 信息技术)