作者:张素 来源:中国新闻网 发布时间:2016/4/24 9:46:14
选择字号:
中科曙光针对高性能计算机群的运维平台正式上线

 

中新网北京4月23日电 (记者 张素)记者23日从中科曙光获悉,在经历了6个月的试运营之后,中科曙光针对高性能计算机群推出的SaaS级专业化在线平台EasyOP正式上线。

今年3月,谷歌Alpha Go在与李世石九段的人机大战中以4:1的成绩胜出后名声大噪。事实上,Alpha Go获胜原因之一就是拥有稳定运行的强大超级计算系统。

然而,目前基于高性能计算机群(HPC)的IT中心建设,能够提供服务的公司往往难以做到全生命周期的运维服务。第三方HPC服务商并不研发和生产,解决问题的效率也不尽如人意。

“EasyOP是曙光结合‘互联网+’和HPC的产物,不仅帮助用户维护HPC系统,还有望利用用户的系统为其创造更多的价值。”中科曙光副总裁沙超群表示,“通过提供运维、调优等服务,将各行各业的专家从HPC的运维和管理中解放出来。

沙超群介绍,该平台具有五大关键技术:监控数据实时远程采集、海量数据存储与展示、故障的分析与定位技术、大量数据统计与分析、移动终端的集成与推送。

来自中科院物理所的徐力方研究员对记者表示:“HPC集群的运维此前一直是我们的艰巨任务,非常辛苦。接入EasyOP后,我们的运维压力大大降低了,运维成本和人力投入也都减少了,而且HPC集群的安全性和使用效率也得以提升。”

2015年11月,EasyOP在全国高性能计算学术年会上亮相并宣布试运营。记者获悉,从试运营的数据反馈信息来看,其表现称得上专业、全面。在此期间,累计接入来自20组HPC集群的超过7800个节点,应用涵盖CAE、气象、海洋、物理、生物、材料及互联网6大领域,对所有接入集群资产全面监控的指标超过180项。

专家分析称,在监控的7800多个节点中,CPU的最高和平均利用率为83%和70.1%,内存的最高和平均利用率为40%和25.5%,存储的最高和平均利用率为23%和20.3%。在EasyOP接入的资源作业中,中短时长作业占近70%,作业排队率约为1/5。这种多线程任务下适于对HPC系统各子功能的全方位监控。

据统计,试运营半年期间,全部集群共自动触发近2900条通知信息,其中2281条是因计算节点主要部件温度升高触发的轻微类通知。严重类通知仅有3条,从侧面反映了曙光集群系统的高可靠性。

“曙光推出EasyOP在线运维平台,引领了我国HPC行业向互联网+转型的方向,将促进行业整体服务水平的提升。”中国软件行业协会数学软件分会常务副秘书长姚继锋表示,“EasyOP可实现曙光与HPC用户的互联,对于打造‘HPC生态圈’具有重要意义”。(原标题:中科曙光针对高性能计算机群的运维平台正式上线)

 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
以下评论只代表网友个人观点,不代表科学网观点。 
SSI ļʱ
相关新闻 相关论文

图片新闻
首张另一星系中的恒星照片出炉 《自然》(20241121出版)一周论文导读
清华这位院士搭建了一座室外地质博物园 科学家完整构建火星空间太阳高能粒子能谱
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文
 
论坛推荐

Baidu
map