“香雪-3B”高密度AI服务器。芯跳科技 供图
近日,全球权威AI性能基准评测机构MLPerf公布最新AI训练Training V2.0榜单。其中,芯跳科技(广州)有限公司(以下简称芯跳科技)研发的高密度AI服务器“香雪-3B”(XIANGXUE-3B)共斩获2项冠军、3项亚军,总成绩排名第一。
据悉,MLPerf由图灵奖得主大卫·帕特森(David Patterson)联合斯坦福大学、哈佛大学等顶尖学术机构发起成立,是国际最具权威和影响力的AI性能基准评测组织。此次MLPerf基准测试,包括谷歌、戴尔等在内的顶级厂商与研究机构共提交超过260项成绩。
在本次MLPerf Training V2.0评测中,“香雪-3B”共参与5项测试场景,提交三组配置和7项测试成绩(MLPerf编号:2.0-2020~2.0-2025)。在强化学习(Minigo)、目标检测(RetinaNet)两项场景中获得冠军;在目标检测(Mask R-CNN)、图像分类(ResNet)、图像分割(3D U-Net)三项场景中获得亚军;在目标检测(Mask R-CNN)任务中获得第三名;在单机性能总榜单中排名第一。
在强化学习场景中,“香雪-3B”较第二名缩短近1小时训练时间,速度优势超33%,并首次实现单机200分钟以内的Minigo训练,将MLPerf性能纪录由264分钟刷新至174分钟,速度提升超过50%。同时,在目标检测相关的RetinaNet任务中性能也大幅领先,较第二名速度提升超过23%。
据介绍,“香雪-3B”以其卓越的性能、广泛的通用性、高可靠性,在商用 GPU 服务器中,所参与的五个场景均排名第一。“香雪-3B”可支持各类标准PCIE加速设备且支持全部的IO接口引出,用户可综合考虑业务需求和投入成本进行灵活配置,是进行高密度算力和IO升级的理想选择。
“香雪-3B”服务器在MLPerf评测中的出色表现,得益于芯跳科技完备的AI技术体系和丰富的系统设计经验。借助“香雪-3B”服务器超高的GPU扩展能力,普通用户无需部署复杂且昂贵的分布式训练系统,即可快速提升任务性能。“香雪-3B”是前沿技术研究实现成果转化的成功案例,可面向全球用户销售并提供全面服务。
“香雪-3B”服务器在单节点内可提供10 PFLOPS AI算力,灵活支持多种PCIE架构形式以适应广泛的应用需求,本次测评结果显示,其在不同场景下均具备出色的单机性能,为AI和机器学习用户提供了具有高度参考价值的极限性能数据。
由于AI训练的复杂性,不同场景对加速器运算特性、数据IO吞吐、集群网络拓扑等需求有着明显差别,而新型网络的快速发展对系统灵活性和任务适配提出了很大挑战,相比先前版本,本次MLPerf 2.0评价标准的最大改变在于轻量化目标检测任务中将SSD模型更换为RetinaNet模型,更好的反映了实际应用。
芯跳科技是新一代拥有自主研发团队的智能科技企业。芯跳科技表示,将继续紧跟AI与先进计算技术的发展,从用户实际需求出发,更进一步优化系统整体方案,提供更优的灵活适配性,在更多用户场景下发挥极致性能。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。