美国国家能源研究科学计算中心正式安装全球最快AI超级计算机

美国国家能源研究科学计算中心(National Energy Research Scientific Computing Center,NERSC)在5月27日宣布,已于其劳伦斯伯克利国家实验室正式安装了全球最快的AI超级计算机Perlmutter,Perlmutter又名NERSC-9,是由HPE与Nvidia及AMD联手打造的GPU加速超级计算机,理论上可提供接近3.8 exaflop/s的AI性能,或是60 petaflop/s的尖峰高性能计算。

根据去年11月公布的全球500大超级计算机名单,位居第一名的是日本的理化学研究所(RIKEN)和富士通共同合作打造的Fugaku,它的尖峰高性能计算为537 petaflop/s,HPL-AI性能为2 exaflop/s。

至于Perlmutter的尖峰高性能计算在500大超级计算机名单上只能排在第十名左右(正式排行榜采用混合精度性能),但HPL-AI性能直接超越Fugaku。

HPL-AI是在2019年11月才成为超级计算机排行榜的基准测试,以彰显新兴的融合式高性能计算(HPC)与人工智能(AI)任务。

Perlmutter奠基于HPE的Cray Shasta平台上,同时采用GPU加速器与CPU-only节点,NERSC说它的性能是该中心现有旗舰系统Cori的3倍以上,将分成两阶段部署,第一阶段采用GPU加速器,今年春末就会开始进行科学运算,第二阶段则会加入CPU-only节点,也预计在今年上线。

根据HPE所披露的规格,Perlmutter采用了6,159个Nvidia A100 GPU,以及1,500个AMD Milan CPU,且该系统未来将支持专门探究暗能量对宇宙膨胀影响的暗能量光谱仪(Dark Energy Spectroscopic Instrument,DESI)计划,可用来协助描绘横跨110亿光年的宇宙图,在早期的测试中,NERSC研究人员发现使用Perlmutter的GPU性能可达20倍,可将原本需要数周或数月的运算任务,大幅缩短至以小时计算。

此外,材料科学也可能受益于Perlmutter。NERSC的性能专家Brandon Cook表示,过去要针对诸如电池接口等大型系统进行全面的原子模拟是不可能的,但现在科学家计划要利用Perlmutter来完成此事。

另一方面,Nvidia早已是500大超级计算机排行榜的常胜军,该公司所打造的Selene超级计算机系统,在去年11月的排行榜上名列第五,且在500大排行榜中,有147个系统采用了加速器或协同处理器技术,其中就有132个使用Nvidia的芯片,比例接近90%。