英特尔发布最新第4代Xeon处理器,推进AI与HPC工作负载执行性能

英特尔(Intel)发布一系列新处理器,包括第4代Xeon Scalable处理器(代号Sapphire Rapids)、Xeon CPU Max系列处理器(代号Sapphire Rapids HBM)以及Data Center GPU Max系列(代号Ponte Vecchio),官方提到,他们的产品战略目标在解决大规模运算所带来的挑战,通过结合CPU和针对特定工作负载优化的内置加速器,以实现更高的效率和性能。

英特尔执行副总裁Sandra Rivera提到,他们将第4代Xeon Scalable处理器和Xeon CPU Max系列视为扭转市场的重要产品,英特尔借由新处理器扳回一城,重新回到数据中心处理器的领导地位。

针对日益增加的人工智能运算需求,与上一代处理器相比,第4代Xeon处理器内置高端矩阵扩展(AMX)加速器,可加速PyTorch即时推理和训练性能达10倍,而Xeon CPU Max系列则扩展了自然语言处理功能,大型语言模型运算速度提升达20倍。

英特尔提供人工智能软件组件,使得开发人员可以选择自己熟悉的人工智能工具,加快人工智能应用开发时间,该组件简化人工智能应用的移植,从工作站移植到云计算并扩展至边缘。

官方也强调,第4代Xeon处理器针对高性能、低延迟网络和边缘工作负载优化,能够支持电信、零售业、制造业甚至是智慧城市业软件定义关键组件。与前几代产品相比,第4代Xeon处理器可以在不增加功耗的条件下,提供2倍的虚拟化无线接取网络(vRAN)容量,相当于每瓦性能提高1倍。

由于英特尔进一步改进第4代Xeon Scalable处理器与Xeon CPU Max系列处理器,使其具有更好的可扩展平衡架构,通过集成CPU、GPU和oneAPI开放软件生态系,让处理器能更好的支持高性能计算和人工智能工作负载。

英特尔提到,Xeon CPU Max系列处理器是第一款,也是目前唯一一款x86架构且具有高带宽内存(HBM2e)的处理器。这代表用户不需要更改原有程序代码,就可使用Xeon CPU Max系列处理器加速高性能计算工作负载,Xeon CPU Max拥有64 GB的高带宽内存,与高端的第3代Xeon Scalable处理器相比,Xeon CPU Max系列的性能可提升3.7到10倍。

这次新产品发布,还包括在2021年就亮相的Data Center GPU Max系列,该GPU将1千亿个晶体管,封装进具有47个晶砖的封装中,官方提到,将Data Center GPU Max系列和Xeon CPU Max系列处理器搭配使用,执行LAMMPS分子动力模拟器的性能是前一代的12.8倍。

第4代Xeon较前一代处理器,除了性能提升之外也更加节能,官方提到,通过增加内置加速器,第4代Xeon带来平台级的节能效果,减少离散加速的需求,协助企业进一步实现永续目标。新的优化电源模式,能够在特定工作负载节省20%的电力,但产生的性能影响不到5%。