Nvidia BlueField-2破DPU性能测试世界记录

Nvidia自家测试使用2个BlueField-2资料处理单元,可以达到4,150万的IOPS,这个数字是目前市面上任何DPU(Data Processing Unit)的4倍以上。这项测试使用标准网络协议和开源软件,在BlueField-2 DPU上运行,而为了加快人工智能和高性能计算应用,BlueField采用了热门的RoCE网络传输协议,来达到更高的存储性能。

在测试中,Nvidia使用不同类型的存储软件函数库,以及各种工作负载,来模拟真实世界的存储设备,BlueField达到4,150万的IOPS是目前世界记录1,000万IOPS的4倍,Nvidia还提到,前一个世界记录还是使用专用的存储产品。

在测试中,Nvidia连接2台Hewlett Packard Enterprise Proliant DL380 Gen 10 Plus服务器,其中一台作为应用程序服务器(存储启动器,Storage Initiator),另一台作为存储系统(存储目标,Storage Target)。

每台服务器都搭载时脉2.3GHz的英特尔Ice Lake Xeon Platinum 8380 CPU,总共可以提供160个超线程核心、512 GB的内存,还有120 MB的L3缓存和PCIe Gen4总线。官方提到,由于要加速网络和NVMe-oF,每台服务器配置2张Nvidia BlueField-2 P系列DPU卡,每张卡上都有2个100 Gb以太网络连接端口,因此在2台服务器间,就能有4个网络连接端口,并且有400 Gb/s的有线带宽。

操作系统使用RHEL 8.3,而存储启动器则使用SPDK、标准上游Linux核心以及适用于SPDK的FIO扩展组件3种存储启动器,I/O大小则以中小型存储常见的大小,分别使用4 KB和512 B进行测试。这样的硬件和软件组合,除了创单一BlueField-2世界记录,达到4,150万次的IOPS之外,官方还发现,使用较小的512B I/O大小进行测试,会获得更高的IOPS但较低的吞吐量,而4KB I/O大小则获得较高的吞吐量,但是更低的IOPS量。

使用SPDK会产生比核心空间软件更高的性能,但代价是更高的CPU使用率,Nvidia提到,这个现象在预期之内,因为SPDK在用户空间以恒定轮询的方式运行。而比较Linux核心的性能,官方表示,因为Linux社群持续改进存储功能,因此5.15版本核心比4.18版本性能更好。