英特尔推出全新处理器、内存、存储设备、FPGA打造AI运算解决方案

Intel针对AI应用领域推出了支持Bfloat16资料格式的第3代Xeon可扩展处理器,以及单条模块就能提供4.5TB容量的Optane Persistent Memory 200系列内存,与搭载PCIe 4.0控制器的SSD D7-P5500和P5600等固态硬盘,提供企业用户强效的AI运算解决方案。

为了提升数据中心、网络、智能边缘运算环境中,AI和分析工作负载的开发与执行的效率,Intel将Bfloat16资料(Brain Floating Point)格式纳入第3代Xeon可扩展处理器(Scalable Processors)支持,成为业界首款内置支持bfloat16的主流服务器处理器,让通用型处理器也能更全面支持AI训练与推论,以满足图像分类、推荐引擎、语音识别和语言建模等应用的需求。

Bfloat16的优先在于在多数神经网络运中,能在使用一半位元的情况下提供与FP32(单精度浮点数)一样的准确度,代表着可以减少一半内存用量、倍增资料吞吐量,而且Intel也将Bfloat16集成至处理器的Intel DL Boost功能中,并支持TensorFlow、Pytorch等深度学习架构,以及对OpenVINO工具组和ONNX执行环境优化,只需微幅调整软件,即可达到相同的模型精准度,并可加速处理器的AI训练和推论性能。

Intel第3代Xeon可扩展处理器支持Bfloat16资料格式,可以强化AI训练与推论性能。

Bfloat16与FP16(半精度浮点数)的资料长度相同,但可带来与FP32接近的神经网络运算准确度。(图片来源:维基百科)

Bfloat16的性能比FP32更好,而准确度则比INT8(整数运算)出色。

根据官方资料Bfloat16可以提升1.93倍AI训练与1.9倍AI推论性能。

读者可以通过这个小游戏了解Bfloat16的特性与优势。

除了处理器之外,Intel也为第3代Xeon可扩展平台推出了搭配的Optane Persistent Memory200系列内存,它有着介于DRAM与固态硬盘之间的特性,以及高容量密度、资料不会因断电而消失等特色,可在单一插槽提供高达4.5TB的容量,以满足内存内置数据库、高密度虚拟化、分析和高性能计算等应用需求。

在存储媒体部分,Intel出了SSD D7-P5500和P5600等2款固态硬盘,采用TLC 3D NAND技术与全新的低延迟PCIe 4.0控制器,以满足AI和分析工作负载的高度I/O需求,提高IT效率和资料安全性的高端功能。

此外Intel也发布了首款AI优化的Stratix10 NX FPGA,它针对高带宽、低延迟AI加速进行优化,并集成的高带宽内存(HBM)、高性能网络、张量处理模块(Tensor Block),以及AI优划算法模块(Arithmetic Block,其中包含通常用于AI模型算法的低精度乘法器的密集数组),为用户提供定制化、可重新设置和可扩展的AI加速功能,适用于自然语言处理和欺诈检测之类的运算需求。

在这同时Intel也延续OneAPI跨架构开发环境,以简化开发横跨处理器、绘图处理器(GPU)、FPGA不同架构算子件的程序开发,并确保程序代码能于现在与未来的英特尔硬件环境中继续使用。

Optane Persistent Memory 200系列内存换上蓝色散热片,外形更亮眼。

Optane Persistent Memory的特性介于DRAM与固态硬盘之间,可以作为2者之间的使用层级。

Optane Persistent Memory 200系列内存有着4.5TB的超大容量,并比NAND固态硬盘快225倍。

SSD D7-P5500和P5600固态硬盘采用PCIe 4.0控制器,能提供更出色的访问性能。

SSD D7-P5500和P5600的最高访问速度可以达到7,000MB/s。

OneAPI开发环境能够大幅简化跨架构AI程序的开发流程。

Intel副总裁暨Xeon和内存业务部总经理Lisa Spelman表示:“快速部署AI和资料分析的能力对于现今的企业极为重要。英特尔将继续致力于提升处理器内置的AI加速和软件优化功能,并为全球数据中心和边缘解决方案提供支持,同时也提供无与伦比的芯片基础,以从资料其中获得更多宝贵的洞察信息。”