IBM公布使用Z16相同核心的AI SoC芯片

IBM上周宣布一款用于AI模型训练的单系统(SoC)芯片,名为AIU(Artificial Intelligence Unit)。

IBM研究AI硬件中心研究人员说,AI大约在10年刚开始发展史,研究人员的任务很单纯,只是训练能识别动物的模型,这只要数百万张照片,以及运算硬件跑上一长段时间就能训练出一个深度学习模型。但今天深度学习模型的工作已经从识别猫狗变成翻译语言、从医疗图片侦测出肿瘤,以及其他高深的任务。

除了任务变得困难,研究人员也面临计算资源不足的挑战。现在执行AI建模的服务器都搬上了云计算或边缘设备,像是手机及物联网传感器等速度不那么快的硬件。这也促使IBM开发AI专用芯片。

IBM的AI硬件中心2019年成立,预计每年要将AI硬件效率提升2.5倍。计划到2029年,要训练出比三年前速度快1,000倍的AI模型。AIU则是该中心公布第一款AI专用芯片。

AIU是IBM第一款作为深度学习专用、可程序化的ASIC(application-specific integrated circuit,特定应用集成电路)。AIU的核心其实和IBM最新大型主机z16 Telum芯片AI加速技术类似。AIU具备32运算核心,以及230亿颗晶体管,几乎等同Telum芯片(具225亿颗晶体管),更厉害的是Telum的晶体管为7纳米大小,AIU则用上了更高端、小至5纳米的晶体管。

IBM强调其AI专用芯片有两大特点,一是使用IBM近似运算(approximate computing)的技术,将32位元浮点运算降到1位元,通过降低精度达到提升资料运算速度。其AIU在浮点计算及整数表示(integer representation),使AI模型执行更快、不耗内存。其次,这款AI芯片版图(layout)是为简化AI工作流程而设计,且可直接将资料由一个运算引擎送到另一个,节省大量能耗。

另一方面,AIU也设计成像显卡一样容易使用,可轻易从PCIe插槽插入任何计算机或服务器。

IBM未说明AIU推出进程,只表示希望很快能公布。