Cerebras公开全球首个人类大脑级AI解决方案,台积电7纳米制程扮核心角色

人工智能 (AI) 创新计算解决方案创业公司企业Cerebras Systems表示,目前人脑含约100万亿个神经元突触,但最大AI硬件集群约才人类大脑规模1%,或约1万亿个神经元突触量,称为参数。这些AI硬件处理器集群仅为人类大脑一小部分,却占用数英亩空间和数万亿瓦功率,且需要专门团队操作。基于以上因素,Cerebras Systems于24日推出世界第一个人类大脑级AI解决方案,能支持超过120万亿个参数运算模型。

Cerebras Systems强调,世界第一个人类大脑级AI解决方案是使单个小型冰箱大小,内置CS-2运算系统的AI硬件系统支持超过120万亿个参数的模型。Cerebras Systems采用4项业界领先技术,包括Cerebras Weight Streaming新软件执行架构、Cerebras MemoryX内部内存扩展技术、Cerebras SwarmX高性能互联接构技术、Selectable Sparsity动态收集技术。

Cerebras Weight Streaming技术首次完成芯片外存储模型参数的能力,同时提供与芯片相同的训练和推理性能。新执行模型分解计算和参数存储,允许研究人员独立灵活扩展规模和速度,并消除挑战大型小型处理器集群的延迟和内存带宽问题。极简化工作负载分配模型,设计目的是让用户可从使用一个CS-2运算系统,或扩展到最多192个CS-2运算系统,无需变更软件。

Cerebras MemoryX是内存扩展技术。MemoryX提供高达2.4PB高性能内存。CS-2运算系统可支持有多达120万亿个参数的模型。Cerebras SwarmX是高性能、人工智能优化通信结构,使Cerebras Systems最多于192个CS-2运算系统连接1.63亿个AI优化核心,协同工作以训练单个神经网络。

Selectable Sparsity技术使用户在模型选择权重稀疏程度,并直接减少浮点运算的耗耗时间 (FLOPs) 和解决时间。权重稀疏(weight sparsity)是机器学习研究的重要领域,图形处理单元效率极低,过去一直难以突破发展。如今通过可选择权重稀疏性使CS-2运算系统加速工作,并使用每种可用类型的稀疏性,包括非结构化和动态权重稀疏性,更短时间内生成答案。

通过技术组合,Cerebras Systems表示,用户能轻松解锁大脑规模的神经网络,并将工作分配到大量人工智能优化的核心集群。Cerebras Systems能在模型大小、计算集群能力和大规模编程的简单性方面设置新基准。

整个系统核心Cerebras CS-2人工运算系统核心部分,由Wafer Scale Engine (WSE-2) 处理器提供动力。这是有史以来最大的芯片和最快的AI处理器,由芯片代工龙头台积电7纳米制程生产。WSE-2是有2.6万亿个晶体管和850,000个AI优化核心的单个芯片级芯片。目前最大图形处理单元只有540亿个晶体管,比WSE-2少了2.55万亿个晶体管。WSE-2还拥有比图形处理单元竞争对手多123倍的核心和1,000倍的高性能内置内存。

WSE-2处理器大小特别适用Cerebras架构。与图形处理单元不同,传统架构下,少量芯片内存需要跨多个芯片分区运算大型模型,但WSE-2处理器可适应和执行非常多层面,无需传统屏断或分区执行运算。芯片上异植内存的方式,适合每个模型层而不需要分区能力,代表每个CS-2运算系统可赋给相同神经网络工作负载,并每一层进行相同计算,独立于整个网络。对用户来说,简单性允许将模型从单个CS-2运算系统扩展到任意大小集群,无需任何软件更改。

(首图来源:Cerebras Systems)