量子光学是物理光学中相对于波动光学的另一个分支,有研究指出,未来超高速的量子计算机的基本算子素可能来自于光子,同时光子也是光通信领域的关键因素。最新一期《Nature》期刊刊登了两篇有关光学加速AI运算的论文,看来有关量子光学在AI加速器的研究与应用均会是未来人工智能研发的讨论方向。
随着人工智能的爆炸式增长,其对算力的要求也越来越高。
Nature最新一期,就连登了两篇光学加速AI运算的论文,里面介绍了两个AI运算加速器:分别是11TOPS的光子卷积加速器和张量核光子加速器,两者都可以达到每秒数万亿次的运算速度。
光子处理器利用光的特性,可以加速人工智能运算处理过程,同时,还会引领光子运算的复兴。
为什么光子能加速AI开发?
由于光谱覆盖的波长范围很广,不同波长的光子可以进行多路传输或者平行传输,光信号之间而相互干扰,还能够进行调整,改变传输方式,携带更多的消息。
所以在过去几十年中,光纤通信取得了巨大成功。
但是,光子运算跟SOTA水平的电子运算处理器相比,还是有着很多不足,比如缺乏合适的并行运算机制、人工神经元的高速非线性响应的材料和可扩展的光子设备,这些都难以让光子运算快速准确地集成到运算硬件中。
幸运的是,光梳的发展为集成光子处理器带来了新的机遇。所谓的光梳是一组发射光谱的光源,它们由数千或数百万条在频率上均匀紧密排列的尖锐光谱线组成。
光梳在光谱学、光时钟计量学和远程通信等领域取得了巨大成功,因此获得了2005年诺贝尔物理学奖。
光梳还能集成到计算机芯片中,用作光运算的节能能源,给光子运算的增速带来了曙光。
在光梳的基础上,他们创造出了这两个AI加速器。
11TOPS的光子卷积加速器
11TOPS的光子卷积加速器是研究人员利用了光梳制造的一种多功能光学矢量加速器。
研究者采用了巧妙的方法进行卷积运算,他们先利用色散为波长多路复用光信号产生不同的时间延迟,然后将这些信号沿着与光波波长相关的维度进行组合。
通过充分利用光子波长的广泛范围,研究者实现了不同卷积运算的并行运算,使用单个处理核心的光运算速度,只受数据吞吐量的限制,速度能达到10万亿次每秒。
运用这个加速器,每秒可以对25万像素进行卷积运算,足以进行人脸识别。
他们还使用这个加速器形成一个有10个输出神经元的光学卷积神经网络,成功识别出不同的数字图像,准确率高达88%。
这种方法还可以训练更复杂的模型,比如无人车、视频即时识别等。
张量核光子加速器
另外一个研究团队,展示了一个张量核光子加速器,每秒能够进行数万亿次的MAC运算。
它是一个特殊计算集成的光子硬件加速器,利用相变材料存储器数组和基于光子芯片的光梳实现了光子存储的并行运算,还通过多种波长和相变材料的集成单元数组进行模拟矩阵矢量乘法,使输入数据完全并行化。
高度并行化的运算框架,可以同时高效处理整个图像。将来,这个方法可以广泛用于商业制造程序和机器学习。
由于卷积过程涉及无源传输,光子处理核心的运算可在低功耗下进行,这对于像云计算这种能源密集型应用程序来说意义重大。
研究结果表明,集成式并行光子运算在自动驾驶、即时影音处理和下一代云计算服务等数据量大的人工智能应用中,可以发挥重要作用。
还有很长一条路要走,有哪些问题和挑战?
虽然上述两者在光子运算的AI领域,取得了突破,证明了光子计算在AI领域的巨大潜能。
但是全光子运算的规模仍旧比较小。这因为计算效率受到光学组件的限制,电信号和光信号之间还要进行不断转换,所以还需要材料学、光子学、电子学不同领域的科学家协同研究工作。
还有一个发展方向就是开发非线性集成的光学运算结构,即通过集成电子电路和成百上千个光子处理器,开发出光子处理器和电子处理器的混合光电框架。
这个框架可能会给AI硬件领域带来历史性的变革。
参考资料
《Nature》-1、《Nature》-2、《Nature》-3