Deepmind以AI控制环磁机中的氢电浆,推进核融合发电研究

Deepmind在《Nature》期刊发布的论文,说明了他们如何运用深度增强学习,和模拟环境学习架构,在瑞士洛桑的可变配置环磁机(Variable Configuration Tokamak,TCV)上构建并运行控制器,成功控制核融合电浆。

研究人员不只可以使电浆保持稳定,还可以精确地将其雕塑成各种形状,该研究成果代表着,增强学习系统可以用来控制过热物质,让科学家研究电浆在不同条件下的反应,提高对核融合反应炉的理解。

这项研究的意义,在于推进科学家在核融合发电的研究。科学家为了解决全球能源危机,希望能找到干净且无限的能源,而核融合目前看起来是一个绝佳的选项,通过融合随处可见的氢元素,来获得融合过程中所释放出的强大能量,而这也是宇宙中,活跃恒星的能量来源。

要当地球上创建适合核融合的严苛环境并不容易,科学家使用托克马克(Tokamak)又称为环磁机的设备,该设备在甜甜圈形状的真空外包覆电磁线圈,来将比太阳核心更热的氢电浆约束在真空中。

但是环磁机中的电浆并不稳定,要维持可进行核融合所需条件非常困难,控制系统必需要协调环磁机中的电磁线圈,并且每秒数千次调整线圈电压,避免电浆碰触到容器壁,以免造成热量损失和器材损坏。

而Deepmind与洛桑联邦理工学院的瑞士电浆中心合作,开发了第一个深度增强系统,能够自动控制线圈,将电浆稳定约束在环磁机中。

目前科学家在核融合的研究,仍受到许多限制,全球有数十个环磁机,这些设备昂贵但需求量很大,TCV一次实验只能维持电浆3秒,需要冷却15分钟,之后才能再次进行实验,不仅如此,多个研究小组通常需要共享环磁机,而这也限制了可实验的时间。

由于实体环磁机难以取得,于是研究人员转而使用模拟器来加速研究,Deepmind先在模拟环境中控制TCV,接着才在真正的TCV上验证结果。经过实验证实,他们已经有能力将电浆雕塑成需要的形状。虽然模拟环境更便宜更方便,但仍然需要克服许多障碍,像是电浆模拟器速度非常慢,一秒的模拟需要数小时的运算,此外,TCV的状况每天都不同,研究人员需要开发算法,来改进模拟结果以适用于真正的硬件上。

而且现有的电浆控制系统也很复杂,TCV上的19个电磁线圈皆安装独立的控制器,每个控制器都使用算法即时估算电浆特性,来调整为相对应的电压,而Deepmind的新方法,则以单个神经网络,一次控制所有线圈,自动学习可达到最佳电浆配置的电压。

Deepmind在研究中,创建一系列电浆形状,而电浆物理学家正在研究这些形状的电浆,在产生能量上的可用性,像是雪花形状的电浆,就被认为可以将废能传播到容器壁的多个点上,有助于降低冷却成本。另外,深度增强学习也能达到过去TCV从未做过的事,像是在稳定容器内同时维持两个水滴形状的电浆,研究人员提到,他们只改变要求,算法就能自动找到适合的控制方式。

人工智能再次展现推进科学研究的潜力,在能源领域上,人工智能加速并协助发展核融合发电,而利用增强学习自动控制电浆的方式,也将改变未来TCV的设计。