五大洲的20间医院合力训练神经网络，联合学习打造出医疗AI

始在《Nature Medicine》期刊上发布的研究结果表明，联合学习 (federated learning) 打造出可以普及到各医疗机构的强大人工智能 (AI) 模型，这项发现有望更进一步将联合学习用在能源、金融服务、制造及其它领域。

该研究的第一作者Ittai Dayan博士表示：“通常在开发AI的过程中，使用一间医院的资料来创建算法时，在其它医院不见得能正常运行。但是，使用联合学习及其它地区客观的多模态资料来开发模型，便能将该模型普及到其它医院，以协助世界各地第一线的医生。”

医疗看护产业已正进行其它大规模的联合学习项目，包括五名研究人员的团队在评估乳房X光检查结果，以及制药业龙头拜耳公司正训练用于脾脏分割的AI模型。联合学习还能帮助能源公司分析地震和井壁资料、协助金融公司改善欺诈侦测模型、协助自动驾驶车研究人员打造能够归纳不同国家驾驶行为的AI。

开发AI模型的公司和研究机构通常无法顺利取得各种可用资料，而饱受巧妇难为无米之炊的苦恼。大多数组织必须和同行分享资料，才能搜集到足够的资料以训练强大又能够普及的模型。但在许多情况下，资料隐私法规又使他们无法在共享的超级计算机或云计算服务器上，直接分享患者病历或专有资料集等资料。而这就是联合学习可以派上用场的地方。

这项在《Nature Medicine》期刊上所发布名为EXAM (为EMR CXRAIModel的缩写) 的全新研究项目，在Mass General Brigham与NVIDIA的领军下，汇集横跨五大洲的20间医院合力训练一个神经网络，能够预测出现新冠肺炎症状的患者在到达急诊科等护理点的24及72小时后，可能需要补充氧气的程度。这是迄今规模最大、最多样的临床联合学习研究项目之一。

联合学习让EXAM研究案的合作对象能够打造出一个AI模型，从每个参与医院所提供的胸部X光图片、患者的生命征象、人口统计资料及实验室数值中学习，又不会看到存放在各地私用服务器中的隐私资料。

每间医院使用本地端的NVIDIA GPU来训练同一套神经网络的副本。在训练的过程中，每间医院定期把更新完的模型权重发送到中央服务器，全球版本的神经网络在这里汇集更新后的模型，形成一个新的全球版本模型。这就像是分享试题的答案，但不透露任何用来找出答案的学习材料。

全球版本的EXAM模型在与所有参与机构分享资料后，AI模型的平均性能提高了16%。研究人员发现，与通过任何单一机构训练的模型相比，普及性平均提高了38%。对于拥有较小型资料集的医院来说，性能提升尤其显著，如图所示。

泰国朱拉隆功大学 (Chulalongkorn University) 与朱拉隆功国王纪念医院 (King Chulalongkorn Memorial Hospital) 医学AI中心联合主任Sira Sriswasdi表示：“联合学习让全球各地的研究人员能够合作朝着同一个目标前进，也就是发展一个能够从每个人的资料中学习且进行归纳的模型。有了NVIDIA GPU及NVIDIA Clara软件，参与这项研究的过程本身并不困难，却能产生影响深远的结果。”该医院是合作进行EXAM研究的20间医院之一。