五大洲的20间医院合力训练神经网络,联合学习打造出医疗AI

始在《Nature Medicine》期刊上发布的研究结果表明,联合学习 (federated learning) 打造出可以普及到各医疗机构的强大人工智能 (AI) 模型,这项发现有望更进一步将联合学习用在能源、金融服务、制造及其它领域。

该研究的第一作者Ittai Dayan博士表示:“通常在开发AI的过程中,使用一间医院的资料来创建算法时,在其它医院不见得能正常运行。但是,使用联合学习及其它地区客观的多模态资料来开发模型,便能将该模型普及到其它医院,以协助世界各地第一线的医生。”

医疗看护产业已正进行其它大规模的联合学习项目,包括五名研究人员的团队在评估乳房X光检查结果,以及制药业龙头拜耳公司正训练用于脾脏分割的AI模型。联合学习还能帮助能源公司分析地震和井壁资料、协助金融公司改善欺诈侦测模型、协助自动驾驶车研究人员打造能够归纳不同国家驾驶行为的AI。

开发AI模型的公司和研究机构通常无法顺利取得各种可用资料,而饱受巧妇难为无米之炊的苦恼。大多数组织必须和同行分享资料,才能搜集到足够的资料以训练强大又能够普及的模型。但在许多情况下,资料隐私法规又使他们无法在共享的超级计算机或云计算服务器上,直接分享患者病历或专有资料集等资料。而这就是联合学习可以派上用场的地方。

这项在《Nature Medicine》期刊上所发布名为EXAM (为EMR CXRAIModel的缩写) 的全新研究项目,在Mass General Brigham与NVIDIA的领军下,汇集横跨五大洲的20间医院合力训练一个神经网络,能够预测出现新冠肺炎症状的患者在到达急诊科等护理点的24及72小时后,可能需要补充氧气的程度。这是迄今规模最大、最多样的临床联合学习研究项目之一。

联合学习让EXAM研究案的合作对象能够打造出一个AI模型,从每个参与医院所提供的胸部X光图片、患者的生命征象、人口统计资料及实验室数值中学习,又不会看到存放在各地私用服务器中的隐私资料。

每间医院使用本地端的NVIDIA GPU来训练同一套神经网络的副本。在训练的过程中,每间医院定期把更新完的模型权重发送到中央服务器,全球版本的神经网络在这里汇集更新后的模型,形成一个新的全球版本模型。这就像是分享试题的答案,但不透露任何用来找出答案的学习材料。

全球版本的EXAM模型在与所有参与机构分享资料后,AI模型的平均性能提高了16%。研究人员发现,与通过任何单一机构训练的模型相比,普及性平均提高了38%。对于拥有较小型资料集的医院来说,性能提升尤其显著,如图所示。

泰国朱拉隆功大学 (Chulalongkorn University) 与朱拉隆功国王纪念医院 (King Chulalongkorn Memorial Hospital) 医学AI中心联合主任Sira Sriswasdi表示:“联合学习让全球各地的研究人员能够合作朝着同一个目标前进,也就是发展一个能够从每个人的资料中学习且进行归纳的模型。有了NVIDIA GPU及NVIDIA Clara软件,参与这项研究的过程本身并不困难,却能产生影响深远的结果。”该医院是合作进行EXAM研究的20间医院之一。