Google研究在加护病房使用机器学习技术,综合预测病人2天内的不良事件

Google研究人员想要借助机器学习技术技术,最大化加护病房资源使用效率,Google提出了一种称为串行子网络路由(Sequential Sub-Network Routing,SeqSNR)的多任务学习架构(MTL),能够良好地根据现实情况的复杂性,做出更全面的预测。该研究的贡献在于,研究人员成功将SeqSNR应用在加护病房环境,预测病患连续不良事件,即便在缺少训练资料的情况,也能良好地处理单项任务以及简单的多重任务。

加护病房负责照顾极脆弱的病患,其中许多病患需要机械式呼吸辅助或是透析来维持生命。加护病房的资源相当吃紧,尤其是在COVID-19大流行期间,面对大量的病患,医院需要把资源留给最需要的病患,而准确预测加护病房病患的临床结果,能够指引治疗方法,提供医护重要的决策消息,包括人员配置和分流支持。

Google提到,过去将机器学习用于电子健康履历(EHR)的研究,已经显示出预测临床结果的潜力,但是这些机器学习模型,都是基于单任务学习,也就是说,模型仅适用于预测特定的不良事件,像是器官功能衰竭,或是生命支持性干预,而多任务模型,则可以带来更大的好处,可以考虑竞争风险或是器官系统间的依赖性,更全面地预测现实环境中病患的状况。

研究人员使用免费开放且去识别化的MIMIC-III EHR资料集,该资料集具有36,498名成年患者的资料,包含加护病房患者的多模式记录。研究人员提到,与其他机器学习所使用的资料集不同的地方是,输入和目标之间的关系通常没有明确定义,需要从资料推理出来,因此研究人员根据基于规则的自动化方法,以及临床审查,定义了一系列不同的目标,包括重症医疗干预、特定器官功能衰竭等。

研究人员设计模型要能预测患者进入加护病房后,24到48小时间的一系列不良事件,这些不良事件诸如急诊性肾损伤、连续性肾脏替代疗法透析、死亡率和剩余住院时间等。研究人员解释,虽然多任务学习可以捕捉器官系统之间的相依关系并且平衡风险,但是实例上通常会面临联合学习的任务,互相干扰的负迁移(Negative Transfer)问题,而SeqSNR的特性,能过滤掉与任务相关性低的资料,最大程度降低负迁移,简单来说,也就是每个任务都会使用不同的模型路径。

MIMIC-III资料集包含性别和年龄,但是不包含人种信息,研究人员计算了在不同年龄和性别子群的模型,在资料集很少的情况,SeqSNR预测的结果通常优于单任务学习模型。这项研究是将SeqSNR用于EHR预测任务的概念性验证,研究团队已经公开架构程序代码,希望能够促进更多的临床预测研究。

研究人员提到,SeqSNR的性能与任务、时间和资料集有关,拥有人种等额外的人口消息,将有助于提升算法性能。目前的研究都仅是雏形,会需要更严格的评估,才能在实际场景使用该工具。