Google研究:AI辅助临床医疗图片判读表现,会受人为与环境变量影响准确度

Google投入多项领域的AI辅助判读医疗图片研究,以判断糖尿病、心脏疾病、贫血、乳癌等,并宣称媲美人类医生。不过根据Google周一公布一项临床测试显示,AI要用在实际医疗场景还有许多难题要克服。

2017年Google发布研究成果,宣称应用计算机视觉技术和深度神经网络算法,从视网膜眼底镜图像中识别出糖尿病视网膜病变,准确率高达90%,与专业医师不相上下。2018年底Google宣布和泰国公共卫生部医疗服务部合作,由巴吞他尼(Pathum Than)省及清迈当地11家眼科诊所,将眼底镜图片上传位于Google云计算的AI,同时也实地访问诊所,观察护士使用AI的情形,并评估AI用于不同诊所的可行性,将研究发布于《部署于诊所的糖尿病视网膜病变,以人为中心之深度学习系统》报告。

理想场景下AI进行初级图片判读后,再将可能的图片转送给眼科医师,这么做可以减轻医师的负担。但研究发现人员使用出现问题。首先,视网膜图片的截取和分级流程各诊所之间应该一致,但研究人员发现,护士各有自己的做法。此外护士过度相信AI判读能力,而过早将初级检测为阳性的案例送交给眼科医师。

诊所的环境也大大影响图片品质的优劣。一些上传的图片出现模糊或太暗的问题,则AI系统会视之为“不可分级”而拒绝。即使AI接受了,也可能发生误判情形。而11家诊所只有2家有够暗的摄影场地,能让瞳孔放大到拍摄清楚的眼底镜图片。Google坦承未来AI系统训练,可能需要涵盖这些面向。

此外,诊所网络带宽也影响图片上传速度,降低医疗服务。报告提及,有些诊所带宽小而不稳,致使一张图片上传要花费60到90秒,使检测速度大减。一家诊所还曾因网络断线数小时,使一天筛检病患由200人减少为100人。

最后,一些病患并不相信AI能力而拒绝加入测试,他们还是宁愿花时间到大医院。