北医打造卵巢癌识别AI,要帮医生快速揪出女性沉默杀手

台北医学大学病理学科教授陈志荣昨(7日)披露北医卵巢癌病理切片AI进展,目前已能准确识别、定位两种肉眼难以识别的卵巢癌肿瘤组织,也就是浆液性癌和子宫内膜样,可帮助医生加速判读和制定医疗策略。这套AI模型的敏感度和特异性分别达0.93和0.96以上,未来,北医打算扩大医院训练资料的采样范围,以更多样的训练和验证资料,来优化模型。

卵巢癌发生率节节上升,医生得格外小心判断高相似度的两种亚型

北医3年前开始接触数字病理AI,聚焦领域也从胸腔肿瘤转移至近来的卵巢癌。卵巢癌号称女性的沉默杀手,卫福部统计,台湾卵巢癌发生率占女性十大癌症的第七位,近年更节节上升。陈志荣指出,常见的卵巢癌可分为四种亚型,包括浆液性癌(Serous Carcinoma)、子宫内膜样癌(Endometrioid Carcinoma)、亮细胞癌(Clear Cell Carcinoma)、黏液性癌(Mucinous Carcinoma)。

为识别卵巢癌类型,医生得先进行病理切片,再通过显微镜或计算机来观察玻片上的细胞组织形态。陈志荣指出,亮细胞癌和黏液性癌的病理组织形态特殊、容易诊断,但是,浆液性癌和子宫内膜样癌就没那么简单了。

它们的肿瘤组织结构相似,细胞形态也可能类似,而且,就算通过免疫组织化学染色的蛋白质标记表现,也不具完全的决定性。所以,病理医生在诊断浆液性癌和子宫内膜癌时,“就得格外小心;”特别是遇到分化不良(高恶性度)的浆液性癌和子宫内膜样癌,病理医生难以从形态学和免疫组织化学染色找到足够证据,还得请教妇癌病理医生。

这么小心是因为,这两种亚型基因形态、临床表现不同,相对应的治疗策略和病人预后也会有所不同。

收集北医卵巢癌病理切片打造AI,AUC最高达0.994

因此,陈志荣想创建AI识别模型,来判别这两种亚型。于是,他与团队收集了北医附医病理科的卵巢癌病例,将病例玻片扫描、数字化后,再从中挑选浆液性癌和子宫内膜样癌案例,“总共200张片子。”

接着,他们用其中的180张来训练模型,以另外20张来测试、验证。过程中,他们请5位病理医生标注200张病理切片,包括良性肿瘤、浆液性肿瘤和子宫内膜样肿瘤,并将图片切割为471um x 471um大小,来训练模型。之后,模型会根据这些图片,来标示三种肿瘤区域和发生几率。

再来,团队从几个训练模型中,挑出表现最好的一个,来进行验证。陈志荣指出,虽然只利用180张片子来训练,但“AI模型已有不错的表现。”因为,模型对浆液性癌和子宫内膜样癌的敏感度,分别达到0.995和0.933,其特异性更分别达到0.997和0.966。

而且,就分类性能指标AUC值来说,模型良性肿瘤的AUC值已达最高值1.000,对浆液性癌的AUC值则是0.991,对子宫内膜样癌则达0.994。

不过,陈志荣指出,模型还是有预测不佳的状况,比如将子宫内膜样癌,判断为浆液性癌。

再接再厉,要让模型具备更细致的判断能力

不只要会识别两种卵巢癌亚型,陈志荣还进一步,想让模型具备更细致的肿瘤结构判断能力,也就是说,模型还要会分辨两种亚型,是否为实质固态瘤或非实质固态瘤(Solid and non-solid)。

他同样以200张数字病理切片作为资料集,只是在标注上,多了浆液性癌实质固态瘤与非实质固态瘤,以及子宫内膜样癌(非)实质固态瘤。经测试,模型准确率为0.888,良性肿瘤AUC值依然为1.000,而浆液性癌-实质固态瘤的AUC值为0.989,非实质固态瘤则是0.970;子宫内膜样癌-实质固态瘤的AUC值是0.979,非实质固态瘤则是0.936。

他坦言,虽然有些AUC值还可以更好,但模型在预测上也有不错的表现,比如医生原本将图片标注为子宫内膜样癌-实质固态瘤,但模型判断为浆液性癌-实质固态瘤,团队与医生讨论后,发现确实应为浆液性癌-实质固态瘤,显示“模型可正确分类。”

未来要扩大资料多样性,还得思考如何与临床结合

“由此可见,在样本数不多的情况下,还是能训练出可识别肿瘤组织结构的AI,”陈志荣还指出,而且,要让模型分辨亚型细节,也是可行的。

他也希望,未来能将北医另外两家体系医院纳入训练作业,来增加训练和验证资料的多样性;同时也想再赋给模型判断基因形态的能力。

发表评论