摘要
目的:探究Stacking集成机器学习算法的价值,并全面比较影像组学模型、生境模型、临床模型及融合模型在IA期肺腺癌(LUAD)脏层胸膜侵犯(VPI)术前预测中的效能。
材料与方法:本研究回顾性纳入来自两家医疗中心术后病理确诊的491例IA期LUAD患者,划分为训练集(n=272)、内部验证集(n=117)和外部验证集(n=102)。采用基于CT图像的Stacking集成机器学习算法构建以下预测模型:基于大体肿瘤体积(GTV)和4 mm瘤周体积(PTV4)的影像组学模型(PMGTV和PMPTV4);通过无监督K-means聚类识别肿瘤内亚区建立的生境模型(PMHabitat);以及基于临床特征的临床模型(PMClinical)。最后,采用后融合策略整合上述四个模型的标签,构建融合模型(PMFusion)。采用曲线下面积(AUC)等指标全面评估模型性能,并采用SHapley加性解释(SHAP)进行可解释性分析。
结果:Stacking集成模型的性能在绝大多数情况下优于单一子模型。通过后融合策略构建的多维度PMFusion取得了最优的综合预测性能,其在训练集、内部验证集和外部验证集的AUC(95% CI)分别为0.911(0.878–0.943)、0.815(0.735–0.895)和0.792(0.682–0.901)。SHAP分析验证了PMFusion的可解释性,并确定PMHabitat标签为最重要的特征。
结论:Stacking集成机器学习模型性能优于单一机器学习模型,同时整合了GTV、PTV4、生境及临床特征的PMFusion可作为IA期肺腺癌患者VPI状态的可靠预测工具。
