基于Stacking集成机器学习的多尺度影像组学融合模型用于IA期肺腺癌脏层胸膜侵犯的风险分层

作者：林雪瑶

单位：宁波市医疗中心李惠利医院

摘要

目的：探究Stacking集成机器学习算法的价值，并全面比较影像组学模型、生境模型、临床模型及融合模型在IA期肺腺癌（LUAD）脏层胸膜侵犯（VPI）术前预测中的效能。

材料与方法：本研究回顾性纳入来自两家医疗中心术后病理确诊的491例IA期LUAD患者，划分为训练集（n=272）、内部验证集（n=117）和外部验证集（n=102）。采用基于CT图像的Stacking集成机器学习算法构建以下预测模型：基于大体肿瘤体积（GTV）和4 mm瘤周体积（PTV4）的影像组学模型（PM_GTV和PM_PTV4）；通过无监督K-means聚类识别肿瘤内亚区建立的生境模型（PM_Habitat）；以及基于临床特征的临床模型（PMClinical）。最后，采用后融合策略整合上述四个模型的标签，构建融合模型（PM_Fusion）。采用曲线下面积（AUC）等指标全面评估模型性能，并采用SHapley加性解释（SHAP）进行可解释性分析。

结果：Stacking集成模型的性能在绝大多数情况下优于单一子模型。通过后融合策略构建的多维度PMFusion取得了最优的综合预测性能，其在训练集、内部验证集和外部验证集的AUC（95% CI）分别为0.911（0.878–0.943）、0.815（0.735–0.895）和0.792（0.682–0.901）。SHAP分析验证了PM_Fusion的可解释性，并确定PM_Habitat标签为最重要的特征。

结论：Stacking集成机器学习模型性能优于单一机器学习模型，同时整合了GTV、PTV4、生境及临床特征的PM_Fusion可作为IA期肺腺癌患者VPI状态的可靠预测工具。

关键词：肺癌脏层胸膜浸润集成机器学习生境分析

来源：浙江省中西医结合学会影像专业委员会第三十一次学术会议暨中西医结合腹盆影像学术交流会