摘要
近年来,基于人工智能(Artificial Intelligence, AI)的预测模型在放射治疗患者剂量验证(Patient-specific Quality Assurance, PSQA)中取得了重要进展,但是由于AI模型的“黑匣子”特性导致其在临床应用中的不确定性较难量化,影响了临床使用的置信度,因此进行不确定性量化(UQ)以确保AI模型的临床安全变得尤为必要。
提出了一种基于不确定性引导的 PSQA 预测框架。首先,首先建立基于射野通量图和射野复杂性特征的多模态PSQA分类模型,并采用基于变分蒙特卡罗近似贝叶斯推断方法对分类结果进行不确定性分析。通过 Correct-Certain(CC)曲线和 Incorrect-Uncertain(IU)曲线确定预设的临床不确定性阈值,对超过阈值的样本进行人为干预。接着,将分类模型的中间层特征与不确定性信息相结合,建立多层感知器(Multilayer Perceptron, MLP)预测 γ 通过率(GPR)。最后,在临床测试集上进行了前瞻性测试,以系统评估所提框架的临床可靠性。
在3%/3 mm、3%/2 mm和2%/2 mm的γ标准下,分类模型的灵敏性分别为 83.33%、93.33% 和 94.74%;通过CC曲线和IU曲线确定的临床不确定性干预阈值范围分别为0.057–0.240、0.014–0.207以及0.080–0.244。在3%/3mm的γ标准下,仅需对57.27%的样本进行人为干预,即可实现100%的临床灵敏性,相较传统的基于测量的PSQA方法,人为工作量减少了42.73%。GPR 预测模型在3%/3mm、3%/2mm和2%/2mm的γ标准下的平均绝对误差(MAE)分别为 1.64%、1.88%和2.57%;对未通过的样本的预测MAE 相对降低了21.03%。在临床前瞻性测试中,在三个γ标准下,采用最小临床不确定性干预阈值并进行人为干预后,临床灵敏性、特异性和准确率均达到 100%。
该框架通过分析预测不确定性,提高了基于AI的PSQA的临床可靠性,减少了人为干预的工作量,并改善了未通过样本的GPR预测精度,为基于AI的PSQA投入临床使用提供了安全保障。
