影像组学研究通常使用以下指标来评价模型的性能和预测能力:
敏感性(Sensitivity):又称为真阳性率(True Positive Rate, TPR),是指模型正确识别阳性样本的比例。敏感性越高,漏诊率越低。
特异性(Specificity):又称为真阴性率(True Negative Rate, TNR),是指模型正确识别阴性样本的比例。特异性越高,误诊率越低。
准确率(Accuracy):是指模型正确识别所有样本(包括阳性和阴性样本)的比例。准确率越高,说明模型预测的总体准确性越高。
精确度(Precision):又称为阳性预测值(Positive Predictive Value, PPV),是指模型识别为阳性的样本中,真正为阳性的比例。精确度越高,说明模型预测阳性的准确性越高。
召回率(Recall):与敏感性相同,也是指模型正确识别阳性样本的比例。
F1分数(F1-score):是精确度和召回率的调和平均值,用于综合评估模型在阳性样本识别的准确性和漏诊率。F1分数越高,说明模型的综合性能越好。
AUC-ROC(Area Under the Receiver Operating Characteristic Curve):ROC曲线下的面积,用于评估模型在不同阈值下的分类性能。AUC值越接近1,说明模型的分类性能越好;若AUC值为0.5,则模型的分类性能等同于随机猜测。
Kappa系数(Cohen’s Kappa):用于评估模型预测与实际观察之间的一致性。Kappa值范围从-1(完全不一致)到1(完全一致),值越大,说明模型预测与实际观察之间的一致性越好。
这些指标可以根据研究目的和具体场景进行选择和组合,以全面评估模型的性能。