ROC曲线

(Receiver Operating Characteristic Curve)是用于评估二元分类器性能的图形工具。在ROC曲线上,横轴表示False Positive Rate(FPR),纵轴表示True Positive Rate(TPR),又称为灵敏度或召回率。

  • True Positive Rate (TPR): 这是指在实际为正例的样本中,被正确地预测为正例的比例。
  • False Positive Rate (FPR): 这是指在实际为负例的样本中,被错误地预测为正例的比例。
  • True Positive Rate (TPR): 这是指,当有病的时候,你的模型成功地预测出了有病的概率。高TPR表示你的模型在真正有病的情况下表现良好。
  • False Positive Rate (FPR): 这是指,当实际上是健康的时候,你的模型错误地预测为有病的概率。高FPR表示你的模型在实际上是健康的情况下出现了错误。

现在,ROC曲线显示了在不同的阈值下,你可以通过调整模型的预测概率来改变TPR和FPR。AUC(Area Under the ROC Curve)是这条曲线下的面积。如果AUC接近1,说明你的模型在不同情况下都表现得很好。如果AUC接近0.5,说明模型的性能类似于随机猜测。

简而言之,AUC提供了一种综合评估分类器性能的指标,考虑了在不同条件下的表现。
ROC曲线通过在不同的分类阈值下计算并绘制TPR和FPR,展示了模型在灵敏度和特异性之间的权衡。曲线越靠近左上角,表示模型在降低FPR的同时提高了TPR,即在正例的识别上表现更好。AUC(Area Under the ROC Curve)是ROC曲线下的面积,提供了一个单一的性能指标。AUC越接近1,表示分类器性能越好;越接近0.5,表示性能越差,类似于随机猜测。