ROC分析

ROC Analysis

ROC分析とは

ROC分析(ROC Analysis)とは、二値分類モデルの性能を評価するための手法で、ROC曲線(Receiver Operating Characteristic Curve)を用いて真陽性率(感度)と偽陽性率(1-特異度)の関係を可視化します。もともとレーダー信号検出理論に由来し、現在は医学診断、機械学習、品質管理など幅広い分野で使用されています。

ROC曲線の読み方

ROC曲線はX軸に偽陽性率、Y軸に真陽性率をとり、分類閾値を変化させたときの各率をプロットした曲線です。曲線が左上角に近いほど性能が高く、対角線(ランダム予測)は最低水準を示します。曲線の形状から、分類器の全体的な性能と最適な閾値を判断できます。

AUC(曲線下面積)

AUC(Area Under the Curve)はROC曲線の下側の面積で、0から1の値を取ります。AUCが1に近いほど優れた分類性能を示し、0.5はランダムな分類に相当します。一般的に、AUCが0.7以上で許容可能、0.8以上で良好、0.9以上で優秀と評価されます。

ROC分析の利点と注意点

ROC分析は閾値に依存しない総合的な性能評価が可能で、クラス不均衡データでも安定した評価ができます。ただし、多クラス分類への拡張には工夫が必要で、また不均衡データではPR曲線(適合率-再現率曲線)との併用が推奨される場合があります。