決定係数

Coefficient of Determination

決定係数とは

決定係数(Coefficient of Determination)とは、回帰分析においてモデルがデータの変動をどの程度うまく捉えているかを表す統計量で、R2(アール・スクエア)とも表記されます。R2スコアと本質的に同じ概念であり、統計学の文脈では「決定係数」、機械学習の文脈では「R2スコア」と呼ばれることが多いです。

決定係数の意味

決定係数は、目的変数の全変動のうち、説明変数によって説明できる変動の割合を表します。例えば、決定係数が0.75であれば、モデルの説明変数が目的変数の変動の75%を説明していることを意味し、残りの25%は説明できない変動(誤差)となります。

単回帰と重回帰での解釈

単回帰分析では、決定係数は相関係数の二乗に等しくなります。重回帰分析では、複数の説明変数が組み合わさってどの程度目的変数を予測できるかを示します。ただし、重回帰では説明変数の数が増えるほど決定係数が自動的に増加する傾向があるため、調整済み決定係数の使用が推奨されます。

決定係数の限界

決定係数が高いからといって因果関係があるとは限りません。また、モデルの適合度は高くても予測精度が低い場合もあります。決定係数はモデルの説明力を示す一つの側面にすぎず、残差分析や他の統計検定と組み合わせて総合的に判断する必要があります。