調整済みR2

Adjusted R-squared

調整済みR2とは

調整済みR2(Adjusted R-squared)とは、重回帰分析において説明変数の数を考慮して補正した決定係数です。通常のR2は説明変数を追加するだけで値が上昇しますが、調整済みR2は不必要な変数の追加にペナルティを課すことで、モデルの真の説明力をより正確に評価します。

なぜ調整が必要か

通常のR2は説明変数を増やせば増やすほど値が大きくなります。これは、ランダムな変数を追加しても偶然の相関によってR2がわずかに増加するためです。この問題により、変数の選択基準としてR2を使うと過剰に複雑なモデルが選ばれる危険があります。調整済みR2は変数の数に基づくペナルティを含むため、真に有用な変数のみを含むモデルを選択する助けとなります。

調整済みR2の計算

調整済みR2は、サンプルサイズnと説明変数の数pを用いて計算されます。具体的には、1 - [(1 - R2)(n - 1) / (n - p - 1)] という式で表されます。変数を追加したときにR2の改善がペナルティを上回る場合にのみ調整済みR2が増加します。

実務での活用

調整済みR2はモデルの変数選択、ステップワイズ回帰、モデル比較などで広く使用されます。AIC(赤池情報量基準)やBIC(ベイズ情報量基準)といった他のモデル選択基準と合わせて使うことで、より信頼性の高いモデル選択が可能になります。