カイ二乗検定とは
カイ二乗検定(Chi-squared Test)とは、カテゴリカルデータ(質的データ)に対して、観測された度数分布が理論的に期待される分布と統計的に異なるかどうかを検定する手法です。ピアソンのカイ二乗検定とも呼ばれ、名義尺度や順序尺度のデータ分析に広く使用されます。
適合度検定と独立性検定
カイ二乗検定には主に2つの種類があります。適合度検定は、1つの変数の観測度数が期待度数と一致するかを検証します。独立性検定(クロス集計表の検定)は、2つのカテゴリ変数間に関連があるかどうかを検証します。
検定統計量の計算
カイ二乗統計量は、各セルの「(観測度数 - 期待度数)の二乗 ÷ 期待度数」を合計して算出します。この値が大きいほど、観測と期待のずれが大きいことを示します。算出された統計量はカイ二乗分布と比較され、p値が求められます。
カイ二乗検定の注意点
カイ二乗検定にはいくつかの前提条件があります。期待度数が5未満のセルが多い場合は検定の精度が低下するため、フィッシャーの正確確率検定の使用が推奨されます。また、サンプルサイズが大きすぎると実質的に意味のない差でも有意になる場合があるため、効果量(クラメールのV)の確認も重要です。