確率分布とは
確率分布(Probability Distribution)とは、確率変数が取りうる値とその確率の対応関係を表す数学的な関数です。データの生成メカニズムをモデル化し、統計的推論の基盤を提供します。離散型確率分布と連続型確率分布に大別されます。
離散型確率分布
離散型確率分布は、確率変数が離散的な値(整数など)を取る場合の分布です。代表的なものに、二項分布(成功・失敗の回数)、ポアソン分布(一定期間の事象発生回数)、幾何分布(初回成功までの試行回数)、超幾何分布(非復元抽出)などがあります。
連続型確率分布
連続型確率分布は、確率変数が連続的な値を取る場合の分布です。正規分布(ガウス分布)、指数分布、一様分布、ベータ分布、ガンマ分布、t分布、F分布、カイ二乗分布などがあります。特に正規分布は中心極限定理により、統計学全般で重要な役割を果たします。
確率分布の選択
データ分析では、データの性質に合った確率分布を選ぶことが重要です。ヒストグラムやQ-Qプロットによる視覚的な確認、適合度検定による統計的な検証などの方法で、データに最も適した分布を特定します。適切な分布の選択は、正確な統計的推論に不可欠です。