正規分布とは
正規分布(Normal Distribution)とは、平均値を中心に左右対称の釣り鐘型(ベルカーブ)をした連続型確率分布です。ガウス分布(Gaussian Distribution)とも呼ばれ、自然界や社会現象の多くがこの分布に従うため、統計学において最も重要な分布の一つです。
正規分布の特徴
正規分布は平均(μ)と標準偏差(σ)の2つのパラメータで完全に特定されます。平均を中心に左右対称で、データの約68%が平均±1標準偏差内に、約95%が平均±2標準偏差内に、約99.7%が平均±3標準偏差内に収まります(68-95-99.7則)。
中心極限定理
正規分布が統計学で重要な理由の一つが中心極限定理です。この定理は、母集団がどんな分布であっても、十分大きなサンプルの平均値の分布は正規分布に近づくことを示しています。このため、多くの統計的検定や推定法が正規分布を前提として設計されています。
標準正規分布
平均が0、標準偏差が1の正規分布を標準正規分布(Z分布)と呼びます。任意の正規分布はZ変換(標準化)により標準正規分布に変換でき、標準正規分布表を用いた確率計算が可能になります。データの標準化は機械学習の前処理でも頻繁に使用されます。