箱ひげ図

Box Plot

箱ひげ図とは

箱ひげ図(Box Plot)とは、データの分布を五数要約(最小値、第1四分位数、中央値、第3四分位数、最大値)で表現する統計グラフです。ジョン・テューキーが1977年に提案した手法で、データの中心傾向、散布度、歪度、外れ値を一目で把握することができます。

箱ひげ図の読み方

箱の下端が第1四分位数(Q1:25パーセンタイル)、上端が第3四分位数(Q3:75パーセンタイル)を表し、箱内の線が中央値です。ひげはQ1-1.5×IQRからQ3+1.5×IQR(IQR=Q3-Q1)の範囲を示し、それを超えるデータ点は個別に外れ値として表示されます。

箱ひげ図の活用

箱ひげ図は複数のグループ間の分布を比較する際に特に有効です。例えば、部門別の売上分布、地域別の気温分布、実験条件別の測定値の比較などに使用されます。ヒストグラムと異なり、複数の分布をコンパクトに並べて比較できる利点があります。

箱ひげ図の発展形

バイオリンプロットは箱ひげ図とカーネル密度推定を組み合わせ、分布の形状をより詳細に表現します。ビースウォームプロットは個々のデータ点を表示します。ノッチ付き箱ひげ図では中央値の信頼区間が示され、グループ間の中央値の差の統計的有意性を視覚的に判断できます。