ヒストグラム

Histogram

ヒストグラムとは

ヒストグラム(Histogram)とは、連続型データの分布を可視化する代表的なグラフで、データの範囲をいくつかの区間(ビン)に分割し、各区間に含まれるデータの頻度を棒の高さで表現します。データの分布形状、中心傾向、ばらつき、外れ値を直感的に把握できる基本的な可視化手法です。

ビン幅の選択

ヒストグラムの見え方はビン幅(ビン数)の設定に大きく依存します。ビンが少なすぎると分布の詳細が失われ、多すぎるとノイズが目立ちます。スタージスの公式、フリードマン-ダイアコニスの規則、スコットの規則などのビン幅決定法が提案されており、データの特性に応じて適切な方法を選択します。

ヒストグラムの解釈

ヒストグラムからは、データの対称性(正規分布に近いか)、歪度(右裾または左裾に偏っているか)、尖度(鋭いピークか平坦か)、多峰性(複数のピークがあるか)、外れ値の存在などを読み取ることができます。

関連する可視化手法

カーネル密度推定(KDE)はヒストグラムを滑らかな曲線で表現する手法で、ビン幅に依存しない分布の推定が可能です。累積分布関数(CDF)プロットはデータの累積割合を表示します。QQプロットは分布の正規性を視覚的に評価するために使用されます。