散布図

Scatter Plot

散布図とは

散布図(Scatter Plot)とは、2つの変数の関係を可視化するために、各データポイントを2次元平面上の点として表示するグラフです。横軸(X軸)と縦軸(Y軸)にそれぞれの変数を割り当て、データの分布パターン、相関関係、外れ値を視覚的に確認することができます。

散布図から読み取れる情報

散布図からは変数間の関係の方向(正の相関・負の相関)、関係の強さ(点の散らばり具合)、関係の形状(線形・非線形)、外れ値の存在、クラスター(データの塊)などの情報を読み取ることができます。相関分析や回帰分析の前に散布図で関係性を確認することが推奨されます。

散布図の拡張

基本的な散布図に加えて、バブルチャート(点の大きさで第三の変数を表現)、色分け散布図(色でカテゴリを区別)、散布図行列(複数変数のペアワイズ散布図)、回帰直線の追加、密度プロット(点が密集する領域をカーネル密度で表示)など、多様な拡張が可能です。

散布図の注意点

データ点が多すぎる場合はオーバープロッティング(点の重なり)が生じ、パターンの把握が難しくなります。この問題に対しては、透明度の調整、ヘキサゴナルビニング、2次元ヒストグラム、サンプリングなどの対策が有効です。