分類レポート

Classification Report

分類レポートとは

分類レポート(Classification Report)とは、分類モデルの性能を各クラスごとに詳細にまとめた報告書です。各クラスの適合率、再現率、F1スコアに加え、サポート(各クラスのサンプル数)を一覧表として出力します。scikit-learnのclassification_report関数で簡単に生成できることから、実務で頻繁に使用されます。

分類レポートの構成

分類レポートには各クラスの行とまとめの行が含まれます。各クラスの行には、そのクラスに対する適合率・再現率・F1スコア・サポートが記載されます。まとめの行には、accuracy(全体精度)、macro avg(マクロ平均)、weighted avg(加重平均)が含まれ、モデル全体の性能を要約します。

分類レポートの読み方

分類レポートを読む際は、まず各クラスのF1スコアに注目し、性能が低いクラスがないかを確認します。特定のクラスで再現率が低い場合はそのクラスの見逃しが多く、適合率が低い場合は誤検出が多いことを示します。サポート数が極端に少ないクラスがある場合、その評価は信頼性が低い可能性があります。

改善への活用

分類レポートはモデルの改善方向を特定するための出発点となります。性能が低いクラスに対して、データ拡張、特徴量エンジニアリング、クラス重みの調整などの対策を検討できます。定期的にレポートを生成し、改善の効果を追跡することが効果的です。