分類(Classification)とは、入力データを事前に定義されたカテゴリ(クラス)のいずれかに割り当てる教師あり学習のタスクです。スパム検出、画像認識、感情分析など、機械学習の最も一般的な応用の一つです。
分類の種類
二値分類(2クラス:陽性/陰性)と多クラス分類(3クラス以上)が基本です。さらに、1つのサンプルが複数のクラスに属しうるマルチラベル分類もあります。
分類アルゴリズム
ロジスティック回帰、決定木、ランダムフォレスト、SVM、k-NN、ナイーブベイズ、ニューラルネットワークなど、多様なアルゴリズムが分類に利用できます。
評価指標
精度、適合率、再現率、F値、ROC-AUC、混同行列など、複数の指標を用いてモデルの性能を多角的に評価します。データの不均衡度やタスクの要件に応じた適切な指標の選択が重要です。