ナイーブベイズ(Naive Bayes)とは、ベイズの定理に基づく確率的分類アルゴリズムです。各特徴量が互いに独立であるという「ナイーブ(素朴)」な仮定を置くことで、計算を大幅に簡略化しつつ、実用的な分類精度を達成します。
ベイズの定理との関係
ナイーブベイズはベイズの定理P(C|X) = P(X|C)×P(C)/P(X)を用いて、特徴量Xが与えられた時の各クラスCの事後確率を計算し、最も確率の高いクラスに分類します。
ナイーブベイズの種類
ガウシアンナイーブベイズ(連続値特徴量)、多項ナイーブベイズ(カウントデータ、テキスト分類に適用)、ベルヌーイナイーブベイズ(バイナリ特徴量)など、データの分布に応じた変種があります。
テキスト分類での活躍
特にスパムフィルタや感情分析などのテキスト分類で高い性能を発揮します。学習が高速で大規模データにもスケールしやすく、少量データでも比較的安定した性能を示します。