決定木とは？わかりやすく解説 | AI用語集

決定木（Decision Tree）とは、データの特徴量に基づいて条件分岐を繰り返し、木構造でデータを分類・回帰するアルゴリズムです。結果が視覚的に理解しやすく、解釈性の高いモデルとして広く利用されています。

決定木の構造

決定木は「根ノード」から始まり、各ノードで特徴量に基づく条件分岐を行い、「葉ノード」で最終的な予測値を出力します。例えば「年収が500万円以上か？」→「年齢が30歳以上か？」のように分岐していきます。

分割基準

ノードの分割には、情報利得（Information Gain）、ジニ不純度（Gini Impurity）、エントロピーなどの基準が使われます。CARTアルゴリズムではジニ不純度が、ID3やC4.5では情報利得が使われるのが一般的です。

過学習の問題と対策

決定木は深くしすぎると訓練データに過度に適合します。剪定（Pruning）、最大深さの制限、最小サンプル数の設定などで制御します。この弱点を補うためにランダムフォレストや勾配ブースティングなどのアンサンブル手法が生まれました。

← 機械学習の基礎一覧に戻る AI用語集 TOPへ →