機械学習
データからパターンや規則性を学習するアルゴリズム群を扱うカテゴリです。教師あり学習・教師なし学習・強化学習の3つの学習パラダイムを軸に、線形回帰やロジスティック回帰といった基本手法から、SVM やランダムフォレスト、ブースティングなどの実践的な手法、さらにモデル評価のための指標や交差検証まで、G検定で問われる機械学習の重要キーワードを体系的に解説しています。
教師あり学習
正解ラベル付きデータを用いてモデルを訓練する学習手法。分類と回帰に大別される。
教師なし学習
正解ラベルなしでデータの構造やパターンを発見する学習手法。クラスタリングや次元削減など。
強化学習
試行錯誤を通じて報酬を最大化する行動方策を学習する手法。AlphaGoで注目された。
線形回帰
入力と出力の間に線形関係を仮定して予測を行う最も基本的な回帰手法。
ロジスティック回帰
シグモイド関数を用いて二値分類を行う手法。名前に「回帰」とあるが分類手法。
サポートベクターマシン(SVM)
マージン最大化により分類を行う手法。カーネルトリックで非線形分類にも対応。
ランダムフォレスト
複数の決定木を組み合わせるアンサンブル学習手法。バギングに基づく。
ブースティング
弱い学習器を逐次的に組み合わせて強い学習器を構築する手法。AdaBoost、XGBoostなど。
k-means法
データをk個のクラスタに分割する代表的なクラスタリング手法。
主成分分析(PCA)
データの分散が最大となる方向を見つけて次元を削減する手法。
評価指標(混同行列・適合率・再現率)
モデルの性能を評価するための指標群。タスクに応じて適切な指標を選択。
交差検証と過学習
モデルの汎化性能を評価する手法と、訓練データに過度に適合する問題。