パイプラインとは？わかりやすく解説 | AI用語集

パイプライン（Pipeline）とは、データの前処理、特徴量変換、モデルの学習・予測までの一連の処理ステップを連結し、一つの統合されたワークフローとして管理する仕組みです。

パイプラインの利点

データリークの防止（各ステップが正しい順序で実行される）、コードの再現性・可読性の向上、交差検証との安全な連携、本番デプロイの容易化など、多くの実践的な利点があります。

scikit-learnのPipeline

scikit-learnのPipelineクラスは最も広く使われている実装で、前処理（StandardScaler）、特徴量選択（SelectKBest）、モデル（RandomForest）などを連結できます。

MLパイプライン全体

データ収集→前処理→特徴量エンジニアリング→モデル学習→評価→デプロイ→モニタリングまでの全体をML Pipelineと呼ぶこともあり、MLOpsの概念と密接に関連しています。

← 機械学習の基礎一覧に戻る AI用語集 TOPへ →