特徴量

Feature

特徴量(Feature)とは、機械学習モデルに入力するデータの個々の属性や変数のことです。説明変数、入力変数、属性とも呼ばれ、モデルが予測を行うために利用する情報の基本単位です。

特徴量の例

例えば住宅価格予測では、面積、部屋数、築年数、最寄り駅までの距離などが特徴量となります。画像認識では各ピクセルの値が特徴量となり、自然言語処理では単語の出現頻度や単語ベクトルが特徴量として使われます。

良い特徴量の条件

良い特徴量は、予測対象との相関が高く、他の特徴量と過度に相関がなく(多重共線性の回避)、ノイズが少ないものです。適切な特徴量を設計・選択することは、モデルの性能を大きく左右する重要なステップです。

特徴量の種類

特徴量には、数値型(連続値・離散値)、カテゴリ型(名義尺度・順序尺度)、テキスト型、画像型などがあります。モデルに入力する際には、種類に応じた適切な前処理(正規化、エンコーディング等)が必要です。