パープレキシティとは？わかりやすく解説 | AI用語集

パープレキシティとは

パープレキシティ（Perplexity）とは、言語モデルの性能を評価するための指標で、モデルがテストデータに対してどれだけ「困惑しているか」を数値化したものです。パープレキシティが低いほど、モデルがテキストをより正確に予測できていることを意味します。

パープレキシティの直感的理解

パープレキシティは「次の単語を予測する際に、平均的にいくつの候補の中から選んでいるか」と解釈できます。例えばパープレキシティが50であれば、平均的に50個の候補から正解を選んでいるような状態です。パープレキシティが1に近いほど、モデルの予測が正確であることを示します。

数学的定義

パープレキシティは、テストデータに対する言語モデルの対数尤度の指数関数として定義されます。具体的には、テスト文のトークン数をNとすると、PP = exp(-1/N × Σlog P(w_i | w_1,...,w_{i-1}))で計算されます。クロスエントロピーの指数関数とも等価です。

パープレキシティの活用と限界

パープレキシティは同一のテストデータ・語彙で比較した場合に有効な指標です。ただし、生成テキストの品質や有用性を直接評価するものではないため、BLEUやROUGEなどのタスク固有の指標や、人間による評価と組み合わせて使用することが推奨されます。

← 自然言語処理（NLP）一覧に戻る AI用語集 TOPへ →