質問応答とは
質問応答(QA: Question Answering)とは、自然言語で書かれた質問に対して適切な回答を自動的に生成または抽出する自然言語処理タスクです。検索エンジン、バーチャルアシスタント、カスタマーサポートなど、幅広い応用があります。
質問応答の種類
抽出型QAは与えられた文書から回答となる箇所を抽出します(例:SQuADデータセット)。生成型QAは質問に対して新しい回答テキストを生成します。オープンドメインQAは特定の文書ではなく、大規模な知識ベースや文書集合から回答を探索します。クローズドブックQAはモデルの内部知識のみで回答を生成します。
質問応答の技術
初期はルールベースやパターンマッチングの手法が使われていましたが、BERTの登場により抽出型QAの精度が飛躍的に向上しました。RAG(検索拡張生成)は、検索エンジンで関連文書を取得し、大規模言語モデルで回答を生成するハイブリッドアプローチで、最新の情報にも対応できます。
課題と展望
多段階推論を必要とする質問、数値推論、常識的知識を要する質問などは依然として難しいタスクです。大規模言語モデルの発展により性能は急速に向上していますが、回答の正確性の保証が重要な課題となっています。