RAG(生成AI)とは？わかりやすく解説

RAGとは

RAG（Retrieval-Augmented Generation：検索拡張生成）とは、外部のデータベースや文書から関連情報を検索し、その情報をLLMのコンテキストに追加することで、より正確で最新の回答を生成する手法です。LLM単体の知識の限界を補完し、ハルシネーションを軽減する最も実用的なアプローチとして広く採用されています。

RAGの仕組み

RAGは大きく3つのステップで構成されます。まず「インデクシング」段階で、文書をチャンク（断片）に分割しベクトル化してデータベースに格納します。次に「検索」段階で、ユーザーの質問をベクトル化し、類似度の高い文書チャンクを検索します。最後に「生成」段階で、検索された文書チャンクをプロンプトに含めてLLMに回答を生成させます。

RAGの応用と発展

企業では社内FAQ、マニュアル、ナレッジベースを活用したカスタマーサポートや社内チャットボットにRAGが活用されています。発展形として、検索結果を再ランキングするAdvanced RAG、複数回の検索と生成を反復するIterative RAG、知識グラフを活用するGraph RAGなどの手法も研究されています。RAGの実装にはLangChain、LlamaIndexといったフレームワークが広く利用されています。

RAGとは

RAGの仕組み

RAGの応用と発展

関連用語