この用語をシェア
概要
RAG(Retrieval-Augmented Generation)は、情報検索とテキスト生成を組み合わせた手法で、大規模言語モデルが外部知識ベースから関連情報を取得して、より正確で最新の応答を生成する技術です。モデルの訓練時に含まれていない情報や最新の情報を利用できることが特徴です。
詳しい解説
RAGの仕組みは、まずユーザーのクエリに対して、関連する文書やデータを外部知識ベースから検索します。この構成要素はリトリーバー(Retriever)と呼ばれます。次に、検索された情報をコンテキストとして大規模言語モデルに入力し、最終的な応答を生成します。この構成要素はジェネレーター(Generator)と呼ばれます。情報検索には、ベクターデータベースがよく使用され、テキストをエンベディングベクターに変換して類似検索を行います。
使い方や使われるシーン
- 企業内ナレッジベース: 社内文書、マニュアル、ポリシーを活用した社内チャットボット
- 顧客サポート: 製品情報、FAQ、マニュアルを参照した顧客支援システム
- 研究支援: 論文データベースを参照した学術的質問応答
- メディア・NEWS: 最新ニュース記事を参照したリアルタイム情報提供
- 法的相談: 法律文書、判例を参照した法的アドバイス
- プログラミング支援: コードベース、ドキュメントを参照したコード生成
- 医療情報: 医学文献を参照した医療情報提供