RAGとは、生成AIが答えを作る前に、外部の資料やデータを調べる仕組みです。 日本語では「検索拡張生成」と呼ばれます。
かんたんに言うと、AIに「答える前に、資料を見てから答えてもらう」ための方法です。 何も見ずに答えるより、資料を見ながら答えるほうが、内容を目的に合わせやすくなります。
この記事では、RAGの意味、読み方、仕組み、使われる場面、LLMやファインチューニングとの違いを初心者向けに解説します。 むずかしい言葉は、その場でかんたんに説明します。
ここだけ読めばOK
RAGとは、生成AIが外部の資料を調べて、その情報をもとに答える仕組みです。 社内マニュアル、商品説明、FAQなどをもとに答えるAIで使われます。
関連するIT用語をまとめて確認したい方は、IT用語一覧もあわせてご覧ください。
RAGとは?かんたんに言うと「AIが答える前に資料を調べる仕組み」

RAGとは、生成AIに外部の情報を探させ、その情報をもとに回答を作らせる仕組みです。 ここでいう外部の情報とは、社内資料、商品説明書、FAQ、マニュアルなどのことです。
身近な例でいうと、先生に質問したときに、先生が教科書や資料を見ながら答えてくれるイメージです。 何も見ずに答えるより、資料を確認したほうが、内容が正確になりやすくなります。
ITの世界では、生成AIが必要な資料を探します。 そして、見つけた情報をもとに、人が読みやすい文章で答えを作ります。
RAGの読み方と正式名称
RAGの読み方
RAGは「ラグ」と読みます。 英語の頭文字を並べた言葉です。
ただし、「ラグ」という言葉には、じゅうたんや布きれなど別の意味もあります。 AI関連の記事では、生成AIで使われるRAGを指すことが多いです。
RAGは何の略か
RAGは「Retrieval-Augmented Generation」の略です。 英語のままだとわかりにくいですが、意味はそれほど難しくありません。
Retrievalは「必要な情報を探して取り出すこと」です。 Generationは「文章などを作ること」です。
日本語では検索拡張生成と呼ばれる
RAGは、日本語では「検索拡張生成」と呼ばれます。 漢字が多いので、初めて見るとむずかしく感じる言葉です。
検索拡張生成とは、情報を探してから、その情報を使って文章を作る仕組みのことです。 つまり「調べてから答えるAIの仕組み」と考えるとわかりやすいです。
なぜ生成AIにRAGが使われるのか
生成AIは何でも知っているわけではない
生成AIとは、文章や画像などを作るAIのことです。 質問に答えたり、文章を要約したりできます。
ただし、生成AIは何でも知っているわけではありません。 会社だけが持っている資料や、最近変わった情報を知らないことがあります。
たとえば、社内ルールや商品の最新情報は、生成AIだけでは答えにくい場合があります。 そこで、外部の資料を見ながら答えるRAGが使われます。
新しい情報や社内資料をもとに答えやすくする
RAGを使うと、生成AIが社内資料やマニュアルを見ながら答えられます。 一般的な答えではなく、その会社や学校に合った答えを作りやすくなります。
たとえば、会社の経費ルールについて聞いた場合を考えます。 RAGを使うと、社内の経費マニュアルを探し、その内容をもとに答えられます。
ハルシネーションを減らす助けになる
生成AIが、事実と違う内容をもっともらしく答えることがあります。 これをハルシネーションといいます。
RAGは、資料をもとに答えるため、ハルシネーションを減らす助けになります。 ただし、完全になくせるわけではありません。
元の資料が古い場合や、AIが資料を読み違えた場合は、答えがずれることもあります。 大切な場面では、人が内容を確認することも必要です。
RAGの仕組みを初心者向けに解説

RAGの流れは、大きく4つに分けられます。 「質問を受ける」「資料を探す」「資料をAIに見せる」「答えを作る」という流れです。
質問を受け取る
まず、利用者がAIに質問します。 たとえば「この商品の返品ルールを教えてください」と聞きます。
AIの仕組みは、その質問を受け取り、どの資料を探せばよいかを考えます。
関係する資料やデータを探す
次に、質問に関係する資料を探します。 たとえば、返品ルールが書かれたマニュアルやFAQを探します。
FAQとは、よくある質問と回答をまとめたものです。 「よくある質問集」と考えるとわかりやすいです。
資料は、データベースに保存されていることがあります。 データベースとは、情報を整理して保存しておく場所のことです。
探した情報を生成AIに見せる
見つけた資料は、生成AIに渡されます。 ここでいう「渡す」とは、AIが回答を作るときに見られるようにすることです。
人でたとえると、質問に答える前に、必要なページを開いて確認するようなものです。 そのうえで、相手に伝わる文章にまとめます。
生成AIが回答を作る
最後に、生成AIが回答を作ります。 たとえば「未開封で購入から30日以内なら返品できます」のように説明します。
RAGのポイントは、AIが自分の知識だけで答えるのではないことです。 外部の資料を確認してから答える点に特徴があります。
RAGの身近な例
会社のマニュアルを調べて答えるチャットボット
チャットボットとは、質問に自動で答える仕組みです。 会社では、社内ルールや手続きの案内に使われることがあります。
RAGを使うと、AIが社内マニュアルを探して答えられます。 「休暇の申請方法」や「経費の出し方」などを、資料にもとづいて案内できます。
学校の資料をもとに答える学習サポートAI
学校でもRAGは役立ちます。 授業資料や配布プリントをもとに、質問に答えるAIを作れます。
たとえば「この単元の大事なところを教えて」と聞いた場合です。 AIが授業資料を見ながら、内容に合った説明を作れます。
商品の説明書をもとに答える問い合わせAI
商品サポートでもRAGは使われます。 説明書やFAQをもとに、お客さまの質問に答えるAIです。
たとえば「電源が入らないときはどうすればよいですか」と聞いたとします。 AIは説明書の該当部分を探し、その内容をもとに案内します。
RAGとLLMの違い
LLMは文章を作るAIの頭脳
LLMとは、大量の文章をもとに、自然な文章を作るAIのことです。 日本語では「大規模言語モデル」と呼ばれます。
この言葉もむずかしく見えますが、まずは「文章を作るAIの頭脳」と考えるとよいです。 ChatGPTのような生成AIの中心にある仕組みです。
RAGは外部の情報を探して見せる仕組み
RAGは、LLMそのものではありません。 LLMに外部の資料を見せて、回答に使えるようにする仕組みです。
たとえるなら、LLMは文章を書く人です。 RAGは、その人に必要な資料を探して渡す係です。
IT用語としては、RAGは生成AIの回答を外部情報で補う方法です。 LLMと組み合わせて使われることが多いです。
RAGとファインチューニングの違い
ファインチューニングはAIに追加で学習させること
ファインチューニングとは、AIに追加で学習させることです。 すでにあるAIを、特定の目的に合わせて調整します。
たとえば、会社の文体に近づけたい場合や、特定の分野に強くしたい場合に使われることがあります。 初心者は「AIにあとから覚えさせること」と考えるとわかりやすいです。
RAGは資料を探して回答に使うこと
RAGは、AIに大きく学び直させる仕組みではありません。 質問のたびに、必要な資料を探して回答に使います。
新しい情報を使いたい場合、RAGは向いています。 資料を更新すれば、AIが参考にする内容も更新しやすいためです。
初心者は「覚えさせる」と「調べさせる」の違いで考える
ファインチューニングは、AIに覚えさせる方法です。 RAGは、AIに調べさせる方法です。
どちらがよいかは、目的によって変わります。 社内資料や最新情報を使いたい場合は、RAGが使われることが多いです。
RAGで使われる主な技術

ここからは、RAGでよく出てくる言葉を説明します。 すべてを暗記する必要はありません。
まずは「資料を保存する場所」「意味が近い情報を探す方法」「文章を小さく分ける方法」がある、と考えれば大丈夫です。
データベース
データベースとは、情報を整理して保存する場所です。 RAGでは、社内文書、FAQ、商品情報などを保存しておきます。
AIは、そこから質問に関係する情報を探します。 本棚から必要な本を探すようなイメージです。
ベクトル検索
ベクトル検索とは、意味が近い情報を探すための方法です。 「ベクトル」という言葉は数学でも使われますが、ここでは深く覚えなくても大丈夫です。
かんたんに言うと、言葉が少し違っても、意味が近い資料を探せる方法です。 たとえば「返品できますか」と「返金の条件を知りたい」は、言葉は違います。
しかし、知りたいことは近いです。 ベクトル検索を使うと、このような近い意味の資料を見つけやすくなります。
ふつうのキーワード検索では、同じ言葉が入っているかどうかが重視されます。 一方で、ベクトル検索では、言葉そのものよりも意味の近さをもとに探します。
たとえば「PC」と「パソコン」は、文字は違いますが意味は近い言葉です。 ベクトル検索では、このような言い換えにも対応しやすくなります。
チャンク
チャンクとは、長い文章を小さく分けたまとまりのことです。 英語では「かたまり」という意味があります。
長い資料をそのまま扱うと、必要な部分を探しにくくなることがあります。 そこで、資料を短いまとまりに分けます。
RAGでは、この小さなまとまりの中から、質問に合う部分を探します。 初心者は「資料を読みやすい大きさに分けたもの」と覚えるとよいです。
ナレッジベース
ナレッジベースとは、知識や情報をまとめておく場所です。 会社のFAQ、業務マニュアル、商品説明などが入ります。
言い換えると、AIが参考にする資料置き場です。 RAGでは、このナレッジベースの内容をもとに回答を作ります。
RAGのメリット
社内資料や最新情報を使いやすい
RAGを使うと、社内資料や新しい情報を生成AIに使わせやすくなります。 AIを一から作り直す必要が少なくなります。
たとえば、社内ルールが変わった場合も、参考にする資料を更新すれば対応しやすくなります。
何をもとに答えたかを確認しやすい
RAGでは、どの資料をもとに答えたかを示せる場合があります。 これにより、何をもとに答えたのかを確認しやすくなります。
仕事でAIを使う場合、答えのもとを確認できることは大切です。 人が最後に確認する流れも作りやすくなります。
AIの答えを仕事に使いやすくなる
RAGは、仕事で使うAIと相性がよい仕組みです。 会社独自の情報をもとに回答できるためです。
問い合わせ対応、社内検索、マニュアル確認などで役立ちます。 人が資料を探す時間を減らす助けになります。
RAGの注意点
元の資料が間違っていると答えも間違いやすい
RAGは、外部資料をもとに答えます。 そのため、元の資料が間違っていると、AIの答えも間違いやすくなります。
RAGを使うときは、資料を正しく保つことが大切です。 古い資料をそのまま残すと、古い情報をもとに答えることがあります。
探す情報がずれると回答もずれる
RAGでは、質問に合う資料を探すことが重要です。 関係のない資料を見つけると、回答もずれることがあります。
そのため、資料の分け方や探し方を整える必要があります。 初心者は「よい資料を用意することが大切」と覚えておくとよいです。
個人情報や社内情報の扱いに注意が必要
RAGでは、社内資料やお客さまの情報を扱うことがあります。 そのため、見せてよい情報と、見せてはいけない情報を分ける必要があります。
個人情報とは、名前、住所、電話番号など、個人を特定できる情報です。 こうした情報を扱う場合は、管理方法を決めておくことが大切です。
RAGが使われる場面

社内チャットボット
社内チャットボットは、社員の質問に自動で答える仕組みです。 RAGを使うと、社内マニュアルをもとに回答できます。
たとえば、休暇申請、経費精算、パソコン設定などの質問に使えます。
問い合わせ対応
お客さまからの問い合わせ対応にもRAGは使われます。 FAQや商品説明をもとに、回答を作りやすくなります。
人の対応をすべて置き換えるものではありません。 よくある質問をすばやく案内する助けとして使われます。
文書検索
RAGは、たくさんの文書から必要な情報を探す場面でも役立ちます。 社内規定、契約書、報告書などを探しやすくできます。
単にキーワードを探すだけでなく、質問に近い意味の文書を見つけられることがあります。
FAQの自動回答
FAQとは、よくある質問と回答をまとめたものです。 「よくある質問集」と考えるとわかりやすいです。
利用者は、決まった言葉で検索しなくても質問しやすくなります。
初心者がRAGで間違えやすい点
RAGをAIそのものだと思ってしまう
RAGは、AIそのものではありません。 生成AIが外部資料を使えるようにする仕組みです。
生成AIとRAGは、組み合わせて使うものと考えるとわかりやすいです。
RAGなら必ず正しい答えになると思ってしまう
RAGを使っても、答えが必ず正しいとは限りません。 資料が古い場合や、関係のない資料を使った場合は、答えがずれることがあります。
ただし、外部資料を使わない場合より、何をもとに答えたかを確認しやすくなります。 大切な判断では、人の確認も組み合わせると安心です。
検索エンジンと同じものだと思ってしまう
RAGは検索エンジンと似た部分があります。 どちらも情報を探すからです。
ただし、RAGは探した情報を生成AIに見せ、文章の回答を作らせます。 検索エンジンは、主にWebサイトの一覧を表示します。
RAGに関するよくある質問
RAGとは何ですか?
RAGとは、生成AIが外部の資料やデータを調べて、その情報をもとに答える仕組みです。 日本語では検索拡張生成と呼ばれます。
RAGは生成AIと何が違いますか?
生成AIは、文章や画像などを作るAIです。 RAGは、生成AIが外部の情報を使って答えられるようにする仕組みです。
つまり、生成AIは答えを作る役です。 RAGは答える前に資料を探して見せる役です。
RAGはChatGPTでも使われますか?
ChatGPTのような生成AIでも、外部情報を参照する仕組みと組み合わせることがあります。 その考え方の一つがRAGです。
たとえば、生成AIにPDFや社内資料を読み込ませて質問する使い方は、RAGの考え方に近い使い方です。 AIが手元の資料を参考にして答えるため、RAGを身近にイメージしやすい例です。
ただし、すべての生成AIが同じ形でRAGを使っているわけではありません。 サービスや設定によって仕組みは変わります。
RAGと検索エンジンの違いは何ですか?
検索エンジンは、キーワードに合うページを探して一覧で見せます。 RAGは、探した情報を使って生成AIが文章で答えます。
検索エンジンは「探す」が中心です。 RAGは「探して、答えを作る」までを組み合わせた仕組みです。
RAGを使えばハルシネーションはなくなりますか?
RAGは、ハルシネーションを減らす助けになります。 しかし、完全になくせるわけではありません。
資料が正しいか、AIが資料を正しく使っているかを確認することが大切です。
まとめ:RAGとは生成AIが外部情報を調べて答えるための仕組み
RAGとは、生成AIが答える前に外部の資料やデータを調べ、その情報をもとに回答を作る仕組みです。 日本語では検索拡張生成と呼ばれます。
かんたんに言うと、AIに「資料を見てから答えてもらう」ための方法です。 社内マニュアル、商品説明、FAQ、学校の資料などを使う場面で役立ちます。
RAGは、生成AIの答えを仕事や学習に使いやすくする仕組みです。 ただし、元の資料が正しいことや、回答を必要に応じて確認することも大切です。
