生成AIの設計パターンとMCPの位置づけ

LLMの「知識の限界」に対して、業界はどのようなアプローチを取ってきたか。その中でMCPはどこに位置し、何が違うのか。

このページの位置づけ

01-vision（WHY — なぜブレない参照先が必要か）
→ 02-reference-sources（WHAT — 何を参照先とするか）
→ 03-architecture（HOW — どう構成するか）
→ 本ページ（WHICH — どのパターンをいつ選ぶか）

前章までの抽象的なアーキテクチャを、具体的な設計判断に落とし込むためのパターン集である。各パターンは「採用すべきもの」ではなく、条件が整えば成立するが、前提が崩れると機能しなくなる構造として記述している。

メタ情報


この章で固定するもの	RAG / MCP / Fine-tuning / Prompt Engineering の位置づけと選択基準、アンチパターン
扱わないこと	各パターンの実装手順、モデルの学習方法、特定フレームワークの使い方
依存	03-architecture（三層モデルの構造定義）
誤用ポイント	パターンを「銀の弾丸」として扱うこと。各パターンには Failure Risk（崩壊条件）がある

このドキュメントについて

生成AI（LLM）を実用的なシステムに組み込むためには、モデル単体の能力だけでは不十分である。AIの知識には限界があり（01-vision 参照）、それを補うためにさまざまな設計パターンが生まれてきた。

このドキュメントでは、代表的な設計パターンを俯瞰し、特にRAG（Retrieval-Augmented Generation）とMCPの違いを丁寧に解説する。「RAGとMCPは何が違うのか？」「なぜこのプロジェクトはMCPを選んでいるのか？」という疑問に答えることが目的である。

Architecture → Design Patterns の関係

ソフトウェア開発において、Architecture（構造）は Design Pattern（実践手法）の上位に位置する。本プロジェクトにおいても同様の関係が成り立つ。

Architecture は「何を、どこに配置するか」を定め、Design Patterns は「具体的にどう実現するか」を示す。両者は相互に参照し合う関係にある。

LLMの「知識の限界」— なぜ外部知識が必要なのか

LLMは大量のテキストデータから学習した確率的な生成モデルである。非常に幅広い知識を持つが、以下の限界がある（詳細は 02-reference-sources.md 第1章を参照）。

LLMの知識
┌─────────────────────────────────────────┐
│  ✅ 学習済みの知識（膨大だが固定）        │
│     - 一般知識、プログラミング、言語       │
│     - 学習時点までの情報                   │
├─────────────────────────────────────────┤
│  ❌ 持っていない知識                      │
│     - 学習カットオフ以降の情報              │
│     - 社内ドキュメント・独自データ          │
│     - 稀な専門知識（マイナーなRFCの詳細等） │
│     - リアルタイム情報                     │
└─────────────────────────────────────────┘

この「持っていない知識」を補うために、さまざまな設計パターンが考案されてきた。

生成AIの主な設計パターン

2.1 パターンの全体像

LLMの限界を補うための主要な設計パターンを以下に整理する。

2.2 各パターンの概要

RAG（Retrieval-Augmented Generation：検索拡張生成）

外部のドキュメントを検索し、関連する情報をLLMのプロンプトに注入する手法。LLM自体を変更せず、「検索 + 生成」を組み合わせる。

ポイント: RAGの核心は「ベクトル類似度」で情報を検索すること。ドキュメントを小さな断片（チャンク）に分割し、質問と意味的に近い断片を取り出してLLMに渡す。

特性	説明
対象	非構造化テキスト（ドキュメント、FAQ、社内Wiki等）
検索方式	ベクトル類似度検索（セマンティック検索）
前処理	ドキュメントのチャンク化 → ベクトル化 → DB格納
強み	大量の文書から関連情報を見つけられる
弱み	チャンク分割で文脈が失われる、構造を理解しない

MCP（Model Context Protocol）

AIモデルと外部ツール・サービスを接続するための標準プロトコル。Anthropicが策定。AIが構造化されたAPIを通じて外部データにアクセスし、アクションを実行できるようにする。

ポイント: MCPの核心は「構造化されたAPI」で情報にアクセスすること。ドメインの構造（セクション、要件レベル、相互参照等）を理解した上でデータを取得する。

特性	説明
対象	構造化されたデータ・API・外部サービス
アクセス方式	構造化API呼び出し（JSON-RPC）
前処理	不要（MCPサーバーが構造を理解）
強み	正確なデータ取得、検証可能、配布可能
弱み	MCPサーバーの開発が必要

MCPの詳細: mcp/what-is-mcp.md を参照。

Fine-tuning（ファインチューニング）

LLMのパラメータ自体を、特定ドメインのデータで追加学習させる手法。モデルの「内部知識」を書き換える。

ベースモデル（GPT-4, Claude等）
    ↓ + 特定ドメインのデータで追加学習
カスタマイズされたモデル
    ↓
ドメイン固有の知識で回答可能

特性	説明
対象	ドメイン固有の知識・スタイル
変更箇所	モデルのパラメータ自体
コスト	高い（学習データ準備 + 計算資源）
強み	モデルに深く知識を埋め込める
弱み	更新が困難、ハルシネーションの完全排除は不可能

Prompt Engineering（プロンプトエンジニアリング）

モデルのパラメータを変えず、入力プロンプトの工夫だけで出力品質を制御する手法。

主な技法:
- Zero-shot:     指示のみ
- Few-shot:      例を数個添える
- Chain-of-Thought: 「ステップバイステップで考えて」
- System Prompt: 役割や制約を事前に定義

特性	説明
対象	あらゆるタスク
変更箇所	入力プロンプトのみ
コスト	最も低い
強み	すぐに試せる、モデル変更不要
弱み	モデルが知らない知識は補えない

Agentic AI（エージェント型AI）

LLMが自律的に計画を立て、ツールを呼び出し、複数ステップで問題を解決するパターン。MCPはこのパターンを支える基盤技術の一つ。

特性	説明
対象	複合的・多段階のタスク
動作	自律的な計画 → 実行 → 検証のループ
依存	MCP（ツール接続）、Skills（知識参照）
強み	複雑なタスクを自動化できる
弱み	予測困難、制御が難しい場合がある

エージェントの詳細: 03-architecture.md を参照。

GraphRAG

通常のRAGにナレッジグラフ（知識グラフ）を組み合わせ、エンティティ間の関係性を活用する手法。

通常のRAG:  ドキュメント → チャンク → ベクトル検索
GraphRAG:   ドキュメント → エンティティ抽出 → 関係グラフ構築 → グラフ検索

特性	説明
対象	エンティティ間の関係性が重要なデータ
強み	「AはBにどう関係するか」に強い
弱み	グラフ構築コストが高い

2.3 パターンのカテゴリ分類

各パターンは、その主な関心事に基づいて4つのカテゴリに分類できる。

カテゴリ	パターン	主な関心事
知識注入	RAG, MCP, GraphRAG	LLMが持たない外部知識を補完する
推論強化	Prompt Engineering, Chain-of-Thought	LLMの思考プロセスを制御・改善する
自律行動	Agentic AI	複数ステップの計画・実行・検証を自律化する
モデル強化	Fine-tuning	モデル自体のパラメータを書き換える

この分類は排他ではない。Agentic AI は内部で知識注入（MCP/RAG）や推論強化（Prompt Engineering）を組み合わせて利用する。

2.4 パターンの比較一覧

パターン	カテゴリ	解決する問題	変更箇所	コスト	リアルタイム性	導入難度	崩壊リスク
RAG	知識注入	知識の補完	プロンプト	中	△（インデックス更新頻度依存）	★★☆	チャンク品質に依存
MCP	知識注入	ツール接続・正確なデータ取得	プロンプト	中〜高	◎（リアルタイム）	★★☆	サーバー停止時
Fine-tuning	モデル強化	ドメイン特化	モデルパラメータ	高	✗（再学習が必要）	★★★	データ汚染時
Prompt Engineering	推論強化	出力品質制御	プロンプト	低	-	★☆☆	低（最も安全）
Agentic AI	自律行動	複合タスク自動化	アーキテクチャ	高	◎	★★★	制御喪失時
GraphRAG	知識注入	関係性理解	プロンプト + グラフ	高	△	★★★	グラフ品質に依存

「崩壊リスク」の読み方

各パターンは「銀の弾丸」ではない。崩壊リスク列は、そのパターンが機能しなくなる主な条件を示す。設計時にはこのリスクに対するフォールバック戦略を検討すること。

2.5 パターンは排他ではない

これらのパターンは互いに排他的ではなく、組み合わせて使うものである。

例えば、Agentic AIがPrompt Engineeringで適切に指示を受け、必要に応じてRAGで社内文書を検索し、MCPで標準仕様を確認する、というシステムは十分にありえる。

2.6 よくあるアンチパターン

設計パターンを誤用すると、期待と逆の結果を生むことがある。

アンチパターン	説明	発生しやすい状況
RAG万能信仰	すべての知識補完をRAGで解決しようとする	構造化データに対してチャンク検索を適用し、精度が低下する
過剰エージェント化	単純なタスクにもAgentic AIを適用する	エージェントの自律判断が不要な場面でオーバーヘッドと予測困難性が増大する
Fine-tuning依存	変化する知識をモデルパラメータに埋め込む	法改正・仕様更新のたびに再学習が必要になり、運用コストが破綻する
プロンプト肥大化	Prompt Engineeringで全てを制御しようとする	コンテキストウィンドウを圧迫し、本来の知識注入の余地がなくなる

アンチパターンの回避には、各パターンの前提条件と崩壊リスク（2.4節の比較表参照）を理解した上で選択することが重要である。

RAGを深く理解する

3.1 RAGの仕組み

RAGは2020年にMeta（旧Facebook）の研究チームが発表した手法で、LLMに外部知識を与える最も普及したパターンである。

ステップ1: インデックス構築（オフライン）

元ドキュメント
  「RFC 6455はWebSocketプロトコルを定義する。
   Section 5.5.1ではClose frameの形式を規定し、
   Section 7.4.1ではステータスコードを定義する。
   1006は異常クロージャを示し、Close frameに
   含めてはならない（MUST NOT）。」

    ↓ チャンク分割

チャンク1: 「RFC 6455はWebSocketプロトコルを定義する。
           Section 5.5.1ではClose frameの形式を規定し」
チャンク2: 「Section 7.4.1ではステータスコードを定義する。
           1006は異常クロージャを示し」
チャンク3: 「Close frameに含めてはならない（MUST NOT）。」

    ↓ ベクトル化（Embedding）

チャンク1 → [0.12, -0.34, 0.56, ...]  ← 数百〜数千次元の数値ベクトル
チャンク2 → [0.23, -0.11, 0.78, ...]
チャンク3 → [0.45, -0.67, 0.12, ...]

    ↓ ベクトルDBに格納

ステップ2: 検索と生成（オンライン）

ユーザーの質問: 「WebSocketのステータスコード1006とは？」

    ↓ 質問もベクトル化

質問ベクトル → [0.21, -0.15, 0.72, ...]

    ↓ 類似度検索（コサイン類似度等）

最も近いチャンク → チャンク2:
  「Section 7.4.1ではステータスコードを定義する。
   1006は異常クロージャを示し」

    ↓ プロンプトに注入

「以下の情報を参考に質問に回答してください。
 ---
 Section 7.4.1ではステータスコードを定義する。
 1006は異常クロージャを示し
 ---
 質問: WebSocketのステータスコード1006とは？」

    ↓ LLMが回答生成

3.2 RAGの強みと典型的なユースケース

RAGが特に有効な場面を以下に整理する。

ユースケース	説明	例
社内文書検索	大量の内部ドキュメントからの情報取得	社内Wiki、マニュアル、FAQ
カスタマーサポート	製品知識ベースからの回答生成	ヘルプセンター、チャットボット
学術研究	論文データベースからの関連情報抽出	文献レビュー支援
法務支援	契約書・判例の類似検索	類似条項の発見

RAGが得意なこと: 大量の非構造化テキストから「意味的に近い」情報を見つけること。

3.3 RAGの限界

一方で、RAGには構造的な限界がある。

チャンク分割による文脈の喪失

元の文脈:
  「1006は異常クロージャを示し、Close frameに
   含めてはならない（MUST NOT）。」

チャンク分割後:
  チャンク A: 「1006は異常クロージャを示し」    ← 検索で取得
  チャンク B: 「Close frameに含めてはならない」  ← 取得されない可能性

→ MUST NOT という重要な要件が欠落するリスク

構造の理解不足

RAGが返すもの:
  「1006は異常クロージャを示す」（テキスト断片）

RAGが返せないもの:
  - これが Section 7.4.1 に定義されていること
  - MUST NOT レベルの要件であること
  - Section 5.5.1 の Close frame 形式との関係
  - RFC 6455 全体での位置づけ

検索精度の限界

ベクトル類似度検索は「意味的に近い」ものを返すが、「正確に一致する」ものを返すとは限らない。

質問: 「RFC 6455のステータスコード1002の意味は？」

返される可能性のあるチャンク:
  ✅ 「1002はプロトコルエラーを示す」（正しい）
  ❌ 「1006は異常クロージャを示す」（意味的に近いが、聞いてないもの）
  ❌ 「1000は正常なクロージャを示す」（同カテゴリだが別のコード）

3.4 Advanced RAG — 限界を緩和する試み

上記の限界に対して、RAGを拡張する手法（Advanced RAG）が研究・実装されている。

手法	解決する限界	概要
Hybrid Search	検索精度	ベクトル検索 + キーワード検索（BM25等）を併用し精度向上
Re-ranking	検索精度	初回検索結果をクロスエンコーダで再ランキング
Parent-Child Chunking	文脈喪失	小チャンクで検索し、親チャンク（広い文脈）を返す
HyDE	検索精度	LLMが仮想回答を生成し、それをクエリとして検索

これらの手法はRAGの弱点を緩和するが、構造化データに対するMCPの精度を超えるものではない。データの性質に応じた使い分けの原則は変わらない。

RAGのアーキテクチャ上の位置づけ — 利用者は何をすべきか

RAGの仕組みを理解した上で、よくある疑問がある。

「RAGが重要なのは分かった。で、自分は何をすればいいの？」

この疑問に答えるために、RAGをこのプロジェクトのアーキテクチャの中に位置づける。

3.5.1 RAGは「標準」ではなく「設計パターン」

まず重要な前提として、RAGは標準化されたプロトコルではない。

項目	RAG	MCP	Skills
種別	設計パターン（デザインパターン）	標準プロトコル（仕様あり）	仕様（Agent Skills Spec）
標準化	なし（RFC・W3C仕様は存在しない）	modelcontextprotocol.io	agentskills.io
実装の統一性	各社独自（LangChain, LlamaIndex, Bedrock等）	標準SDK（TypeScript/Python）	標準フォーマット（SKILL.md）
相互運用性	なし	あり（どのエージェントでも接続可能）	あり（16+エージェント対応）

つまり、RAGは「検索して → コンテキストに注入して → 生成する」という概念レベルの合意があるだけで、具体的な実装方法は実装者に委ねられている。

3.5.2 RAGはエージェント内部の処理パイプライン

RAGの処理は、ユーザーから見るとエージェントの内部処理として実行される。

ここでのポイントは

ユーザーが「何を検索するか」「どんな知識を使うか」を定義する → Skills と MCP
それを「どう検索してどう注入するか」はエージェントが判断する → RAGパイプライン

ユーザーは RAG を直接操作するのではなく、Skills と MCP を通じて間接的に RAG の恩恵を受ける。

3.5.3 利用者として何をすべきか

RAGの恩恵を最大限に受けるために、利用者ができることを整理する。

やるべきこと	具体的なアクション	RAGとの関係
Skills を定義する	翻訳品質基準、コードレビュー観点、仕様準拠チェックリストなどを SKILL.md で記述	エージェントが参照する「静的知識ベース」となる
MCP を接続する	ベクトルDB、RFC、法令、DeepL などの MCP サーバーを設定	エージェントが検索する「外部データソース」となる
CLAUDE.md を書く	プロジェクトの方針、用語定義、制約条件を記述	エージェントの「コンテキスト」として常時注入される

まとめ: RAGそのものを構築・制御する必要はない。Skills・MCP・CLAUDE.md という標準化されたインターフェースを通じて、エージェントに「何を知っているべきか」を伝えることが利用者の役割である。

RAGとMCPの本質的な違い

4.1 アプローチの根本的な違い

RAGとMCPはどちらも「LLMに外部知識を与える」が、そのアプローチは根本的に異なる。

観点	RAG	MCP
検索の原理	テキストの意味的類似度	ドメイン構造に基づく正確なクエリ
前提	ドキュメントをチャンク化できる	ドメインの構造を理解したAPIがある
結果の性質	「おそらく関連する」テキスト断片	「確実に該当する」構造化データ
出典の明確さ	曖昧（どのチャンクから来たか追跡困難）	明確（RFC 6455 Section 7.4.1 等）

4.2 「ブレない参照先」の5特性による比較

02-reference-sources.md で定義した「ブレない参照先」の5つの特性で比較すると、違いがさらに明確になる。

特性	RAG	MCP（参照先MCP）	説明
権威性	△	◎	RAGはチャンクの出典が曖昧。MCPは原典に直接アクセス
不変性・版管理	△	◎	RAGはインデックス更新タイミングに依存。MCPは原典の版管理を反映
構造化	✗	◎	RAGはチャンク分割で構造が失われる。MCPはセクション・要件レベルを保持
検証可能性	△	◎	RAGは「どのチャンクから生成したか」の追跡が困難。MCPは正確な出典を明示
アクセス可能性	○	◎	どちらもプログラムでアクセス可能だが、MCPは標準プロトコル

4.3 具体例で比較する

例：「RFC 6455のClose codeで1006の意味は？」

RAGの場合:

1. RFC 6455の全文をチャンク化してベクトルDBに格納（事前準備）
2. 質問をベクトル化し、類似チャンクを検索
3. 返されたチャンク:
   「1006 is a reserved value and MUST NOT be set as a status code
    in a Close control frame by an endpoint.」

問題点:
- このチャンクが Section 7.4.1 から来たことが不明確
- MUST NOT の要件レベルがメタデータとして付与されない
- 前後の文脈（なぜMUST NOTなのか）が欠落する可能性
- 別のチャンク（1002の説明等）が返る可能性もある

rfcxml-mcp の場合:

1. get_requirements(rfc=6455, section="7.4.1") を呼び出し
2. 返される結果:
   {
     section: "7.4.1",
     requirement: "1006 is a reserved value and MUST NOT be set
                   as a status code in a Close control frame
                   by an endpoint.",
     level: "MUST NOT",
     context: "It is designated for use in applications
               expecting a status code to indicate that
               the connection was closed abnormally"
   }

利点:
- セクション番号が明確（Section 7.4.1）
- 要件レベルが構造化（MUST NOT）
- 前後の文脈が保持
- validate_statement() で実装の適合性まで検証可能

例：「電子署名法第2条の要件は？」

RAGの場合:

法令全文をチャンク化 → 「第2条」関連のチャンクを検索
→ 法令の「条・項・号」の構造が失われる
→ 改正前と改正後の版が混在するリスク

hourei-mcp（e-gov-law MCP）の場合:

find_law_article(law_name="電子署名法", article_number="2") を呼び出し
→ 条文の構造（項・号）がそのまま取得できる
→ 最新の法令データを取得（e-Gov APIからリアルタイム）

4.4 配布可能性の違い

MCPには「標準プロトコルとして配布できる」という決定的な優位性がある。

RAGパイプラインの共有:
  1. ドキュメントの準備
  2. チャンク分割ロジックの実装
  3. Embedding モデルの選定
  4. ベクトルDBの構築・運用
  5. 検索パラメータの調整
  → 各組織が個別に構築する必要がある

MCPサーバーの共有:
  npx @shuji-bonji/rfcxml-mcp
  → これだけで、構造化されたRFCアクセスを誰でも得られる

観点	RAG	MCP
配布方法	独自構築が前提	npm パッケージ等で配布可能
導入コスト	ベクトルDB構築 + インデックス作成	設定ファイル1つ
品質の均一性	構築者のスキルに依存	サーバー開発者が品質保証
メンテナンス	各組織が個別に対応	サーバー開発者が一括更新

このプロジェクトのMCPサーバーとRAGの比較

5.1 「一見RAGと同じでは？」という疑問

このプロジェクトの関連MCPサーバー（rfcxml-mcp、w3c-mcp、pdf-spec-mcp、epsg-mcp等）を見ると、「外部の仕様書を検索してLLMに渡す」という点でRAGと同じことをしているように見えるかもしれない。

しかし、根本的な違いがある。

5.2 「テキスト検索」vs「ドメイン知識のコード化」

各MCPサーバーは、対象ドメインの構造と意味を理解したAPIを提供している。これは単なるテキスト検索ではなく、ドメイン知識のコード化である。

MCPサーバー	理解している構造	RAGでは失われるもの
rfcxml-mcp	セクション階層、MUST/SHOULD/MAY分類、RFC間の相互参照（obsoletes/updates）	要件レベルの区別、セクション間の関係
w3c-mcp	WebIDL定義、CSS仕様構造、HTML要素の属性とコンテンツモデル	インターフェースの型情報、プロパティの継承関係
pdf-spec-mcp	ISO 32000の章構造、要件テーブル、用語定義	テーブル構造、仕様バージョン間の差分
epsg-mcp	座標参照系の用途推奨、変換パス、精度特性	空間的な適用範囲、変換の精度情報
pdf-reader-mcp	PDFの内部オブジェクト構造、タグ階層、フォント情報	バイナリ構造の解釈、オブジェクト間の参照関係

5.3 実用上の差異

RAGとMCPの使い分け

6.1 判断フロー

6.2 使い分けガイド

シナリオ	推奨	理由
RFC/W3C等の仕様準拠確認	MCP	構造化された要件抽出が必要
社内ドキュメントの検索	RAG	非構造化テキストの大量検索
法令の条文取得	MCP	条・項・号の構造を保持する必要
カスタマーサポートFAQ	RAG	多様な質問への柔軟な対応
翻訳の品質評価	MCP	構造化されたスコアとエラー検出
研究論文の要約	RAG	大量の非構造化テキストの処理
PDF仕様の要件チェック	MCP	テーブルと要件レベルの正確な取得
チーム内ナレッジ共有	RAG or Skill	状況に応じて選択

6.3 併用パターン

RAGとMCPは排他的ではない。以下のような併用パターンが考えられる。

パターン：RAGで概要把握 → MCPで正確性確認

このプロジェクトがMCPを選ぶ理由

7.1 プロジェクトの思想との整合

このプロジェクトの核心思想は「ブレない参照先」である（01-vision.md 参照）。

RAGは「おそらく関連する情報」を返す    → ブレる可能性がある
MCPは「確実に該当する情報」を返す      → ブレない

AIの出力に検証可能な根拠を持たせるためには、出典が明確で、構造化されたデータアクセスが不可欠である。これがこのプロジェクトがMCPを中心に据えている根本的な理由である。

7.2 MCPの3つの価値

このプロジェクトの文脈で、MCPが提供する価値を3つにまとめる。

正確性: ドメインの構造を理解したAPIで、正確な情報を取得できる
検証可能性: 出典（RFC番号、セクション番号等）が常に明示される
民主化: npmパッケージとして配布でき、誰でも同じ品質のアクセスを得られる

7.3 RAGを否定しているわけではない

重要な注意点として、このプロジェクトはRAGを否定しているわけではない。RAGは「大量の非構造化テキストから関連情報を見つける」という目的において、非常に強力な手法である。

ただし、AIの判断に「ブレない参照先」を与えるという目的においては、MCPのアプローチがより適切である。それぞれのパターンには適切な用途がある。

RAGの適切な用途:  「たくさんの文書から関連しそうなものを見つけたい」
MCPの適切な用途:  「特定の仕様・規格から正確な情報を取得したい」

→ 目的が違うので、優劣ではなく使い分け

まとめ

パターン選択の意思決定サマリー

設計時に最初に問うべき質問と、その答えに応じた推奨パターンを整理する。

最初に問うべき質問	答え	推奨パターン
対象データに明確な構造があるか？	Yes → 構造化APIが存在する	MCP
	Yes → 存在しないが構築価値がある	MCP を構築
	No → 大量テキストの検索が必要	RAG（+ Advanced RAG検討）
	No → 少量の知識で十分	Prompt Engineering / Skills
モデル自体の知識を変更する必要があるか？	Yes	Fine-tuning（コスト・運用負荷を覚悟）
複数ステップの自律的判断が必要か？	Yes	Agentic AI（+ MCP/Skills で知識供給）

迷ったときは Prompt Engineering から始め、必要に応じて MCP → RAG → Agentic AI と段階的に採用する。最もリスクが低いパターンから着手するのが原則である。

核心メッセージ

生成AIにはさまざまな設計パターンがある — RAG、MCP、Fine-tuning、Agentic AI等、それぞれ異なる問題を解決する
RAGは「テキストの類似度」で検索する — 大量の非構造化テキストから関連情報を見つけるのに強い
MCPは「ドメインの構造」で検索する — 構造化されたAPIで正確な情報を取得する
「ブレない参照先」にはMCPが適する — 権威性・構造化・検証可能性・配布可能性でMCPが優位
RAGとMCPは排他ではない — それぞれ適切な用途があり、併用も可能
各MCPサーバーはドメイン知識をコード化したもの — 単なるテキスト検索ではなく、構造の理解を提供する

今後注目されるパターン

本ページで扱ったパターンに加え、以下の手法が今後影響を持つ可能性がある。

パターン	概要	現状
Toolformer	LLMが自律的に外部ツール呼び出しを学習する手法	研究段階（Meta, 2023）
RETRO	検索メカニズムをモデルアーキテクチャに組み込む	研究段階（DeepMind）
Agentic Workflow	複数のエージェントが協調して作業するワークフロー	実用化が進行中

これらが成熟した際、本ページのパターン分類に統合する予定である。

生成AIの設計パターンとMCPの位置づけ ​

このドキュメントについて ​

Architecture → Design Patterns の関係 ​

LLMの「知識の限界」— なぜ外部知識が必要なのか ​

生成AIの主な設計パターン ​

2.1 パターンの全体像 ​

2.2 各パターンの概要 ​

RAG（Retrieval-Augmented Generation：検索拡張生成） ​

MCP（Model Context Protocol） ​

Fine-tuning（ファインチューニング） ​

Prompt Engineering（プロンプトエンジニアリング） ​

Agentic AI（エージェント型AI） ​

GraphRAG ​

2.3 パターンのカテゴリ分類 ​

2.4 パターンの比較一覧 ​

2.5 パターンは排他ではない ​

2.6 よくあるアンチパターン ​

RAGを深く理解する ​

3.1 RAGの仕組み ​

ステップ1: インデックス構築（オフライン） ​

ステップ2: 検索と生成（オンライン） ​

3.2 RAGの強みと典型的なユースケース ​

3.3 RAGの限界 ​

チャンク分割による文脈の喪失 ​

構造の理解不足 ​

検索精度の限界 ​

3.4 Advanced RAG — 限界を緩和する試み ​

RAGのアーキテクチャ上の位置づけ — 利用者は何をすべきか ​

3.5.1 RAGは「標準」ではなく「設計パターン」 ​

3.5.2 RAGはエージェント内部の処理パイプライン ​

3.5.3 利用者として何をすべきか ​

RAGとMCPの本質的な違い ​

4.1 アプローチの根本的な違い ​

4.2 「ブレない参照先」の5特性による比較 ​

4.3 具体例で比較する ​

例：「RFC 6455のClose codeで1006の意味は？」 ​

例：「電子署名法第2条の要件は？」 ​

4.4 配布可能性の違い ​

このプロジェクトのMCPサーバーとRAGの比較 ​

5.1 「一見RAGと同じでは？」という疑問 ​

5.2 「テキスト検索」vs「ドメイン知識のコード化」 ​

5.3 実用上の差異 ​

RAGとMCPの使い分け ​

6.1 判断フロー ​

6.2 使い分けガイド ​

6.3 併用パターン ​

このプロジェクトがMCPを選ぶ理由 ​

7.1 プロジェクトの思想との整合 ​

7.2 MCPの3つの価値 ​

7.3 RAGを否定しているわけではない ​

まとめ ​

パターン選択の意思決定サマリー ​

核心メッセージ ​

今後注目されるパターン ​

関連ドキュメント ​