Skip to content

🌐 English

Token・Context・Context Window — 3つの基礎概念

NOTE

このページは Part 2 の出発点であり、本リポジトリ全体の前提知識となる。 Part 1 の構造的問題も、Part 3 以降の設計判断も、この3概念の理解なしには「なぜ」が見えない。

Token — LLM の「文字」

Token とは何か

LLM はテキストを「文字」単位でも「単語」単位でもなく、Token(トークン)という独自の単位で処理する。

入力テキスト:  "Claude Code でコードを書く"
                ↓ トークナイザーが分割
トークン列:    ["Claude", " Code", " で", "コード", "を", "書", "く"]

英語は概ね「1単語 ≈ 1〜1.3 トークン」、日本語は「1文字 ≈ 1〜3 トークン」になる。同じ内容でも日本語の方がトークン消費が多い。

なぜ Token 単位なのか

LLM の内部は数値ベクトルの演算で動いている。テキストを直接は処理できないため、テキスト → トークン(整数 ID) → ベクトルに変換する必要がある。

このパイプライン全体を「トークン」という単位が貫いている。だから LLM の能力も制約も、全てトークン単位で語られる。

Token の実感を掴む

目安トークン数
英語 1 単語~1 トークン
日本語 1 文字~1〜3 トークン
この README.md(約 135 行)~2,000 トークン
一般的なソースファイル(200行)~1,000〜3,000 トークン
Claude の 200K コンテキスト英語の本 約2冊分 / 日本語の本 約1冊分

TIP

開発者向けの比喩: Token はメモリのバイトに相当する。CPU(LLM)がデータを処理する最小単位であり、メモリ容量(コンテキストウィンドウ)もバイト(トークン)で測る。

Context — LLM に渡す「全情報」

Context とは何か

Context(コンテキスト)とは、LLM が1回の応答を生成するために参照する全てのテキストのこと。

開発者の日常で例えると:

比喩Context に相当するもの
関数呼び出し引数として渡される全データ
HTTP リクエストリクエストボディ全体
コンパイルコンパイラに渡されるソースファイル群

LLM はステートレスである。過去の会話を「覚えている」のではなく、毎回、会話履歴を含む全てのテキストが Context として渡され、それを読んで応答を生成する

「ステートレス」の意味

REST API に馴染みのある開発者なら直感的に分かるはず。LLM の応答生成は HTTP リクエストと同じで、リクエストごとに独立している。

LLM は過去の会話を「覚えている」のではなく、毎ターン全履歴を「読んでいる」。ターンが進むほど Context が膨らむ。これが Part 1 で学んだ Context RotInstruction Decay の物理的な原因である。

Context Window — 有限の「思考空間」

Context Window とは何か

Context Window(コンテキストウィンドウ)とは、LLM が一度に処理できる Context の最大サイズである。

モデルContext Window サイズ
Claude Sonnet 4.6 / Opus 4.61M トークン(200K超も標準料金)
Claude Sonnet 4 / Opus 4200K トークン
GPT-4o128K トークン
Gemini 2.5 Pro1M トークン

TIP

開発者向けの比喩: Context Window はプロセスに割り当てられたメモリ空間。サイズを超えると OOM(Out of Memory)するのと同じように、Context Window を超えるとトークンが切り捨てられる。

「大きければ安全」ではない

ここが最も重要なポイントであり、Part 1 で学んだ構造的問題との接続点になる。

Context Window は「容量いっぱいまで使える」のではなく、「容量のうち、品質を保てるのは一部」と理解すべきである。1M に拡張されても、この原則は変わらない。この定量的な話は コンテキスト予算 で詳しく扱う。

3概念の関係

概念一言で開発者向けの比喩
TokenLLM の処理単位メモリのバイト
ContextLLM への入力全体HTTP リクエストボディ
Context Window入力の最大サイズプロセスのメモリ空間

Claude Code の設計は全て Context Window の制約に基づく

Part 3 以降で学ぶ Claude Code の各機能は、この Context Window を効率的に使うための仕組みである。

Claude Code の機能Context Window に対する戦略
CLAUDE.md 200行制限常駐する Context を最小限に抑える
.claude/rules/glob(条件)一致時のみ Context に注入する
Skillsユーザー呼出 or LLM 判断時のみ Context を消費する
Agents別の Context Window で実行する
/compactContext を圧縮して空間を回復する
/clearContext をリセットする
HooksContext を一切消費しない

次のページでは、この Context Window の中に何が・いつ・どう入るかの全体像を見ていく。


次へ: Chat / Session — Context が蓄積する「時間の入れ物」

Discussion: GitHub Discussions

Released under the CC BY 4.0 License.