Claude Code のコストを賢く抑える
料金プラン選択からトークン節約術まで
「請求が怖くて使いすぎられない」を解消する。料金の仕組みから具体的な節約テクニックまで体系的に解説します
対象読者: Claude Code を使い始め「コストが心配」または「月額請求が高くなってきた」と感じている開発者。料金の仕組みを理解し、コスト削減の優先順位を整理します。
料金モデルの全体像:サブスクリプション vs API
Claude Code には 2 つの課金方式があり、利用スタイルによって最適な選択が変わります。
| プラン | 月額(USD) | 使用量 | 向いているユーザー |
|---|---|---|---|
| Pro | $20 | 適度な使用量 | 副業・週数時間程度の使用 |
| Max 5x | $100 | Pro の 5 倍(約 220,000 トークン目安) | フルタイム開発、中規模プロジェクト |
| Max 20x | $200 | Pro の 20 倍(約 880,000 トークン目安) | Agent Teams・終日コーディング |
| API 従量課金 | 使った分だけ | 無制限 | 使用量が少ない / コスト計測したい |
サブスクリプションでは5 時間ウィンドウ単位でトークンが管理されます。Pro はウィンドウあたり約 44,000 トークン、Max 5x は約 220,000 トークン、Max 20x は約 880,000 トークンが目安です(Anthropic 非公式の推計値)。
実測での比較: 重度の専門的な使用では、Max 20x プランは API 直接課金と比べて15〜30 倍のコスト効率になるという報告があります。これはサブスクリプションではプロンプトキャッシュ読み取りが追加課金なしで含まれることが大きな要因です。フルタイムで使うならサブスクリプションの方が圧倒的に有利です。
API 利用時のモデル別料金(2026年4月)
API 従量課金の場合、モデルによって料金が大きく異なります。
| モデル | 入力(/100万トークン) | 出力(/100万トークン) | キャッシュ読み取り |
|---|---|---|---|
| Opus 4.6 | $5 | $25 | $0.50 |
| Sonnet 4.6 ★推奨 | $3 | $15 | $0.30 |
| Haiku 4.5 | $1 | $5 | $0.10 |
プロンプトキャッシュを活用すると、繰り返し参照するコンテキストのコストが90%オフになります(キャッシュ読み取り = 標準入力価格の 0.1 倍)。また、Batch API(非同期処理)を使うと標準料金の 50% 引きで実行できます。
なぜトークンが増えるのか:主な消費要因 TOP 3
ツール出力の蓄積
ファイル読み込み・シェル実行・MCP 呼び出しの出力は、コンテキストに永続的に追加されます。10,000 行のログファイルをひとつ読ませると、以後のすべてのメッセージでそのログが再処理されます。「大きなファイルを読ませたまま別の話題に移る」のが最も高コストなパターンです。
会話の積み上がり
Claude はメッセージのたびに会話全体を再読します。50 番目のメッセージは 5 番目より「複雑だから」ではなく、積み上がったコンテキストの再処理コストが高いから高価になります。長いセッションを続けるほど 1 ターンあたりのコストが上昇します。
CLAUDE.md とシステムプロンプト
CLAUDE.md はセッション開始前にコンテキストへロードされます。「5,000 トークンの CLAUDE.md は、一言も入力する前に 5,000 トークンを消費する。毎ターン、毎セッション、常に」。CLAUDE.md が長くなるほど、すべての作業のベースコストが上昇します。
コスト削減テクニック 6 選
① .claudeignore でコンテキストを絞る(効果大・即効性最高)
.gitignore と同じ書式で Claude が読まないパスを指定するファイルです。node_modules/ や .next/ を追加するだけで、プロジェクト全体のコンテキストを 30〜70% 削減できます。
# ビルド成果物(最も効果が高い)
node_modules/
.next/
dist/
build/
out/
.cache/
.turbo/
# ログ・一時ファイル
*.log
coverage/
.nyc_output/
# 環境変数・シークレット(読ませる必要がない)
.env
.env.local
.env.*.local
# Python キャッシュ
__pycache__/
*.pyc
*.tsbuildinfo
② CLAUDE.md を 200 行以下に最適化
Anthropic の公式推奨は200 行以下。それ以上になったら「Claude がすでに正しく動いている指示」を削除するか、スキル(Skills)に移す時期です。
CLAUDE.md に書くこと
プロジェクト固有のルール・禁止事項・重要ファイルへのポインタ。「このリポジトリでは必ず守ること」だけを書く。
CLAUDE.md から削除するもの
Claude がデフォルトで正しくやること・詳細なワークフロー手順・めったに使わないコマンド。スキルとして別ファイルに切り出す。
③ タスクに合わせてモデルを使い分ける
- コードフォーマット
- コメント生成
- 単純な変換作業
- フックの前処理
- 機能実装・バグ修正
- テスト作成
- コードレビュー
- ドキュメント作成
- アーキテクチャ設計
- 複雑な推論・分析
- 大規模リファクタリング
- 難しいバグの根本原因調査
モデルはセッション中に /model sonnet / /model haiku / /model opus でいつでも切り替え可能です。
④ /compact と /clear でコンテキストを管理
コンテキストが膨らんできたら、2 つのコマンドで対処できます。
| コマンド | 動作 | 使いどころ |
|---|---|---|
/compact |
会話全体をサマリーに圧縮して継続 | 同じタスクを続けながらコンテキストを軽量化したいとき |
/clear |
会話を完全リセット | まったく別のタスクに切り替えるとき |
/compact <指示> |
指定した観点でサマリーを作成 | 「コード例と API 仕様に絞ってまとめて」など重点を指定 |
Claude Code は自動コンパクション(コンテキスト使用率 約 95% 時点でトリガー)も備えています。CLAUDE_AUTOCOMPACT_PCT_OVERRIDE 環境変数でこの閾値を下げる(早めに圧縮する)ことができます。
# デフォルト約95% → 70% に下げてより早い段階で圧縮させる
CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=70 claude
⑤ サブエージェント(Agent Teams)は必要最小限に
Agent Teams は並列で複数の Claude インスタンスを起動します。公式ドキュメントによると、プランモードでは標準セッションの約 7 倍のトークンを消費します。
Agent Teams のコスト注意点: チームメンバーはアイドル状態でもトークンを消費します。タスクが完了したらチームを終了する習慣をつけてください。また、メンバー数は必要最小限(通常 2〜3 人)に抑えることでコストを大幅に抑制できます。
⑥ 拡張思考(Extended Thinking)の調整
拡張思考はデフォルトで有効ですが、出力トークンとして課金されます。単純なコーディング作業では低めに設定するとコストを節約できます。
# 思考深度を下げる(シンプルなタスク向け)
/effort low
# 環境変数で思考トークンの上限を設定
MAX_THINKING_TOKENS=8000 claude
使用量を可視化する:ccusage
ccusage — Claude Code 使用量アナライザー
ローカルの会話ログ(JSONL ファイル)を解析し、日別・月別・セッション別のトークン使用量とコストを可視化する CLI ツールです。インストール不要で即使えます。
# 日別レポート
npx ccusage@latest daily
# 月次集計
npx ccusage@latest monthly
# セッション別(どのタスクが高コストか確認)
npx ccusage@latest session
# 5時間課金ウィンドウ分析(サブスクリプション利用者向け)
npx ccusage@latest blocks
キャッシュ書き込みとキャッシュ読み取りを分離して表示するため、「プロンプトキャッシュがどれだけ効いているか」も一目で確認できます。
また、Claude Code の API 利用者は/cost コマンドでセッション内のリアルタイムコストを確認できます。サブスクリプション利用者は /stats で使用傾向を確認してください。
実際のコスト感
Anthropic 公式ドキュメントが開示しているエンタープライズ展開の実績値と個人利用の報告例です。
※ API 従量課金の場合。サブスクリプション(Max 20x: $200/月 = 約$6.7/日)の方が重度利用では割安になります。
実例:6 人チームでの削減事例 最初の月 $2,400 → 8 週間の最適化(.claudeignore 導入 + CLAUDE.md 整理 + モデル選択戦略)で $680 へ(72% 削減)。.claudeignore の設定だけで最初の 2 週間で 30% 以上の削減に成功した例もあります。
優先順位つきチェックリスト
コスト削減に取り組む順番です。上から順に対応するだけで多くの人は 50% 以上の削減が見込めます。
- .claudeignore を設定する(
node_modules/・ビルド成果物を除外)→ 即効性最高・30〜70% 削減 - CLAUDE.md を 200 行以下に削る→ 全セッションのベースコストを恒久的に削減
- デフォルトモデルを Sonnet にする、必要時のみ Opus に切り替える
- タスク切り替え時に
/clearを習慣化する - 長いセッションでは
/compactでコンテキストを整理する - Agent Teams のメンバー数を最小化し、完了後はすぐ終了する
- ccusage で週 1 回 使用傾向をチェックして高コストなパターンを特定する
まとめ
- フルタイム利用なら Max 20x($200/月) がコスト効率最良。API 直接課金より約 18 倍割安という報告がある
- 最大のコスト要因は「大きなファイルを読ませたままセッションを続けること」。ツール出力の蓄積が長いセッションほど高コストになる
- .claudeignore の設定が最も即効性の高いコスト削減手段(30〜70% 削減)
- CLAUDE.md は 200 行以下に抑える。長いほど全セッションのベースコストが上がる
- デフォルトモデルは Sonnet 4.6。アーキテクチャ設計など難題のみ Opus に切り替える
- ccusage(
npx ccusage@latest)で日別・セッション別のコストを可視化し、高コストなパターンを特定する - チームで使うなら .claudeignore を git に入れて全員で共有すると効果が最大化する


