Claude CodeでFable 5の利用枠がすぐ尽きる人へ|モデル使い分けとコンテキスト管理でコスパよく使う方法
Fable 5は最強ですが、トークン消費も最重量級。実測データをもとに、利用枠を3分の1にする「使い分け」と「コンテキスト管理」のコツを解説します。
Claude Fable 5をClaude Codeで使い始めて、「利用枠の減りが早すぎる」と感じていませんか?それは気のせいではありません。この記事では、実際のセッションの消費データ(API換算$18分)を解剖して何にトークンが消えているのかを明らかにし、Fable 5・Opus 4.8・Sonnet 4.6・Haikuを使い分けて体感コストを3分の1以下にする実践的な方法を解説します。
前提:本記事は2026年6月12日時点の情報と、筆者の実セッションの計測値をもとにしています。プランの利用枠の仕組み・モデルの料金は変更される可能性があります。
なぜFable 5は利用枠の消費が激しいのか
理由は3つ重なっています。
- 単価が最高クラス:API価格で入力$10/出力$50(100万トークンあたり)。Opus 4.8の2倍、Sonnet 4.6の約3倍です。プランの利用枠も、おおむねモデルの重さに応じて消費されます
- 思考トークンを多く使う:Fable 5は応答の前に「考える」モデルです。賢さの源泉ですが、思考分も出力トークンとして消費されます
- 長いコンテキストの引き回し:長時間のセッションでは、会話履歴・読み込んだファイル・スキル文書を毎ターン参照し続けます。キャッシュで割引されるとはいえ、量が膨大になると無視できません
Fable 5自体の特徴や料金の詳細はClaude Fable 5完全ガイドを参照してください。
実測:1セッションでAPI換算$18。その9割は「コンテキストの引き回し」だった
筆者がブログ記事1本の執筆〜投稿をFable 5のClaude Codeで行ったセッション(約30分)の消費内訳です。/usageコマンドで確認できます。
| 項目 | トークン量 | API換算コスト | 割合 |
|---|---|---|---|
| キャッシュ読み込み | 990万 | $9.90 | 55% |
| キャッシュ書き込み | 52万 | $6.50 | 36% |
| 出力(思考含む) | 3.1万 | $1.54 | 9% |
| 新規入力 | 0.5万 | $0.05 | 0.3% |
| 合計 | — | 約$18 | — |
注目してほしいのは、「AIが書いた文章」のコストはたった9%だということです。残り9割は、長くなった会話コンテキスト(15万トークン超)を毎ターン読み直すキャッシュの読み書きに消えていました。
つまり節約の本丸は「賢いモデルを我慢する」ことではなく、「引き回すコンテキストを減らす」ことです。これが本記事の結論の半分です。残り半分が、タスクに応じたモデルの使い分けです。
節約術①:タスクでモデルを使い分ける(Fable 5は「ここぞ」だけ)
Claude Codeは/modelコマンドでセッション中いつでもモデルを切り替えられます。「全部Fable 5」は、毎日の通勤にF1マシンを使うようなものです。実用的な使い分けの目安がこちらです。
| タスク | おすすめモデル | 理由 |
|---|---|---|
| 設計判断・難しいバグ調査・大規模リファクタリング | Fable 5 | 知能が結果を左右する。やり直しが減るので結果的に安いことも |
| 日常のコーディング・文書作成・調査 | Opus 4.8 | 十分賢く、消費はFable 5の半分 |
| 定型作業(コマンド実行・ファイル整理・決まった手順の処理) | Sonnet 4.6 | 手順が決まった作業に知能の上限は不要 |
| 単純な確認・分類・短い質問 | Haiku 4.5 | 最軽量。claude -pのワンショット実行にも最適 |
切り替えはシンプルです。
# セッション中にいつでも
/model
# → 一覧から選択。難所に入る前にFable 5へ、
# 定型作業に戻ったらSonnetへ
# 軽い単発処理はそもそも対話セッションを使わない
claude -p "このエラーログの原因を1行で" --model haiku3モデルの性能差の実データはフロンティアモデル比較記事に、Fable 5とOpus 4.8の使い分け詳細はFable 5ガイドにまとめています。
注意:モデル一覧で[1m]が付いているのは1Mコンテキスト版です。プランによっては追加のUsage Creditsを要求されます。詳しくは「Usage credits required for 1M context」エラーの対処記事を参照してください。
節約術②:/clearでコンテキストを「引き回さない」
実測で見たとおり、コストの9割はコンテキストの引き回しです。/usageの分析画面にも「15万トークン超のコンテキストでの利用は、キャッシュが効いていても高くつく」という警告が表示されます。対策は2つのコマンドの使い分けです。
| コマンド | 何をする | 使いどころ |
|---|---|---|
/clear | 会話履歴を完全リセット | 別のタスクに移るとき(推奨・基本) |
/compact | 履歴を要約して圧縮 | 同じタスクの途中で文脈を保ちたいとき |
運用のコツは次のとおりです。
- 「タスクが変わったら/clear」を習慣にする。「記事を書く」→「サーバー設定を直す」のような切り替え時に、前のタスクの15万トークンを引き連れて行く必要はありません
- 長いタスクは、区切りの成果物(ファイル・メモ)に状態を書き出してから
/clearし、「続きはこのファイルを読んで」と再開すると、文脈を保ちつつコンテキストを軽くできます - セッションをまたぐ情報は
CLAUDE.mdに書いておけば、毎回自動で読み込まれます(これもトークンを使うので、肥大化には注意)
節約術③:スキル・常駐コンテキストを棚卸しする
意外な伏兵が、セッションに常駐する「見えないコンテキスト」です。筆者の/usage分析では、とあるスキル(参考文書つき)が利用量の18%を占めていました。読み込んだスキル文書は会話が続く限り毎ターン引き回されるためです。
/usageで「何が利用量に効いているか」を定期的に確認する(スキル別の寄与が表示されます)- 重いスキルを使う作業は専用セッションに分け、終わったら
/clearする - 大きなファイルの全文読み込みを指示しない(「必要な部分だけ検索して」と頼む)
- MCPサーバーやツールも、使わないものは外しておく(ツール定義もコンテキストを消費します)
実践レシピ:ブログ運営での使い分け例
筆者がこのブログの運営で実際に使っている分担です。
| 工程 | モデル | ポイント |
|---|---|---|
| 記事の調査・構成設計・執筆 | Fable 5 | 品質が直接成果物になる工程はケチらない |
| WordPress投稿・タグ設定などの定型作業 | Sonnet 4.6でも十分 | 手順が固まっている作業に最上位モデルは過剰 |
| アイキャッチ画像の生成 | 外部CLI(codex)に委譲 | Claudeの枠を消費しない分業 |
| 記事1本終わるごと | — | /clearしてから次のタスクへ |
ポイントは「成果物の品質に直結する工程にだけFable 5を投入し、それ以外は軽いモデルと外部ツールに逃がす」ことです。この分担に変えてから、同じ作業量でも利用枠の消費は体感で3分の1程度になりました。
よくある質問(FAQ)
Q. 利用枠はいつリセットされますか?
プランの利用枠には数時間単位のセッション枠と週間枠があり、/usageでリセット時刻を確認できます。大きな作業はリセット直後に始めると枠を最大限使えます。
Q. Fable 5は賢いぶん早く終わるなら、結局安くないですか?
難しいタスクではそのとおりです。Fable 5は1回で正解にたどり着きやすく、やり直しコストを含めるとOpus 4.8より安くつくことがあります。だからこそ「難所はFable 5、定型はSonnet」の使い分けが最適解で、「全部Sonnetで節約」も「全部Fable 5で思考停止」もどちらも損です。
Q. /compactを実行したらエラーが出ました
「Usage credits required for 1M context」エラーの可能性があります。圧縮処理が1Mコンテキストモデルを要求してしまう既知の問題で、/clearで復旧できます。詳しくは対処記事をどうぞ。
Q. APIで使う場合も同じ考え方でいいですか?
はい、むしろAPI(従量課金)の方が効果が直接料金に出ます。本記事の実測値はAPI換算なので、そのまま目安にしてください。プロンプトキャッシュの設計やBatch処理など、API特有の節約術もあります。
まとめ:枠は「我慢」ではなく「設計」で節約する
- コストの主因は出力ではなくコンテキストの引き回し(実測で9割)
- タスクが変わったら/clear——これだけで大きく変わる
- モデルは適材適所:難所はFable 5、日常はOpus 4.8、定型はSonnet、単発はHaiku
/usageで「何に消えているか」を定期確認。重いスキル・常駐コンテキストを棚卸しする- 賢いモデルを我慢するのではなく、賢いモデルが活きる場面に集中投下するのが正しいコスパ最適化
Fable 5は間違いなく現時点で最高の頭脳です。だからこそ、その頭脳を「タグの設定作業」に使わないこと。それがプラン枠と付き合う一番のコツです。
参考リンク
本記事の実測値は2026年6月の筆者のセッション(Claude Code v2.1.170・Fable 5)での計測です。プランの利用枠の仕組み・モデル料金は変更される可能性があります。


