Claude CodeでFable 5の利用枠がすぐ尽きる人へ｜モデル使い分けとコンテキスト管理でコスパよく使う方法

Fable 5は最強ですが、トークン消費も最重量級。実測データをもとに、利用枠を3分の1にする「使い分け」と「コンテキスト管理」のコツを解説します。

Claude Code Claude Fable 5 コスト最適化実測データ

Claude Fable 5をClaude Codeで使い始めて、「利用枠の減りが早すぎる」と感じていませんか？それは気のせいではありません。この記事では、実際のセッションの消費データ（API換算$18分）を解剖して何にトークンが消えているのかを明らかにし、Fable 5・Opus 4.8・Sonnet 4.6・Haikuを使い分けて体感コストを3分の1以下にする実践的な方法を解説します。

前提：本記事は2026年6月12日時点の情報と、筆者の実セッションの計測値をもとにしています。プランの利用枠の仕組み・モデルの料金は変更される可能性があります。

なぜFable 5は利用枠の消費が激しいのか

理由は3つ重なっています。

単価が最高クラス：API価格で入力$10／出力$50（100万トークンあたり）。Opus 4.8の2倍、Sonnet 4.6の約3倍です。プランの利用枠も、おおむねモデルの重さに応じて消費されます
思考トークンを多く使う：Fable 5は応答の前に「考える」モデルです。賢さの源泉ですが、思考分も出力トークンとして消費されます
長いコンテキストの引き回し：長時間のセッションでは、会話履歴・読み込んだファイル・スキル文書を毎ターン参照し続けます。キャッシュで割引されるとはいえ、量が膨大になると無視できません

Fable 5自体の特徴や料金の詳細はClaude Fable 5完全ガイドを参照してください。

実測：1セッションでAPI換算$18。その9割は「コンテキストの引き回し」だった

筆者がブログ記事1本の執筆〜投稿をFable 5のClaude Codeで行ったセッション（約30分）の消費内訳です。/usageコマンドで確認できます。

項目	トークン量	API換算コスト	割合
キャッシュ読み込み	990万	$9.90	55%
キャッシュ書き込み	52万	$6.50	36%
出力（思考含む）	3.1万	$1.54	9%
新規入力	0.5万	$0.05	0.3%
合計	—	約$18	—

注目してほしいのは、「AIが書いた文章」のコストはたった9%だということです。残り9割は、長くなった会話コンテキスト（15万トークン超）を毎ターン読み直すキャッシュの読み書きに消えていました。

つまり節約の本丸は「賢いモデルを我慢する」ことではなく、「引き回すコンテキストを減らす」ことです。これが本記事の結論の半分です。残り半分が、タスクに応じたモデルの使い分けです。

節約術①：タスクでモデルを使い分ける（Fable 5は「ここぞ」だけ）

Claude Codeは/modelコマンドでセッション中いつでもモデルを切り替えられます。「全部Fable 5」は、毎日の通勤にF1マシンを使うようなものです。実用的な使い分けの目安がこちらです。

タスク	おすすめモデル	理由
設計判断・難しいバグ調査・大規模リファクタリング	Fable 5	知能が結果を左右する。やり直しが減るので結果的に安いことも
日常のコーディング・文書作成・調査	Opus 4.8	十分賢く、消費はFable 5の半分
定型作業（コマンド実行・ファイル整理・決まった手順の処理）	Sonnet 4.6	手順が決まった作業に知能の上限は不要
単純な確認・分類・短い質問	Haiku 4.5	最軽量。`claude -p`のワンショット実行にも最適

切り替えはシンプルです。

# セッション中にいつでも
/model
# → 一覧から選択。難所に入る前にFable 5へ、
#   定型作業に戻ったらSonnetへ

# 軽い単発処理はそもそも対話セッションを使わない
claude -p "このエラーログの原因を1行で" --model haiku

3モデルの性能差の実データはフロンティアモデル比較記事に、Fable 5とOpus 4.8の使い分け詳細はFable 5ガイドにまとめています。

注意：モデル一覧で[1m]が付いているのは1Mコンテキスト版です。プランによっては追加のUsage Creditsを要求されます。詳しくは「Usage credits required for 1M context」エラーの対処記事を参照してください。

節約術②：/clearでコンテキストを「引き回さない」

実測で見たとおり、コストの9割はコンテキストの引き回しです。/usageの分析画面にも「15万トークン超のコンテキストでの利用は、キャッシュが効いていても高くつく」という警告が表示されます。対策は2つのコマンドの使い分けです。

コマンド	何をする	使いどころ
`/clear`	会話履歴を完全リセット	別のタスクに移るとき（推奨・基本）
`/compact`	履歴を要約して圧縮	同じタスクの途中で文脈を保ちたいとき

運用のコツは次のとおりです。

「タスクが変わったら/clear」を習慣にする。「記事を書く」→「サーバー設定を直す」のような切り替え時に、前のタスクの15万トークンを引き連れて行く必要はありません
長いタスクは、区切りの成果物（ファイル・メモ）に状態を書き出してから/clearし、「続きはこのファイルを読んで」と再開すると、文脈を保ちつつコンテキストを軽くできます
セッションをまたぐ情報はCLAUDE.mdに書いておけば、毎回自動で読み込まれます（これもトークンを使うので、肥大化には注意）

節約術③：スキル・常駐コンテキストを棚卸しする

意外な伏兵が、セッションに常駐する「見えないコンテキスト」です。筆者の/usage分析では、とあるスキル（参考文書つき）が利用量の18%を占めていました。読み込んだスキル文書は会話が続く限り毎ターン引き回されるためです。

/usageで「何が利用量に効いているか」を定期的に確認する（スキル別の寄与が表示されます）
重いスキルを使う作業は専用セッションに分け、終わったら/clearする
大きなファイルの全文読み込みを指示しない（「必要な部分だけ検索して」と頼む）
MCPサーバーやツールも、使わないものは外しておく（ツール定義もコンテキストを消費します）

実践レシピ：ブログ運営での使い分け例

筆者がこのブログの運営で実際に使っている分担です。

工程	モデル	ポイント
記事の調査・構成設計・執筆	Fable 5	品質が直接成果物になる工程はケチらない
WordPress投稿・タグ設定などの定型作業	Sonnet 4.6でも十分	手順が固まっている作業に最上位モデルは過剰
アイキャッチ画像の生成	外部CLI（codex）に委譲	Claudeの枠を消費しない分業
記事1本終わるごと	—	`/clear`してから次のタスクへ

ポイントは「成果物の品質に直結する工程にだけFable 5を投入し、それ以外は軽いモデルと外部ツールに逃がす」ことです。この分担に変えてから、同じ作業量でも利用枠の消費は体感で3分の1程度になりました。

よくある質問（FAQ）

Q. 利用枠はいつリセットされますか？

プランの利用枠には数時間単位のセッション枠と週間枠があり、/usageでリセット時刻を確認できます。大きな作業はリセット直後に始めると枠を最大限使えます。

Q. Fable 5は賢いぶん早く終わるなら、結局安くないですか？

難しいタスクではそのとおりです。Fable 5は1回で正解にたどり着きやすく、やり直しコストを含めるとOpus 4.8より安くつくことがあります。だからこそ「難所はFable 5、定型はSonnet」の使い分けが最適解で、「全部Sonnetで節約」も「全部Fable 5で思考停止」もどちらも損です。