Claude CodeでFable 5の利用枠がすぐ尽きる人へ|モデル使い分けとコンテキスト管理でコスパよく使う方法

王冠付きの大きなAIコアから軽量なコアまで4段階に並び、コインの枚数でコスト差を表現したモデル使い分けのイメージイラスト AI
スポンサーリンク

Claude CodeでFable 5の利用枠がすぐ尽きる人へ|モデル使い分けとコンテキスト管理でコスパよく使う方法

Fable 5は最強ですが、トークン消費も最重量級。実測データをもとに、利用枠を3分の1にする「使い分け」と「コンテキスト管理」のコツを解説します。

Claude Code Claude Fable 5 コスト最適化 実測データ

Claude Fable 5をClaude Codeで使い始めて、「利用枠の減りが早すぎる」と感じていませんか?それは気のせいではありません。この記事では、実際のセッションの消費データ(API換算$18分)を解剖して何にトークンが消えているのかを明らかにし、Fable 5・Opus 4.8・Sonnet 4.6・Haikuを使い分けて体感コストを3分の1以下にする実践的な方法を解説します。

前提:本記事は2026年6月12日時点の情報と、筆者の実セッションの計測値をもとにしています。プランの利用枠の仕組み・モデルの料金は変更される可能性があります。

なぜFable 5は利用枠の消費が激しいのか

理由は3つ重なっています。

  1. 単価が最高クラス:API価格で入力$10/出力$50(100万トークンあたり)。Opus 4.8の2倍、Sonnet 4.6の約3倍です。プランの利用枠も、おおむねモデルの重さに応じて消費されます
  2. 思考トークンを多く使う:Fable 5は応答の前に「考える」モデルです。賢さの源泉ですが、思考分も出力トークンとして消費されます
  3. 長いコンテキストの引き回し:長時間のセッションでは、会話履歴・読み込んだファイル・スキル文書を毎ターン参照し続けます。キャッシュで割引されるとはいえ、量が膨大になると無視できません

Fable 5自体の特徴や料金の詳細はClaude Fable 5完全ガイドを参照してください。

実測:1セッションでAPI換算$18。その9割は「コンテキストの引き回し」だった

筆者がブログ記事1本の執筆〜投稿をFable 5のClaude Codeで行ったセッション(約30分)の消費内訳です。/usageコマンドで確認できます。

項目トークン量API換算コスト割合
キャッシュ読み込み990万$9.9055%
キャッシュ書き込み52万$6.5036%
出力(思考含む)3.1万$1.549%
新規入力0.5万$0.050.3%
合計約$18

注目してほしいのは、「AIが書いた文章」のコストはたった9%だということです。残り9割は、長くなった会話コンテキスト(15万トークン超)を毎ターン読み直すキャッシュの読み書きに消えていました。

つまり節約の本丸は「賢いモデルを我慢する」ことではなく、「引き回すコンテキストを減らす」ことです。これが本記事の結論の半分です。残り半分が、タスクに応じたモデルの使い分けです。

節約術①:タスクでモデルを使い分ける(Fable 5は「ここぞ」だけ)

Claude Codeは/modelコマンドでセッション中いつでもモデルを切り替えられます。「全部Fable 5」は、毎日の通勤にF1マシンを使うようなものです。実用的な使い分けの目安がこちらです。

タスクおすすめモデル理由
設計判断・難しいバグ調査・大規模リファクタリングFable 5知能が結果を左右する。やり直しが減るので結果的に安いことも
日常のコーディング・文書作成・調査Opus 4.8十分賢く、消費はFable 5の半分
定型作業(コマンド実行・ファイル整理・決まった手順の処理)Sonnet 4.6手順が決まった作業に知能の上限は不要
単純な確認・分類・短い質問Haiku 4.5最軽量。claude -pのワンショット実行にも最適

切り替えはシンプルです。

# セッション中にいつでも
/model
# → 一覧から選択。難所に入る前にFable 5へ、
#   定型作業に戻ったらSonnetへ

# 軽い単発処理はそもそも対話セッションを使わない
claude -p "このエラーログの原因を1行で" --model haiku

3モデルの性能差の実データはフロンティアモデル比較記事に、Fable 5とOpus 4.8の使い分け詳細はFable 5ガイドにまとめています。

注意:モデル一覧で[1m]が付いているのは1Mコンテキスト版です。プランによっては追加のUsage Creditsを要求されます。詳しくは「Usage credits required for 1M context」エラーの対処記事を参照してください。

節約術②:/clearでコンテキストを「引き回さない」

実測で見たとおり、コストの9割はコンテキストの引き回しです。/usageの分析画面にも「15万トークン超のコンテキストでの利用は、キャッシュが効いていても高くつく」という警告が表示されます。対策は2つのコマンドの使い分けです。

コマンド何をする使いどころ
/clear会話履歴を完全リセット別のタスクに移るとき(推奨・基本)
/compact履歴を要約して圧縮同じタスクの途中で文脈を保ちたいとき

運用のコツは次のとおりです。

  • 「タスクが変わったら/clear」を習慣にする。「記事を書く」→「サーバー設定を直す」のような切り替え時に、前のタスクの15万トークンを引き連れて行く必要はありません
  • 長いタスクは、区切りの成果物(ファイル・メモ)に状態を書き出してから/clearし、「続きはこのファイルを読んで」と再開すると、文脈を保ちつつコンテキストを軽くできます
  • セッションをまたぐ情報はCLAUDE.mdに書いておけば、毎回自動で読み込まれます(これもトークンを使うので、肥大化には注意)

節約術③:スキル・常駐コンテキストを棚卸しする

意外な伏兵が、セッションに常駐する「見えないコンテキスト」です。筆者の/usage分析では、とあるスキル(参考文書つき)が利用量の18%を占めていました。読み込んだスキル文書は会話が続く限り毎ターン引き回されるためです。

  • /usageで「何が利用量に効いているか」を定期的に確認する(スキル別の寄与が表示されます)
  • 重いスキルを使う作業は専用セッションに分け、終わったら/clearする
  • 大きなファイルの全文読み込みを指示しない(「必要な部分だけ検索して」と頼む)
  • MCPサーバーやツールも、使わないものは外しておく(ツール定義もコンテキストを消費します)

実践レシピ:ブログ運営での使い分け例

筆者がこのブログの運営で実際に使っている分担です。

工程モデルポイント
記事の調査・構成設計・執筆Fable 5品質が直接成果物になる工程はケチらない
WordPress投稿・タグ設定などの定型作業Sonnet 4.6でも十分手順が固まっている作業に最上位モデルは過剰
アイキャッチ画像の生成外部CLI(codex)に委譲Claudeの枠を消費しない分業
記事1本終わるごと/clearしてから次のタスクへ

ポイントは「成果物の品質に直結する工程にだけFable 5を投入し、それ以外は軽いモデルと外部ツールに逃がす」ことです。この分担に変えてから、同じ作業量でも利用枠の消費は体感で3分の1程度になりました。

よくある質問(FAQ)

Q. 利用枠はいつリセットされますか?

プランの利用枠には数時間単位のセッション枠と週間枠があり、/usageでリセット時刻を確認できます。大きな作業はリセット直後に始めると枠を最大限使えます。

Q. Fable 5は賢いぶん早く終わるなら、結局安くないですか?

難しいタスクではそのとおりです。Fable 5は1回で正解にたどり着きやすく、やり直しコストを含めるとOpus 4.8より安くつくことがあります。だからこそ「難所はFable 5、定型はSonnet」の使い分けが最適解で、「全部Sonnetで節約」も「全部Fable 5で思考停止」もどちらも損です。

Q. /compactを実行したらエラーが出ました

「Usage credits required for 1M context」エラーの可能性があります。圧縮処理が1Mコンテキストモデルを要求してしまう既知の問題で、/clearで復旧できます。詳しくは対処記事をどうぞ。

Q. APIで使う場合も同じ考え方でいいですか?

はい、むしろAPI(従量課金)の方が効果が直接料金に出ます。本記事の実測値はAPI換算なので、そのまま目安にしてください。プロンプトキャッシュの設計やBatch処理など、API特有の節約術もあります。

まとめ:枠は「我慢」ではなく「設計」で節約する

  • コストの主因は出力ではなくコンテキストの引き回し(実測で9割)
  • タスクが変わったら/clear——これだけで大きく変わる
  • モデルは適材適所:難所はFable 5、日常はOpus 4.8、定型はSonnet、単発はHaiku
  • /usageで「何に消えているか」を定期確認。重いスキル・常駐コンテキストを棚卸しする
  • 賢いモデルを我慢するのではなく、賢いモデルが活きる場面に集中投下するのが正しいコスパ最適化

Fable 5は間違いなく現時点で最高の頭脳です。だからこそ、その頭脳を「タグの設定作業」に使わないこと。それがプラン枠と付き合う一番のコツです。

参考リンク

本記事の実測値は2026年6月の筆者のセッション(Claude Code v2.1.170・Fable 5)での計測です。プランの利用枠の仕組み・モデル料金は変更される可能性があります。

タイトルとURLをコピーしました