Claude Fable 5が勝手にOpus 4.8に切り替わる・ブロックされる原因と対処法

Fable 5を使っていたら、普通の作業なのに突然Opus 4.8に切り替わった——その原因は安全分類器の「過剰反応」です。仕組みと対処法を解説します。

Claude Fable 5 トラブル解決 Opus 4.8 Claude Code

Claude Fable 5で作業していると、「危険な内容を頼んだわけでもないのに、応答が止まってOpus 4.8に切り替わる」「リクエストがブロックされる」という現象に遭遇することがあります。この記事では、その原因であるFable 5の安全分類器の仕組みと、誤ブロックされやすいパターン、今日からできる対処法を解説します。

前提：本記事は2026年6月11日時点の情報をもとにしています。Anthropicは分類器のチューニングを継続中と表明しており、ここで紹介する誤反応の頻度や挙動は今後改善される可能性があります。

その症状、安全分類器の「過剰反応」かもしれません

まず、これは故障でも設定ミスでもありません。Claude Fable 5の仕様による挙動です。

Fable 5は、招待制の最強モデル「Mythos 5」と同じ基盤を一般公開するために、安全分類器（入力をチェックする仕組み）を組み込んだモデルです。分類器が「高リスク」と判定したリクエストは、Fable 5では処理されず、同じ会話のまま自動的にOpus 4.8へ引き渡されます（フォールバック）。

問題は、リリース直後の現在、この分類器が意図的に広め（厳しめ）に設定されていることです。Anthropic自身が「過剰に広いセーフガードというコストを払ってでも、できるだけ早く安全に公開することを優先した」と説明しており、その結果、まったく問題のない作業でも誤って検知される事例が多発しています。

切り替わったかどうかの確認方法：claude.aiやClaude Codeでは、応答に「どのモデルが回答したか」のラベルや通知が表示されます。応答が途中で止まって選択肢が出る場合もあります。なお、フォールバックが発生した試行にはFable 5の料金は課金されず、レート制限も消費されません。

仕組み：Fable 5の3層分類器とOpus 4.8への自動フォールバック

Fable 5の安全分類器は、大きく3つのカテゴリで入力をチェックしています。

カテゴリ	本来の検知対象	巻き込まれやすい正当な作業
`cyber`	マルウェア・攻撃コードの開発	セキュリティ対策の調査、コードレビュー、脆弱性対応
`bio`	危険な実験手法	生物学・化学の一般的な質問、ライフサイエンス研究
`reasoning_extraction`	内部推論の抽出（モデル能力の複製＝蒸留対策）	「思考過程を見せて」「推論を説明してから答えて」という普通の指示

検知されると、リクエストはOpus 4.8で実行し直されます。Fable 5とOpus 4.8は同系統のモデルなので多くの場合は問題なく作業が続きますが、「最上位モデルを使いたくてFable 5を選んでいる」のに知らないうちに格下げされているのは気持ちのいいものではありません。

Fable 5とMythos 5の関係や、なぜこのような仕組みになっているのかの背景は、Claude Mythos 5とProject Glasswingの解説記事で詳しく説明しています。

誤ブロックされやすい4つのパターン

① 「思考過程を書き出させる」指示（最重要）

実は報告が最も多いのがこれです。「ステップバイステップで考えを見せてから答えて」「推論過程を説明してから結論を出して」といった指示は、reasoning_extraction分類器に「内部推論の抽出＝蒸留の試み」と誤解されます。プロンプトのテンプレートやカスタムスキルにこの種の指示が入っていると、毎回フォールバックが発生します。

② セキュリティ関連の正当な作業

SSRF（サーバーサイドリクエストフォージェリ）の防御策を質問しただけでフラグされた検証例が報告されています。攻撃ではなく防御目的でも、セキュリティ用語が濃いリクエストはcyber分類器に引っかかることがあります。

③ 生物学・化学の一般的な質問

Anthropic自身が「bio/chem分類器は対象が広すぎる」と認めています。学校の課題レベルの生物学の質問でもブロックされた報告があります。

④ LLM開発・プロンプトエンジニアリング関連

モデルの挙動分析、プロンプトの改善、評価データセット作成など、LLM自体を扱う作業は蒸留対策の分類器に誤検知されやすい領域です。

対処法5選

対処法①：プロンプト・スキルから「思考を見せて」系の指示を外す

最も効果が大きい対策です。システムプロンプト、カスタムスキル、定型プロンプトを点検して、「推論過程を説明して」「考えを書き出してから」といった指示を削除してください。Fable 5はadaptive thinking（自動的な思考）を備えているので、この種の指示がなくても深く考えてくれます。

対処法②：表現を変えて再試行する

分類器は入力の表現に反応するため、同じ内容でも言い回しを変えると通ることがあります。セキュリティの質問なら「目的（自社サービスの防御策の検討）」を明示する、専門用語の密度を下げる、などが有効です。一度ブロックされた会話では、原因になったやり取りを削除するか、新しい会話を始めるのも効果的です。

対処法③：自動切り替えをオフにして手動で制御する

claude.aiのWeb版・デスクトップアプリでは、自動モデル切り替えをオフにできます。オフにすると、検知時に勝手にOpus 4.8で続行される代わりに、プロンプトを修正して再試行するか、自分でモデルを切り替えるかを選べます。「知らないうちに格下げされていた」を防ぎたい人向けです。

対処法④：そのタスクだけOpus 4.8を直接使う

セキュリティ調査や生物学の調べ物など、誤検知されやすい作業が続くとわかっている場合は、最初からOpus 4.8を指定するのが手っ取り早い解決策です。どうせフォールバックでOpus 4.8に切り替わるなら、最初から指定したほうが応答のやり直しがない分だけ速くなります。モデルの使い分けの考え方はClaude Fable 5の解説記事でも紹介しています。

対処法⑤（API開発者向け）：refusalハンドリングを実装する

API経由でFable 5を使う場合は、拒否時の挙動を知っておく必要があります。

# 拒否時のレスポンス（HTTP 200で返る点に注意）
{
  "stop_reason": "refusal",
  "stop_details": {
    "type": "refusal",
    "category": "cyber"   # bio / reasoning_extraction / nullの場合も
  }
}

判定はstop_reason == "refusal"で行う（stop_details.categoryはnullの可能性があるため依存しない）
拒否はHTTP 200で返るため、エラー率の監視には一切現れません。拒否率は別途計測する必要があります
サーバーサイドフォールバック機能（ベータ）を使うと、拒否時に自動で別モデルにリトライできます。レスポンスのmodelフィールドで実際に実行されたモデルを確認できます
拒否された試行は無課金・レート制限も未消費です

いつ改善される？Anthropicの公式見解

Anthropicは誤検知の多さを認識しており、特に生物・化学分類器について「対象が広すぎる」と認めたうえで、今後判定を絞り込んでいく方針を示しています。「過剰に広いセーフガードのコストを払ってでも早期の安全な公開を優先した」という説明からも、現在の厳しさは意図的な初期設定であり、段階的に緩和されていくと見てよいでしょう。

つまり、今ブロックされる作業が永久にブロックされるわけではありません。重要な作業で誤検知に遭遇したら、上記の対処法でしのぎつつ、数週間後に再度試してみる価値があります。