Claude Code $200プランを溶かさない、4層モデル使い分けの話

こんにちは！トークン燃やしてますか？

私は燃えてます。

Claude Code 、最初Proで様子見してたんですけど、流れるようにMaxプランまで契約しました。

でもある日、Max$200プランなのにリミットにかかってしまい、、

原因はOpusのsubAgent呼びすぎたせいなんですけど、こりゃ無限にトークン燃えちゃうなと。

設計検討も、ログ調査も、コード理解も、全部Sonnet/Opusでやってたので、そりゃ溶けますよね。

そこで組んだのが「4層モデル使い分け」運用。

そこそこよかったので共有しようかなという次第です。

これだけ。「重い処理を従量のClaude Codeで殴らない」がコア思想。

・トークン重い × 1ショット → Copilot CLI（定額、トークン量無関係）
・トークン重い × 自律マルチステップ → Codex CLI（週次リセット）
・ツール基盤必須（hooks/venv/Agent/カスタムサブエージェント） → Claude Code

一番効いたのは「設計役の引っ越し」新機能設計とかリファクタ方針策定って、コンテキスト爆食いタスクの代表選手。
アーキテクチャ図、不変条件、ドメイン知見を全部読ませて、長文の仕様書を吐かせる。
これをClaude Code Sonnet/Opusでやると一発で数万トークン。

なので丸ごと Copilot CLI（GPT-5.4）経由 に引っ越した。
コマンド1本で、コンテキストファイルを複数ぶら下げて投げるだけ。
副次効果として、プロンプトもいい感じに調整してくれます。

consult "新機能Xの設計をして" \
  --planner \
  --context architecture.md \
  --context invariants.md \
  --context knowledges/関連ドメイン.md

Copilot側はトークン量に関係なく$0.04/回。（プレミアムリクエスト方式）
300回/月までは$0.04単価で、それ超えても同額。コンテキスト10万トークン突っ込んでも料金一緒。
設計役で月70-80回走らせてるけど最小プランの10$/月で済んでます。

Claudeの仕事は、内容聞いてタスクを振るだけ
それ以外は全部Copilot/Codexに逃がす。
軽いExploreはT0のCopilot mini無料、深いExploreはT1.5のCodex。
T0かT1か、私が投げたタスクに応じて複雑さをスコアリングし、プロンプトを調整して投げるようにスキル化まですると快適です。

やってみてわかった落とし穴

①設計品質が落ちる場面がある
GPT-5.4は優秀だけど、Sonnetより設計の一貫性が弱いケースがある。重い設計タスクは Copilot経由Opus（$0.12/回）にエスカレーション可。

②ルーティング判断のオーバーヘッド
最初は「これT0？T1？」って毎回迷う。スコアリング表（指示の長さ、ファイル数、設計キーワード等で加点）をルール化したら自動で振ってくれるようになった。

まとめ

Claude Code $200プランは実装役と司令塔役の枠と割り切るようになりました。
設計・調査・相談は全部Copilot/Codexに逃がす。
これだけでOpus消費が9割減りました。

コード実装 — hooks、venv、カスタムサブエージェント基盤がClaude Code固有なので動かせない
司令塔役の常駐セッション — 会話履歴と長期コンテキストが命なので動かさない

他にもコンパクションオフとか、色々やってるので

また気が向いたら書きます～！

Claude Code $200プランを溶かさない、4層モデル使い分けの話

安達敏樹

AI Copilot Codex ClaudeCode

Claude Code $200プランを溶かさない、4層モデル使い分けの話

目次

4層の構成

やってみてわかった落とし穴

まとめ