Claude Code $200プランを溶かさない、4層モデル使い分けの話
Photo by Andre Taissin on Unsplash
こんにちは!トークン燃やしてますか?
私は燃えてます。
Claude Code 、最初Proで様子見してたんですけど、流れるようにMaxプランまで契約しました。
でもある日、Max$200プランなのにリミットにかかってしまい、、
原因はOpusのsubAgent呼びすぎたせいなんですけど、こりゃ無限にトークン燃えちゃうなと。
設計検討も、ログ調査も、コード理解も、全部Sonnet/Opusでやってたので、そりゃ溶けますよね。
そこで組んだのが「4層モデル使い分け」運用。
そこそこよかったので共有しようかなという次第です。
目次
4層の構成
やってみてわかった落とし穴
まとめ
4層の構成
T0 →Copilot CLI(GPT-5 mini)$0(無制限)
用途:ログgrep、設定確認、軽量スクリプト
T1 →Copilot CLI(GPT-5.4)$0.04/回(300/月)
用途:設計策定、レビュー、相談
T1.5→Codex CLI(GPT-5.4)$20/月
用途:コード理解、複数ファイル横断の原因調査
T2→Claude Code (Sonnet/Opus)$200/月
用途:コード実装、hooks/Agent基盤必須の作業
ルーティングの原則は3行
これだけ。「重い処理を従量のClaude Codeで殴らない」がコア思想。
・トークン重い × 1ショット → Copilot CLI(定額、トークン量無関係)
・トークン重い × 自律マルチステップ → Codex CLI(週次リセット)
・ツール基盤必須(hooks/venv/Agent/カスタムサブエージェント) → Claude Code
一番効いたのは「設計役の引っ越し」新機能設計とかリファクタ方針策定って、コンテキスト爆食いタスクの代表選手。
アーキテクチャ図、不変条件、ドメイン知見を全部読ませて、長文の仕様書を吐かせる。
これをClaude Code Sonnet/Opusでやると一発で数万トークン。
なので丸ごと Copilot CLI(GPT-5.4)経由 に引っ越した。
コマンド1本で、コンテキストファイルを複数ぶら下げて投げるだけ。
副次効果として、プロンプトもいい感じに調整してくれます。
consult "新機能Xの設計をして" \
--planner \
--context architecture.md \
--context invariants.md \
--context knowledges/関連ドメイン.mdCopilot側はトークン量に関係なく$0.04/回。(プレミアムリクエスト方式)
300回/月までは$0.04単価で、それ超えても同額。コンテキスト10万トークン突っ込んでも料金一緒。
設計役で月70-80回走らせてるけど 最小プランの10$/月で済んでます。
Claudeの仕事は、内容聞いてタスクを振るだけ
それ以外は全部Copilot/Codexに逃がす。
軽いExploreはT0のCopilot mini無料、深いExploreはT1.5のCodex。
T0かT1か、私が投げたタスクに応じて複雑さをスコアリングし、プロンプトを調整して投げるようにスキル化まですると快適です。
やってみてわかった落とし穴
①設計品質が落ちる場面があるGPT-5.4は優秀だけど、Sonnetより設計の一貫性が弱いケースがある。重い設計タスクは Copilot経由Opus($0.12/回)にエスカレーション可。
②ルーティング判断のオーバーヘッド
最初は「これT0?T1?」って毎回迷う。スコアリング表(指示の長さ、ファイル数、設計キーワード等で加点)をルール化したら自動で振ってくれるようになった。
まとめ
Claude Code $200プランは実装役と司令塔役の枠と割り切るようになりました。設計・調査・相談は全部Copilot/Codexに逃がす。
これだけでOpus消費が9割減りました。
コード実装 — hooks、venv、カスタムサブエージェント基盤がClaude Code固有なので動かせない
司令塔役の常駐セッション — 会話履歴と長期コンテキストが命なので動かさない
他にもコンパクションオフとか、色々やってるので
また気が向いたら書きます~!