なぜ$200/月でも足りないのか
はてなベースでは、ビジネスサイドの非エンジニアも含めほぼ全社員がClaude Code を業務利用しています。エンジニアサイドとビジネスサイドの一部がMax 20x プラン($200/月)に加入していますが、以下のような業務を並行すると、週の半ばでリミットに到達することが常態化しました。
- コード生成・リファクタリング(Opus 4.7 のエージェントモード)
- E2Eテストの自動生成と実行
- インフラ構築・セキュリティレビュー
- 市場調査・競合分析・専門知識の調査
DX・AXを掲げる当社では、非エンジニアのメンバーもシステムへの理解を深めるために自らClaude を使って調査を行っています。これまで定性的に語っていた内容を定量的な根拠に基づいて議論できるよう、市場データの収集やロジックの組み立てにClaude を活用するケースが増えました。
特にビジネスサイドはAPIへのアクセス権を持たないため、Claudeにブラウザの画面操作を任せながら別の作業を並行するという使い方が多く、画面操作はスクリーンショットの連続送信でトークン消費が大きくなります。また、PDFの読み込み ― 契約書や調査レポートの要点整理など ― も日常的に行われており、こうした使い方がトークン消費を想定以上に押し上げる要因になっています。
原因は明確です。Claude Code のエージェントモードでは、ツール呼び出しのたびにコンテキスト全体が再送信されます。ファイルの読み込み、コマンドの実行、差分の確認 ― 1つのタスクで数十回のツール呼び出しが発生し、そのたびに数万トークンが消費されます。
2026年3月末、Anthropicは公式に「Claude Code users are hitting usage limits way faster than expected」と声明を出しました。UI版のClaude.aiと同じリミット設計がエージェント型のClaude Codeには合わないという構造的な問題です。
出典: DevClass ― Anthropic admits Claude Code users hitting usage limits way faster than expected
Maxプランのレートリミット仕様
Anthropic公式ヘルプセンターによると、各プランのClaude Code利用可能時間は以下の通りです。ただし、実際にはトークンベースの制限であり、コンテキストサイズや入力量によって大きく変動します。
さらに、ITPM(Input Tokens Per Minute)という1分あたりの入力トークン数制限も存在します。エージェントモードでは毎回コンテキストを再送するため、ITPMのほうが先に引っかかるケースが多く報告されています。
Opus 4.7 でファイル読み込みを含むリファクタリングタスクを実行すると、1時間あたり約50万〜100万トークンを消費します。Max 20x の週24〜40時間という目安は、軽いタスク(短いプロンプト+少量のコード)を前提とした数値であり、実務ではこの半分以下になることも珍しくありません。
出典: Claude Help Center ― Using Claude Code with your Pro or Max plan
8つの回避策(難易度順)
難易度が低い順に、すぐ実践できるものから並べています。
1. /model コマンドでモデルを使い分ける
難易度: 低 / コスト: なし
Claude Code のセッション中に /model と入力すると、Opus ↔ Sonnet ↔ Haiku を即座に切り替えられます。Sonnet の利用枠は Opus の5〜20倍あるため、定型的な作業やコードレビューはSonnetに任せるだけで消費を大幅に減らせます。
# セッション中にモデルを切り替え
/model sonnet # 軽い作業用
/model opus # 複雑な推論が必要なとき
2. PDFを事前にテキスト変換する
難易度: 低 / コスト: なし
PDFをそのままClaudeに渡すと画像として処理され、通常テキストの10〜20倍のトークンを消費します。pdftotextやpandocで事前にテキスト変換してからプロンプトに含めると、同じ情報を1/10以下のトークンで渡せます。
# PDFをテキストに変換してからClaudeに渡す
pdftotext document.pdf document.txt
# または
pandoc document.pdf -o document.md
3. 利用時間帯を分散する
難易度: 低 / コスト: なし
レートリミットはサーバー負荷に応じて動的に変動します。日本時間の午前中(米国の深夜帯)はリミットが緩和される傾向があり、同じMaxプランでもより多くのトークンを使える可能性があります。重いタスクは朝イチに集中させるのが有効です。
4. APIフォールバックを設定する
難易度: 低 / コスト: 従量課金(使った分だけ)
Maxプランのリミットに到達したら、環境変数 ANTHROPIC_API_KEY を有効にしてAPI従量課金に切り替えます。APIキーが設定されている間はMaxプランではなくAPI課金が優先されるため、リミットを気にせず作業を継続できます。詳細はセクション5で解説します。
5. プロンプトキャッシュを活用する
難易度: 中 / コスト: なし(むしろ削減効果あり)
Anthropic のプロンプトキャッシュは、キャッシュヒットした分のトークンがITPM制限にカウントされないという特性があります。以下の工夫でキャッシュヒット率を上げられます。
CLAUDE.mdにプロジェクトのコンテキストを集約する(キャッシュTTL 5分)- Projects機能で共通ドキュメントを登録する
- セッションを短く切らず、同一コンテキスト内で作業を継続する
6. Projectsで全文ロードをやめる
難易度: 中 / コスト: なし
大量のドキュメントを毎回コンテキストに載せるのではなく、Claude の Projects 機能でRAG検索に切り替えます。必要な部分だけをチャンク単位で取得するため、トークン消費が1/5〜1/10に減少します。
7. 複数アカウントで用途別に分担する
難易度: 中 / コスト: +$100〜200/月
CLAUDE_CONFIG_DIR 環境変数を切り替えることで、複数のMaxアカウントを独立して管理できます。エンジニア用・情シス用・広報用など用途別に分けると、互いのリミットに干渉しません。詳細はセクション4で解説します。
8. マルチプロバイダーで負荷分散する
難易度: 高 / コスト: 別途API費用
要約・翻訳・定型文生成など、Claude でなくても対応できるタスクを GPT-4o や Gemini 2.5 Pro に振り分けます。Claude は複雑な推論・大規模コード生成に特化させることで、限られたトークン枠を有効活用できます。
CLAUDE_CONFIG_DIR で複数アカウントを切り替える
Claude Code は公式に CLAUDE_CONFIG_DIR 環境変数をサポートしており、アカウントごとに独立した設定・認証情報を保持できます。
手動で切り替える方法
# アカウント1(デフォルト)
claude
# アカウント2に切り替え
export CLAUDE_CONFIG_DIR=~/.claude-account2
claude
# → 初回は認証を求められる。2回目以降はそのまま使える
# アカウント3に切り替え
export CLAUDE_CONFIG_DIR=~/.claude-account3
claude
シェルのエイリアスを設定しておくと便利です。
# ~/.zshrc に追加
alias claude1="CLAUDE_CONFIG_DIR=~/.claude claude"
alias claude2="CLAUDE_CONFIG_DIR=~/.claude-account2 claude"
alias claude3="CLAUDE_CONFIG_DIR=~/.claude-account3 claude"
OSSツールで自動化する
手動切り替えが面倒な場合、以下のOSSツールが利用できます。
APIフォールバックの設定方法
Maxプランのリミットに到達しても業務を止めたくない場合、API従量課金へのフォールバックを設定しておくのが最も確実です。
設定手順
1. Anthropic Console でAPIキーを発行する
2. 環境変数を設定する
# ~/.zshrc または ~/.bashrc に追加
export ANTHROPIC_API_KEY="sk-ant-api03-xxxxx"
3. Maxプランのリミットに到達したら、環境変数を有効にしてClaude Code を再起動する
Claude Code は以下の順で認証を試みます。
- 1.
ANTHROPIC_API_KEY環境変数(API従量課金) - 2. OAuth認証(Max / Pro プラン)
APIキーが設定されている間はMaxプランではなくAPI課金が常に優先されます。自動フォールバックではないため、普段は環境変数を設定せずMaxプランで運用し、リミットに到達したときだけ手動で有効にする運用がおすすめです。
# リミット到達時だけ有効にする
export ANTHROPIC_API_KEY="sk-ant-api03-xxxxx"
claude
# Maxプランに戻すときは解除する
unset ANTHROPIC_API_KEY
claude
複数アカウント運用の法的リスク
Anthropic の利用規約(2026年4月4日改定版)を精査し、各運用パターンのリスクを整理しました。
現時点で最もリスクが低いのは「Max + APIフォールバック」の組み合わせです。通常はMaxプランのトークンを使い、超過時だけAPI課金に切り替える。これは公式にサポートされた運用方法であり、法的リスクはゼロです。
複数アカウント運用については、規約上「禁止」と明記されていない以上、別メール・別課金であれば実質的に問題ないと当社では判断しています。ただし、Anthropic側がこの運用を正式に認めているわけではないため、今後の規約改定で明確化される可能性はあります。
Claude Codeをチームで本格運用する企業が増えている現状を考えると、複数アカウントの公式サポート(チームプラン、シート単位の課金など)が早期に実現されることを強く望みます。現状では個人向けのMaxプランしか選択肢がなく、組織でのスケーリングに限界があります。APIのTier制限とMaxプランのリミットを統合した「Enterprise Code」のようなプランがあれば、この問題は根本的に解決するはずです。
出典: Anthropic ― Updates to Consumer Terms and Privacy Policy(2026年4月4日改定)
API従量課金 vs Max ― どちらが得か
フォールバック先のAPI従量課金はどの程度のコストになるのか。モデル別の料金を整理しました。
開発者のKyle Redelinghuys氏の検証によると、8ヶ月間Claude Codeを日常的に使い続けた結果、累計約100億トークンを消費。API従量課金であれば$15,000以上になるところ、Maxプランでは月額$100〜200で済んだとのことです。同氏は~/.claude/のローカルセッションログを解析してこの数値を算出しており、コストトラッカーツールもOSSで公開しています。
月間5,000万トークン以上使うならMax 5x($100/月)、月間2億トークン以上ならMax 20x($200/月)が経済的です。
リミット超過分をAPI課金でカバーする場合、月$50〜100程度の追加コストで業務停止リスクを完全に排除できるケースが多いです。
出典・参考情報
- Anthropic公式|Using Claude Code with your Pro or Max plan
- Anthropic公式|Updates to Consumer Terms and Privacy Policy
- Anthropic公式|Claude API Pricing
- Claude Code Docs|Authentication
- DevClass|Anthropic admits Claude Code users hitting usage limits way faster than expected
- TechCrunch|Anthropic unveils new rate limits to curb Claude Code power users
- LaoZhang AI|Claude Code Rate Limit: Complete Fix Guide
- DEV Community|Claude Code Rate Limit on Max Plan: Workarounds
- claude-swap|GitHub





