Claude Code の料金とトークン使用量
ccusage によるトラッキング、/model の切り替え、/compact と /clear、プランモード、そして自分のワークロードに合ったプランティアで Claude Code のコストを 40〜70% 削減する方法。
設定をやめて、構築を始めよう。
AIオーケストレーション付きSaaSビルダーテンプレート。
問題: Claude Code の請求額が増え続け、使用制限に何度もぶつかり、どのプランティアが自分のワークフローに合っているのかわからない。適切なモデルの選択と少しのトラッキングで、コストを 40〜70% 削減できます。
すぐに試せる方法: ccusage をインストールして、トークンがどこに消えているかを確認しましょう:
npm install -g @ryoppippi/ccusage
ccusage daily今日のトークン消費量とコスト内訳をすぐに確認できます。
Claude Code の料金
Claude Code を使うには、最低でも Pro サブスクリプション(月額 $20)が必要です。無料ティアにはターミナルアクセスがありません。
Claude Pro(月額 $20): 無料ティアの5倍の制限、Sonnet アクセス、5時間あたり約 45 メッセージ。学習や趣味のプロジェクトに最適。
Claude Max 5x(月額 $100): Pro の5倍の制限(5時間あたり約 225 メッセージ)、Opus への十分なアクセス。フルタイムの開発者に最適。
Claude Max 20x(月額 $200): Pro の 20 倍の制限(5時間あたり約 900 メッセージ)、Opus への完全アクセス。日常的なヘビーユースや複雑なエンジニアリングに最適。
API 従量課金: Sonnet は入力 $3 / 出力 $15(100万トークンあたり)。Opus は入力 $15 / 出力 $75(100万トークンあたり)。予測可能な大量利用に最適。
コストを削減するコマンド
/model でモデルを切り替える
タスクの複雑さに応じて切り替えましょう:
/model sonnet # Default for 80% of tasks
/model opus # Complex architecture decisions onlyルール: 毎セッションを Sonnet から始めること。深い分析や大規模リファクタリングが必要な場合だけ Opus に切り替える。
コンテキスト管理
/compact # Compress conversation when context gets long
/clear # Start fresh for unrelated tasks会話が長くなるほど、新しいメッセージごとにトークンを多く消費します。Claude が文脈を見失い始めたら /compact を実行し、別の作業に移るときは /clear を使いましょう。
プランモード(Shift+Tab)
重い操作の前にターミナルで Shift+Tab を2回 押してプランモードに入りましょう。先に計画を立てることで手戻りにかかるコストを節約できます。コードを書く前に Claude がアプローチを描くので、問題を早期に発見できます。
使用量のトラッキング
ccusage のレポートで消費を監視しましょう:
ccusage daily # Daily breakdown (default)
ccusage monthly # Monthly aggregation
ccusage blocks --live # Real-time 5-hour billing windows
ccusage daily --breakdown # Per-model cost breakdown急増の原因を追うときは日付範囲でフィルタリングします:
ccusage daily --since 20250101 --until 20250131
コスト削減のパターン
具体的なプロンプトは曖昧なものより効率的です。 比較してみましょう:
# Expensive (wastes tokens on clarification)
claude "make this better"
# Efficient (immediate results)
claude "optimize readability in src/auth.js - extract constants, add error handling"関連するタスクをまとめることでコンテキストを有効活用します:
claude "update error handling in auth.js, user.js, and api.js"
コストが高くなりやすい習慣に注意:
- 長いデバッグセッション。小さく絞ったリクエストに分割しましょう。
- 同じ説明の繰り返し。CLAUDE.md に保存しましょう。
- コードベース全体のレビュー。特定のファイルを指定しましょう。
コスト管理のための環境変数
モデルの切り替えはひとつの手段です。いくつかの環境変数でトークン消費を直接コントロールできます。
不要な呼び出しを減らす
# Suppress background model calls that aren't critical to your task
export DISABLE_NON_ESSENTIAL_MODEL_CALLS=1提案やヒントなど、重要でない機能に使われるモデル呼び出しを無効化します。コアのワークフローはそのままで、バックグラウンドのトークン使用が減ります。
コスト警告を無効にする
# Suppress cost warning messages in the CLI
export DISABLE_COST_WARNINGS=1予算を設定済みで中断されたくない場合に便利です。ccusage でベースラインを把握するまでは推奨しません。
プロンプトキャッシュの制御
Claude Code はデフォルトでプロンプトキャッシュを使用してコストとレイテンシを削減します。デバッグやベンチマークのために無効化する場合:
# Disable prompt caching globally
export DISABLE_PROMPT_CACHING=1
# Or disable per-model
export DISABLE_PROMPT_CACHING_HAIKU=1
export DISABLE_PROMPT_CACHING_SONNET=1
export DISABLE_PROMPT_CACHING_OPUS=1グローバル設定がモデル別の設定を上書きします。繰り返しのコンテキストでコストが大幅に下がるため、本番環境ではキャッシュをオンのままにしておきましょう。
opusplan 戦略
Opus レベルの推論を Opus レベルの料金なしで使いたい場合、opusplan モデルエイリアスがハイブリッドで動作します:
claude --model opusplan
opusplan では、プランモード中の推論とアーキテクチャの決定に Opus を使い、コード生成と実装には Sonnet に切り替えます。重要な場面(計画)で Opus クオリティを得ながら、すべてのコード行に Opus の料金を払う必要がありません。
プランニングモードを定期的に使う場合、最も効果的なコスト削減策のひとつです。
うまくいかないとき
制限に近づいている? モデルを切り替えてコンパクト化しましょう:
/model sonnet
/compactレートリミットに達した? 1時間のリセットを待つか、リクエストをまとめて送るか、プランのティアを上げることを検討してください。
関連ページ
- ccusage をインストールして
ccusage daily --breakdownを実行する - トークン節約のためのコンテキスト管理
- ワークフローに合ったモデル選択
- 高コストなデバッグを避けるためのトラブルシューティング
週単位でトラッキングしてデータをもとに調整しましょう。これらの方法で、ほとんどの開発者はコストを 40〜70% 削減できます。
設定をやめて、構築を始めよう。
AIオーケストレーション付きSaaSビルダーテンプレート。