Claude Code Ultra Review 完全ガイド

問題はここにあります：コードレビューは確率の悪いゲームです。人間のレビュアーは明らかなミスは見つけられますが、大きな差分には集中力が持ちません。認証、暗号化、3つのDBテーブルにまたがる1,500行のリファクタリング？847行目のちょっとした型の不一致は誰にも気づかれないまま、そのままリリースされます。

/review はある程度助けになります。ローカルセッションでのシングルパス検査でかなりの問題を拾えます。ただし、エージェントは1つ、パスも1回、検証ステップなし。見つかった問題はそれなりですが、確信度は低めです。

/ultrareview は動き方が違います。差分をクラウドサンドボックスに送り、エージェント群を立ち上げ、各発見を独立した検証パスに通してから結果を返します。返ってくるのは確認済みのバグだけです。

/ultrareviewが実際にやること

このコマンドはClaude Code v2.1.111に搭載され、2026年4月16日にリサーチプレビューとして公開されました。呼び出し方は2通りあります。

ブランチモードは現在のブランチとデフォルトブランチの差分をレビューします。コミット前・ステージ済みの変更も含まれます：

/ultrareview

PRモードはGitHubのPR番号を渡します。リモートサンドボックスがローカルのワーキングツリーをバンドルせず、GitHubから直接クローンします：

/ultrareview 1234

リポジトリが大きすぎてバンドルできない場合はPRモードを使いましょう。ブランチをプッシュしてドラフトPRを作り、番号を渡すだけです。

4つのステージ

すべてのレビューはクラウドサンドボックス上で同じ4ステージを経ます。

セットアップ：Anthropicがリモートインフラを準備し、サブエージェント群を立ち上げます。デフォルトは5エージェント。これに約90秒かかります。

発見（Find）：エージェントが変更コードの異なる実行パスを並列で探索します。それぞれが独立して動くため、競合状態、ロジックエラー、モジュール間の型の不一致が複数の角度から同時に掘り起こされます。

検証（Verify）：別のエージェントが各候補を再現しようとします。1つのエージェントしかフラグを立てなかったバグは別のエージェントに挑戦されます。独立して確認できなければ、結果に出てきません。

重複排除（Dedup）：複数のエージェントが見つけた重複する発見を、ランク付きレポートに統合します。

起動前の確認ダイアログにスコープが表示されます：ファイル数、行数、残りの無料実行回数、推定コスト。確認後にレビューが始まります。

レビューはバックグラウンドタスクとして動きます。ターミナルは自由に使えます。進捗は /tasks で確認できます。ターミナルを閉じても大丈夫です。途中で止めると、クラウドセッションはアーカイブされ、部分的な結果はゼロで返ってきます。

/reviewとの比較

	`/review`	`/ultrareview`
実行場所	ローカル、セッション内	リモートクラウドサンドボックス
深さ	シングルパス	マルチエージェント＋独立検証
所要時間	数秒〜数分	5〜10分（大きいPRは最大20分）
コスト	通常の使用量としてカウント	無料回数あり、その後$5〜$20/回
向いてる場面	作業中の素早いフィードバック	大きな変更のマージ前の確認

決定的な違いは検証ステージです。/review は1回のパス。/ultrareview は別エージェントによる再現確認を突破した発見だけを返します。誤検知率1%未満の根拠はここにあります。

知っておきたい実績

Anthropicは公開前に自社のPRでこれを動かしました。内部テストの数字（claudefa.stより）：

指標	結果
大きいPR（1,000行以上）で発見あり	84%、平均7.5件/回
小さいPR（50行未満）で発見あり	31%、平均0.5件
エンジニアが「不正解」とマークした発見	1%未満
実質的なレビューコメントがあったPR（導入前後）	16% → 54%

実際の使用例を2つ。Anthropic社内での1行の認証変更が、そのままではログインフローを静かに壊していました。/ultrareview がマージ前にクリティカルとしてフラグを立てました。TrueNASのZFS暗号化リファクタリングでは、毎回の同期で暗号化キーキャッシュが消える型の不一致を発見しました。断続的な障害の原因を正しいコミットまで追跡するのに何ヶ月もかかるタイプのバグです。

実践者による11,000行の音声通話PRでのテスト（mejba.meより）：発見ステージで64件の候補、検証後に絞り込まれた確定セット、合計17分。モジュール境界をまたいだ競合状態とステート管理の問題。シングルパスのレビューでは見逃すもの、なぜなら1つのエージェントがすべてを同時に把握できないからです。

料金

プラン	無料回数	無料回数以降
Pro	3回（2026年5月5日まで）	追加使用量として請求
Max	3回（2026年5月5日まで）	追加使用量として請求
Team	なし	追加使用量として請求
Enterprise	なし	追加使用量として請求

差分のサイズに応じて1回あたり約$5〜$20かかります。無料回数は一度きりの付与です。2026年5月5日に使っても使わなくても失効します。更新なし、繰り越しなし。

実行前に確認すること：アカウントで追加使用量が有効になっているかチェックしてください。/extra-usage で確認できます。追加使用量がオフだと起動時にブロックされます。確認ダイアログから有効にすることはできません。

プラットフォーム要件

必須：

Claude Code v2.1.111以降
Claude.aiアカウント認証（APIキーのみ使用中の場合は先に /login を実行）
PRモードにはリポジトリへの github.com リモート

利用不可：

Amazon Bedrock
Google Cloud Vertex AI
Microsoft Foundry
Zero Data Retentionが有効な組織

これはアーキテクチャ上の制限です。/ultrareview はClaude.aiアカウント認証とAnthropicのWebインフラが必要です。マネージドクラウドプロバイダーを使うチームへの回避策はありません。

使うべきタイミング

/ultrareview は信頼性が重要な変更のマージ前レビューです。コードベース全体の監査ではありません。

向いているケース：

認証、決済、インフラに触れる500行超の大きいPR
マルチエージェント検証が重要なセキュリティ絡みの変更
複数モジュールにまたがる複雑なリファクタリング（競合状態、境界間の型の不一致）
PR番号を渡してコントリビューターや外部PRをレビューする場合

向いていないケース：

フィーチャーブランチでの高速イテレーション（5〜20分は速いループには合わない、/review を使って）
コードベース全体の監査（スコープは常にデフォルトブランチとの差分）
50行未満の軽微な変更
CI/CDパイプライン（インタラクティブセッションとClaude.ai認証が必要）
Bedrock、Vertex、Foundry、ZDR環境

よくある失敗

公開後に「使い物にならない」という声が多く出た原因はこれです：

/ultrareview はブランチとデフォルトブランチの差分をレビューします。既存のコードベース全体をスキャンするわけではありません。

変更のない完成済みコードベースには差分がほぼゼロです。そこにコマンドを向けると結果もほぼゼロです。これは意図通りの動作です。このツールはマージ前のレビュアーであり、監査ツールではありません。

コードベース全体をレビューしたいなら、/ultrareview は違うツールです。

段階的レビュー戦略

コミュニティ（r/ClaudeCode）で広まっている実践パターン：

PRの種類	ツール	理由
すべてのPR	`/review`（5分以内）	常時動くスモークチェック
大きいPRや重要なPR（500行以上、認証/決済/インフラ）	`/ultrareview`（10〜20分）	マージ前の深い検査
インフラ変更（DBマイグレーション、セキュリティ書き直し）	`/ultrareview`	リスクが高い変更に最高の確信度を

/review は煙感知器です。常時動作、速い。/ultrareview は構造的な変更にサインオフする前に呼ぶ点検です。

実践的なコツ

無料回数が切れる前に /extra-usage を実行しておきましょう。課金設定がなければ起動時にブロックされ、何も始まりません。

実行前にコミットかスタッシュをしておきましょう。ブランチモードは確認した瞬間のワーキングツリーをバンドルします。起動後の変更はそのレビューに含まれません。

発見が出てきたら、同じセッション内の通知からすぐ修正しましょう。放置するとコンテキストが無駄になります。

バンドルできないリポジトリは：ブランチをプッシュ、ドラフトPRを作成、/ultrareview <PR番号> を実行。サンドボックスがGitHubから直接クローンします。

/tasks でバックグラウンドで動くレビューを追跡できます。ターミナルを閉じても戻ってきたら結果が見られます。

これが示すもの

/ultrareview はあるパターンの2番目のコマンドです。/ultraplan（v2.1.92）が重い計画処理をクラウドに移しました。/ultrareview（v2.1.111）がコードレビューで同じことをします。ルーティンやリモートトリガーも同じロジックに従います。

「ultra」プレフィックスのコマンドはどれも、重い計算処理をローカルセッションからAnthropicホストのインフラにオフロードします。この機能（独立検証付きの5〜20並列エージェント）はクラウドでしか実現できません。ラップトップ上で20エージェントをサンドボックスで同時に動かすことはできません。

コスト構造はこれを反映しています。すべてのultraコマンドはプランに含まれるコンピュートとは別に、追加使用量として個別に請求されます。サブスクリプションはアクセス権です。クラウドコンピュートはその上に従量課金されます。

エージェントを動かすモデルは公式には確認されていません。コミュニティではロジックとバグ探しにOpusクラス、スタイル違反にSonnetクラスという説が出ています。Anthropicは使用モデルを確認していません。

バグのないマージは時間がかかります。でも本番環境でのデバッグにかかる時間は減ります。/ultrareview はその2つの事実が交わる場所です。

Claude Code Ultra Review 完全ガイド

/ultrareviewが実際にやること

4つのステージ

/reviewとの比較

知っておきたい実績

料金

プラットフォーム要件

使うべきタイミング

よくある失敗

段階的レビュー戦略

実践的なコツ

これが示すもの

よくある質問

Claude Codeの/ultrareviewとは何ですか？

/ultrareviewはいくらかかりますか？

/ultrareviewは無料で使えますか？

/reviewと/ultrareviewの違いは何ですか？

/ultrareviewはどのくらいかかりますか？

/ultrareviewの精度はどのくらいですか？

/ultrareviewでコードベースを調べたが何も見つからなかった

/ultrareviewでコードベース全体をレビューできますか？

/ultrareviewはAmazon BedrockやGoogle Vertex AIで動きますか？

/ultrareviewに必要なClaude Codeのプランは？

/ultrareviewの追加使用量を有効にするには？

/ultrareviewはCI/CDパイプラインで動きますか？

/ultrareviewを途中で止めるとどうなりますか？

/ultrareviewは何エージェント使いますか？

/ultrareviewで他人のプルリクエストをレビューできますか？

/ultrareviewが/reviewでは見逃すものとは？

/ultrareviewにGitHubアカウントは必要ですか？

ProとMaxのサブスクライバーの無料実行がなぜ3回だけなのですか？

必要なClaude Codeのバージョンは？

/ultrareviewはコミット前の変更でも動きますか？

On this page