Claude Code Ultra Review 完全ガイド
クラウド上のエージェント群がPRの差分を並列で探索し、見つかった問題を独立検証してから報告します。/ultrareviewの仕組み、使うべきタイミング、コストについて解説します。
設定をやめて、構築を始めよう。
AIオーケストレーション付きSaaSビルダーテンプレート。
問題はここにあります:コードレビューは確率の悪いゲームです。人間のレビュアーは明らかなミスは見つけられますが、大きな差分には集中力が持ちません。認証、暗号化、3つのDBテーブルにまたがる1,500行のリファクタリング?847行目のちょっとした型の不一致は誰にも気づかれないまま、そのままリリースされます。
/review はある程度助けになります。ローカルセッションでのシングルパス検査でかなりの問題を拾えます。ただし、エージェントは1つ、パスも1回、検証ステップなし。見つかった問題はそれなりですが、確信度は低めです。
/ultrareview は動き方が違います。差分をクラウドサンドボックスに送り、エージェント群を立ち上げ、各発見を独立した検証パスに通してから結果を返します。返ってくるのは確認済みのバグだけです。
/ultrareviewが実際にやること
このコマンドはClaude Code v2.1.111に搭載され、2026年4月16日にリサーチプレビューとして公開されました。呼び出し方は2通りあります。
ブランチモードは現在のブランチとデフォルトブランチの差分をレビューします。コミット前・ステージ済みの変更も含まれます:
/ultrareviewPRモードはGitHubのPR番号を渡します。リモートサンドボックスがローカルのワーキングツリーをバンドルせず、GitHubから直接クローンします:
/ultrareview 1234リポジトリが大きすぎてバンドルできない場合はPRモードを使いましょう。ブランチをプッシュしてドラフトPRを作り、番号を渡すだけです。
4つのステージ
すべてのレビューはクラウドサンドボックス上で同じ4ステージを経ます。
セットアップ:Anthropicがリモートインフラを準備し、サブエージェント群を立ち上げます。デフォルトは5エージェント。これに約90秒かかります。
発見(Find):エージェントが変更コードの異なる実行パスを並列で探索します。それぞれが独立して動くため、競合状態、ロジックエラー、モジュール間の型の不一致が複数の角度から同時に掘り起こされます。
検証(Verify):別のエージェントが各候補を再現しようとします。1つのエージェントしかフラグを立てなかったバグは別のエージェントに挑戦されます。独立して確認できなければ、結果に出てきません。
重複排除(Dedup):複数のエージェントが見つけた重複する発見を、ランク付きレポートに統合します。
起動前の確認ダイアログにスコープが表示されます:ファイル数、行数、残りの無料実行回数、推定コスト。確認後にレビューが始まります。
レビューはバックグラウンドタスクとして動きます。ターミナルは自由に使えます。進捗は /tasks で確認できます。ターミナルを閉じても大丈夫です。途中で止めると、クラウドセッションはアーカイブされ、部分的な結果はゼロで返ってきます。
/reviewとの比較
/review | /ultrareview | |
|---|---|---|
| 実行場所 | ローカル、セッション内 | リモートクラウドサンドボックス |
| 深さ | シングルパス | マルチエージェント+独立検証 |
| 所要時間 | 数秒〜数分 | 5〜10分(大きいPRは最大20分) |
| コスト | 通常の使用量としてカウント | 無料回数あり、その後$5〜$20/回 |
| 向いてる場面 | 作業中の素早いフィードバック | 大きな変更のマージ前の確認 |
決定的な違いは検証ステージです。/review は1回のパス。/ultrareview は別エージェントによる再現確認を突破した発見だけを返します。誤検知率1%未満の根拠はここにあります。
知っておきたい実績
Anthropicは公開前に自社のPRでこれを動かしました。内部テストの数字(claudefa.stより):
| 指標 | 結果 |
|---|---|
| 大きいPR(1,000行以上)で発見あり | 84%、平均7.5件/回 |
| 小さいPR(50行未満)で発見あり | 31%、平均0.5件 |
| エンジニアが「不正解」とマークした発見 | 1%未満 |
| 実質的なレビューコメントがあったPR(導入前後) | 16% → 54% |
実際の使用例を2つ。Anthropic社内での1行の認証変更が、そのままではログインフローを静かに壊していました。/ultrareview がマージ前にクリティカルとしてフラグを立てました。TrueNASのZFS暗号化リファクタリングでは、毎回の同期で暗号化キーキャッシュが消える型の不一致を発見しました。断続的な障害の原因を正しいコミットまで追跡するのに何ヶ月もかかるタイプのバグです。
実践者による11,000行の音声通話PRでのテスト(mejba.meより):発見ステージで64件の候補、検証後に絞り込まれた確定セット、合計17分。モジュール境界をまたいだ競合状態とステート管理の問題。シングルパスのレビューでは見逃すもの、なぜなら1つのエージェントがすべてを同時に把握できないからです。
料金
| プラン | 無料回数 | 無料回数以降 |
|---|---|---|
| Pro | 3回(2026年5月5日まで) | 追加使用量として請求 |
| Max | 3回(2026年5月5日まで) | 追加使用量として請求 |
| Team | なし | 追加使用量として請求 |
| Enterprise | なし | 追加使用量として請求 |
差分のサイズに応じて1回あたり約$5〜$20かかります。無料回数は一度きりの付与です。2026年5月5日に使っても使わなくても失効します。更新なし、繰り越しなし。
実行前に確認すること:アカウントで追加使用量が有効になっているかチェックしてください。/extra-usage で確認できます。追加使用量がオフだと起動時にブロックされます。確認ダイアログから有効にすることはできません。
プラットフォーム要件
必須:
- Claude Code v2.1.111以降
- Claude.aiアカウント認証(APIキーのみ使用中の場合は先に
/loginを実行) - PRモードにはリポジトリへの
github.comリモート
利用不可:
- Amazon Bedrock
- Google Cloud Vertex AI
- Microsoft Foundry
- Zero Data Retentionが有効な組織
これはアーキテクチャ上の制限です。/ultrareview はClaude.aiアカウント認証とAnthropicのWebインフラが必要です。マネージドクラウドプロバイダーを使うチームへの回避策はありません。
使うべきタイミング
/ultrareview は信頼性が重要な変更のマージ前レビューです。コードベース全体の監査ではありません。
向いているケース:
- 認証、決済、インフラに触れる500行超の大きいPR
- マルチエージェント検証が重要なセキュリティ絡みの変更
- 複数モジュールにまたがる複雑なリファクタリング(競合状態、境界間の型の不一致)
- PR番号を渡してコントリビューターや外部PRをレビューする場合
向いていないケース:
- フィーチャーブランチでの高速イテレーション(5〜20分は速いループには合わない、
/reviewを使って) - コードベース全体の監査(スコープは常にデフォルトブランチとの差分)
- 50行未満の軽微な変更
- CI/CDパイプライン(インタラクティブセッションとClaude.ai認証が必要)
- Bedrock、Vertex、Foundry、ZDR環境
よくある失敗
公開後に「使い物にならない」という声が多く出た原因はこれです:
/ultrareview はブランチとデフォルトブランチの差分をレビューします。既存のコードベース全体をスキャンするわけではありません。
変更のない完成済みコードベースには差分がほぼゼロです。そこにコマンドを向けると結果もほぼゼロです。これは意図通りの動作です。このツールはマージ前のレビュアーであり、監査ツールではありません。
コードベース全体をレビューしたいなら、/ultrareview は違うツールです。
段階的レビュー戦略
コミュニティ(r/ClaudeCode)で広まっている実践パターン:
| PRの種類 | ツール | 理由 |
|---|---|---|
| すべてのPR | /review(5分以内) | 常時動くスモークチェック |
| 大きいPRや重要なPR(500行以上、認証/決済/インフラ) | /ultrareview(10〜20分) | マージ前の深い検査 |
| インフラ変更(DBマイグレーション、セキュリティ書き直し) | /ultrareview | リスクが高い変更に最高の確信度を |
/review は煙感知器です。常時動作、速い。/ultrareview は構造的な変更にサインオフする前に呼ぶ点検です。
実践的なコツ
無料回数が切れる前に /extra-usage を実行しておきましょう。課金設定がなければ起動時にブロックされ、何も始まりません。
実行前にコミットかスタッシュをしておきましょう。ブランチモードは確認した瞬間のワーキングツリーをバンドルします。起動後の変更はそのレビューに含まれません。
発見が出てきたら、同じセッション内の通知からすぐ修正しましょう。放置するとコンテキストが無駄になります。
バンドルできないリポジトリは:ブランチをプッシュ、ドラフトPRを作成、/ultrareview <PR番号> を実行。サンドボックスがGitHubから直接クローンします。
/tasks でバックグラウンドで動くレビューを追跡できます。ターミナルを閉じても戻ってきたら結果が見られます。
これが示すもの
/ultrareview はあるパターンの2番目のコマンドです。/ultraplan(v2.1.92)が重い計画処理をクラウドに移しました。/ultrareview(v2.1.111)がコードレビューで同じことをします。ルーティンやリモートトリガーも同じロジックに従います。
「ultra」プレフィックスのコマンドはどれも、重い計算処理をローカルセッションからAnthropicホストのインフラにオフロードします。この機能(独立検証付きの5〜20並列エージェント)はクラウドでしか実現できません。ラップトップ上で20エージェントをサンドボックスで同時に動かすことはできません。
コスト構造はこれを反映しています。すべてのultraコマンドはプランに含まれるコンピュートとは別に、追加使用量として個別に請求されます。サブスクリプションはアクセス権です。クラウドコンピュートはその上に従量課金されます。
エージェントを動かすモデルは公式には確認されていません。コミュニティではロジックとバグ探しにOpusクラス、スタイル違反にSonnetクラスという説が出ています。Anthropicは使用モデルを確認していません。
バグのないマージは時間がかかります。でも本番環境でのデバッグにかかる時間は減ります。/ultrareview はその2つの事実が交わる場所です。
よくある質問
Claude Codeの/ultrareviewとは何ですか?
/ultrareview はClaude Codeのクラウドベースのコードレビューコマンドです。リモートサンドボックス上でエージェント群を起動し、ブランチの差分を並列で探索してバグを探し、各発見を独立検証してから結果を返します。返ってくるのは確認済みのバグだけです。Claude Code v2.1.111で2026年4月16日に搭載されました。
/ultrareviewはいくらかかりますか?
差分のサイズに応じて1回あたり約$5〜$20で、プランとは別の追加使用量として請求されます。ProとMaxのサブスクライバーは2026年5月5日まで有効な無料実行3回が付与されます。TeamとEnterpriseには無料回数はありません。レビューは常にプランに含まれるコンピュートとは別に請求されます。
/ultrareviewは無料で使えますか?
ProとMaxのサブスクライバーには無料実行3回があります(2026年5月5日失効、使わなくても失効)。使い切った後は1回あたり$5〜$20の追加使用量として請求されます。TeamとEnterpriseプランには無料枠はありません。
/reviewと/ultrareviewの違いは何ですか?
/review はClaude Codeセッション内でローカルにシングルパス検査を実行します。/ultrareview は差分をクラウドサンドボックスに送り、5〜20エージェントを並列で動かし、各候補を独立した検証エージェントに通してから結果を返します。/review は数秒。/ultrareview は5〜20分。/review は通常のプラン使用量としてカウントされます。/ultrareview は追加使用量として請求されます。
/ultrareviewはどのくらいかかりますか?
ほとんどのレビューは5〜10分で完了します。非常に大きいPR(mejba.meでの11,000行の差分テスト)では17分かかりました。最大規模の差分では最大20分を想定してください。
/ultrareviewの精度はどのくらいですか?
Anthropicの内部テストでは、エンジニアが不正解とマークした発見は1%未満でした。1,000行超のPRでは84%のレビューで発見が返り、平均7.5件です。低い誤検知率は検証ステージから来ています。各候補バグが結果に出る前に別のエージェントが独立して再現を試みます。
/ultrareviewでコードベースを調べたが何も見つからなかった
/ultrareview は現在のブランチとデフォルトブランチの差分だけをレビューします。既存のコードベース全体はスキャンしません。最近の変更がない完成済みコードベースで実行したなら、差分はほぼゼロです。これは意図通りの動作です。このツールはマージ前のレビュアーであり、コードベースの監査ツールではありません。
/ultrareviewでコードベース全体をレビューできますか?
できません。スコープは常にブランチとデフォルトブランチの差分です。mainにすでにあるコードではなく、マージしようとしているコードのバグを見つけます。コードベース全体の監査には別のアプローチが必要です。
/ultrareviewはAmazon BedrockやGoogle Vertex AIで動きますか?
動きません。/ultrareview はClaude.aiアカウント認証が必要で、AnthropicのWebインフラ上で動作します。Bedrock、Vertex AI、Microsoft Foundry、Zero Data Retentionが有効な組織では利用できません。回避策はありません。
/ultrareviewに必要なClaude Codeのプランは?
追加使用量がアカウントで有効であれば、どのプランでも /ultrareview を使えます。ProとMaxのサブスクライバーには無料実行3回があります。TeamとEnterpriseのユーザーは最初から1回ごとに支払います。この機能はTeamやEnterpriseに限定されていません(GitHub連携製品のClaude Code Reviewとは異なります)。
/ultrareviewの追加使用量を有効にするには?
Claude Codeで /extra-usage を実行してください。追加使用量がまだ有効でない場合、そのコマンドで課金設定にリンクされます。/ultrareview を実行する前に有効にしておく必要があります。追加使用量がオフだと起動時にブロックされ、フロー途中の確認ダイアログから有効にすることはできません。
/ultrareviewはCI/CDパイプラインで動きますか?
動きません。Claude.aiアカウント認証付きのインタラクティブなClaude Codeセッションが必要です。自動パイプラインの実行はサポートされていません。
/ultrareviewを途中で止めるとどうなりますか?
クラウドセッションがアーカイブされ、部分的な結果はゼロで返ってきます。17分のレビューを10分地点で止めても、何も返ってきません。最後まで動かしましょう。
/ultrareviewは何エージェント使いますか?
デフォルトは5エージェントです。設定で最大20まで上げられますが、より多いフリートサイズがユーザー設定可能かティア制限かは公式には公開されていません。
/ultrareviewで他人のプルリクエストをレビューできますか?
はい。GitHubのPR番号を渡してください:/ultrareview 1234。リモートサンドボックスがGitHubからPRを直接クローンします。アクセスできるGitHub PRであれば、コントリビューターのPRやメンテナンスしているオープンソースリポジトリも含めて動きます。
/ultrareviewが/reviewでは見逃すものとは?
マルチエージェントの並列探索は、差分の複数部分を同時に把握する必要があるバグを捕捉します:モジュール境界をまたいだ競合状態、2つの変更ファイルが相互作用するときだけ問題になる型の不一致、複数の関数にまたがる制御フローのロジックエラー。シングルパスのエージェントは差分を逐次的に読みます。5つのエージェントが異なる角度から同時に探索し、互いに検証し合います。
/ultrareviewにGitHubアカウントは必要ですか?
ブランチモード(/ultrareview のみ)ではGitHubアカウントは不要です。Claude Codeがローカルのワーキングツリーをバンドルします。PRモード(/ultrareview 1234)では、リポジトリへの github.com リモートが必要です。
ProとMaxのサブスクライバーの無料実行がなぜ3回だけなのですか?
Anthropicは公式な説明をしていません。コミュニティ(r/claude)ではバックエンドのコンピュートコストが異常に高いという説があり、公開されていないフロンティアモデルでエージェントが動いているという説もあります。Max(月$200)のサブスクライバーでさえ3回という上限は広く注目されています。この機能はリサーチプレビューなので、料金と提供内容は変更される可能性があると明示されています。
必要なClaude Codeのバージョンは?
Claude Code v2.1.111以降です。claude --version で確認してください。ドキュメントにはv2.1.86が最小と書かれていますが、この機能が導入されたのはv2.1.111です。
/ultrareviewはコミット前の変更でも動きますか?
はい。ブランチモードは確認した瞬間のフルワーキングツリーをバンドルします。ステージ済みと未ステージの変更も含まれます。確認後に加えた変更はそのレビューには含まれません。
設定をやめて、構築を始めよう。
AIオーケストレーション付きSaaSビルダーテンプレート。