Claude Code レビュー
並列 Claude エージェントがすべての PR でバグを調査し、指摘事項を相互確認し、精度の高いコメントを一件投稿する。検出内容、コスト、有効化の方法。
設定をやめて、構築を始めよう。
AIオーケストレーション付きSaaSビルダーテンプレート。
問題: 人間のレビュアーは PR をざっと見る。スタイルの問題や明らかなミスは見つけるが、微妙なバグは見落とす。特に大きな差分では、数百行を過ぎると注意力が薄れる。
Claude Code Review はそれを自動 AI レビューで解決する。エージェントのチームがすべての PR に展開し、並列でバグを調査し、指摘事項を相互確認して誤検知を減らし、深刻度順に問題をランク付けし、重要な行に正確なインラインフラグを付けた高精度のサマリーを一件投稿する。
Claude Code Review の仕組み
Code Review が有効なリポジトリで PR が開かれると、システムが自動的に起動する。開発者側の設定は不要だ。内部では:
- 並列エージェント展開 -- 複数のエージェントが同時に差分全体に展開し、それぞれが異なるセクションとパターンを分析する
- バグ調査 -- エージェントはロジックエラー、セキュリティ問題、競合状態、型の不一致、人間が見落としがちな微妙なエッジケースを探す
- 相互検証 -- エージェントはお互いの指摘事項をチェックし、投稿前に誤検知をフィルタリングする
- 深刻度ランキング -- 確認された問題はインパクト順にランク付けされ、重大なバグが最初に表示される
- 出力 -- 全体的な判断を示すサマリーコメント一件と、特定の行へのインラインコメント
レビューの深さは PR のサイズに応じてスケールする。50行未満の小さな PR には軽いチェックが実施される。1,000行のリファクタリングにはより多くのエージェントによるより深い分析が行われる。平均レビュー時間は約20分だ。
Code Review がリンターと異なる点
静的解析は既知のパターンを検出する。Code Review はコンテキスト依存のバグ、構文的には正しいが論理的に間違っているものを検出する。コードが何をしようとしているかを推論し、単にルールに従っているかどうかだけを見るのではない。
Anthropic の内部テストからの実例: 一行の本番変更が認証を静かに壊すところだった。リンターはそれをフラグしない。Code Review はマージ前にクリティカルとして検出した。
TrueNAS のオープンソース ZFS 暗号化リファクタリングからの別の例: Code Review は「すべての同期で暗号化キーキャッシュを静かに消去していた」既存の型の不一致を発見した。これは本番環境で何ヶ月も生き続け、断続的な失敗の原因を誰かが解明するまで気づかれないタイプのバグだ。
内部テストの結果
Anthropic はローンチ前に数ヶ月間、自社の PR で Code Review を実行した。数字:
| 指標 | 前 | 後 |
|---|---|---|
| 実質的なレビューコメントがあった PR | 16% | 54% |
| エンジニアが誤りとマークした指摘 | -- | 1% 未満 |
| 指摘のあった大きな PR (1,000行以上) | -- | 84% (平均 7.5 件) |
| 指摘のあった小さな PR (50行未満) | -- | 31% (平均 0.5 件) |
1% 未満の誤り率が際立っている。これは PR にサジェストを大量投下するうるさいボットではない。本当に言うべきことがあるときだけ発言する集中したシステムだ。
価格とコスト管理
Code Review はトークン使用量で課金される。コストは PR の複雑さに応じてスケールする:
- 平均レビュー: PR あたり $15〜25
- 小さな PR: 範囲の下限
- 大きく複雑な PR: 範囲の上限、より多くのエージェント、より深い分析
これはオープンソースの Claude Code GitHub Action より高価で、そちらは無料だ。トレードオフは深さだ。Code Review はコストより徹底的さを優先する。
管理者向け制御
管理者は完全な支出の可視性と制御を得る:
- 月次組織支出上限 -- 上限を設定して超過しない
- リポジトリ単位の有効/無効 -- 重要なリポジトリで有効化し、実験的なものでは無効化
- 分析ダッシュボード -- レビューした PR、承認率、総コストを追跡
Code Review の有効化方法
要件: Team または Enterprise プラン。Free または Pro では利用不可。
管理者向け:
- Claude Code の設定を開く
- Code Review を有効化
- GitHub App をインストール
- 監視するリポジトリを選択
開発者向け: 不要。管理者がスイッチを切り替えると、すべての新しい PR でレビューが実行される。個別のセットアップは不要だ。
重要な制限事項
Code Review は PR を承認しない。バグを見つけてフラグを立てる。マージ前に人間がレビューして承認する必要がある。これは意図的な設計上の決定だ。AI は人間のレビューを補完するべきであり、承認ステップを置き換えるべきではない。
Code Review 対オープンソース GitHub Action
すでに Claude Code GitHub Action を使用している場合、Code Review との比較:
| 機能 | Code Review | GitHub Action |
|---|---|---|
| アーキテクチャ | マルチエージェント、並列分析 | シングルパス、軽量 |
| 深さ | 徹底的さを最適化 | 標準的な分析 |
| 誤検知率 | 1% 未満 (相互検証) | より高い (検証ステップなし) |
| コスト | $15〜25/レビュー (トークンベース) | 無料 (オープンソース) |
| セットアップ | 管理者トグル + GitHub App | 手動ワークフロー設定 |
| 利用可能性 | Team/Enterprise のみ | 誰でも |
バグをマージ前に検出することがコストに見合うチームには、Code Review が適切な選択だ。オープンソースプロジェクトやコスト重視のチームには、GitHub Action も依然として実際の価値を提供する。
Code Review が輝く場面
Code Review が最も価値を発揮する場面:
- 大きな PR -- 1,000行以上の PR の84%が指摘を受け、平均7.5件の問題がある
- 横断的な変更 -- 認証、暗号化、データ整合性に触れるリファクタリング
- 複雑なロジック -- バグが構文ではなく推論にある場合
- ハイステークスなコードベース -- 見落としたバグがインシデントを意味する本番サービス
小さく独立した変更では、0.5件の平均問題数を持つ31%の検出率は、言うべきことが何もないとき静かにしていることを意味する。これが正しい動作だ。
ワークフローへの Code Review の組み込み
Code Review は既存の git フローに組み込まれる。人間のレビュアーを置き換えるのではない。議論する価値のある問題を表面化することで、レビュアーにヘッドスタートを与える。
Claude Code のgit統合を既に使用しているチームへの実践的なパターン:
- 開発者が Claude Code の git 統合を使って PR を開く
- Code Review が自動実行される (~20 分)
- 人間のレビュアーがまず Code Review のサマリーを読む
- レビュアーがフラグされた領域に注意を集中する
- 人間が AI によるチェックと自身のレビューの両方に基づいて承認 (または変更を要求) する
これは Claude Code が多くのコードを生成するエージェントベースの開発フローで特に効果を発揮する。AI が書くほど、AI レビュアーは価値を増す。人間が維持できる深さで完全な差分を読むことができる。
マルチエージェントパターンやチームオーケストレーションで構築している場合、Code Review はエージェントが生成するものの品質ゲートになる。フィードバックループの最終チェックポイントと考えよう。
始め方
Claude Code Review は Team および Enterprise プランのベータ版リサーチプレビューとして現在利用可能だ。対象プランを利用している場合:
- 管理者に Claude Code 設定で有効化してもらう
- 組織に GitHub App をインストール
- リポジトリを選択
- PR を開いてエージェントの動作を見る
Team または Enterprise でないチームには、より軽い分析を持つ無料の代替手段としてオープンソース GitHub Action がある。
よくある質問
Claude Code Review のコストは?
Claude Code Review はトークン使用量で課金され、複雑さに応じて PR あたり平均 $15〜25 かかる。小さな PR はコストが低く、大きなリファクタリングはコストが高い。管理者は組織レベルで月次支出上限を設定できる。
Claude Code Review は無料ですか?
いいえ。Claude Code Review は Team または Enterprise プランが必要で、トークン消費に基づいてレビューごとに課金される。無料の代替手段として、オープンソースの Claude Code GitHub Action がコストゼロでより軽い自動 PR 分析を提供する。
Claude Code Review は人間のレビュアーを置き換えますか?
いいえ。Claude Code Review は PR を承認しない。バグを表面化して深刻度順にランク付けするが、人間がすべてのマージをレビューして承認する。人間のレビューを補完するよう設計されており、置き換えるものではない。
Claude Code Review の精度は?
Anthropic の数ヶ月の本番使用にわたる内部テストで、エンジニアは Claude Code Review の指摘の1%未満を誤りとマークした。1,000行以上の大きな PR では、84%がレビューあたり平均7.5件の指摘を受ける。
設定をやめて、構築を始めよう。
AIオーケストレーション付きSaaSビルダーテンプレート。