Claude Opus 4.7

Claude Opus 4.7はしばらくぶりに単なるポイントアップグレードより大きく感じられる最初のClaudeリリースだ。価格は変わらない。1Mコンテキストウィンドウは変わらない。128Kの出力上限は変わらない。変わったのはClaude Codeの中で人が実際に感じる部分だ：モデルは常時監視が必要だった困難で曖昧で長時間稼働する作業が得意になった。

それは3つの場所に現れる。

行動する前により多くの自分のミスを捕捉する。
マルチステップのエージェントループの中でより長く一貫性を保つ。
「コードを書く」だけでなくドメインをまたいでより良い結果を出す：サイバーワークフロー、コードレビュー、密なスクリーンショット、エンタープライズドキュメント、契約、図、その他の曖昧なソース重視の作業。

Claude Codeで既に活動しているなら、短い答えはシンプルだ：Opus 4.7は高リスクなエンジニアリングセッションのための新しいデフォルトアップグレードだ。ワークフローのアドバイスが欲しければ、専用のOpus 4.7ベストプラクティスガイドを読もう。ドメイン別の具体例が欲しければ、コンパニオンのOpus 4.7ユースケースページを読もう。

クイックバーディクト

間違いが高コストな作業にはOpus 4.7を使おう：

多くのファイルにまたがる複雑なリファクタリング
不完全または矛盾する証拠でのデバッグ
微妙なバグが重要なコードレビュー
サイバーディフェンス、脆弱性リサーチ、セキュリティ監査
法律、金融、運営のドキュメント重視の作業
密なスクリーンショット、図、UIモックのマルチモーダルタスク

最大推論深度よりもスピードとコストが重要な小さな日常編集にはSonnetを使い続けよう。

主要スペック

スペック	詳細
API ID	`claude-opus-4-7`
リリース日	2026年4月16日
コンテキストウィンドウ	1Mトークン
最大出力	128,000トークン
価格	$5入力/$25出力（1Mトークンあたり）
シンキングモード	アダプティブシンキング
努力レベル	`low`、`medium`、`high`、`xhigh`、`max`
Claude Codeデフォルト努力	`xhigh`
知識カットオフ	2026年1月
ステータス	現行Opusフラッグシップ

Claude Opus 4.7 vs Opus 4.6

基本的な話は「少し賢くなった」ではない。「難しい作業のスライスでより信頼性が高くなった」だ。

領域	Opus 4.6	Opus 4.7
CursorBench	58%	70%
Rakuten-SWE-Bench	ベースライン	解決した本番タスクが3倍
XBOW視覚的鮮明度	54.5%	98.5%
OfficeQA Pro	ベースライン	21%少ないエラー
BigLaw Bench	低め	`high`努力で90.9%
Notionエージェントツールエラー	ベースライン	約3分の1
解像度サポート	1568px / 1.15MP	2576px / 3.75MP
デフォルトClaude Code努力	`high`	`xhigh`
シンキング制御	アダプティブ、古いマイグレーションパス	アダプティブのみ、固定バジェットシンキング廃止
ツール使用スタイル	ツールをより多く使う	より選択的、より推論優先
サブエージェントの動作	より自由に委任	より選択的に委任

重要な部分は数値だけでなく行動的なものだ。AnthropicとローンチパートナーはOpus 4.7が指示に対してより文字通りで、仮定を確認する意欲が高く、長いタスクを押し通すのが得意で、途中でループしたり静かに失敗したりする可能性が低いと説明する。

実際に改善されたこと

1. 自己検証がより頻繁に現れる

最も明確なローンチシグナルの1つは、Opus 4.7が回答やコード変更にコミットする前により多くの確認を行うことだ。

Anthropicのローンチページには、Vercelが新しい行動を説明する：モデルは作業を開始する前にシステムコードの証明を行う。Hexは、データが欠けているときにもっともらしい代替ロジックを発明する代わりに認めるのが得意だと述べる。それが重要なのは、多くの実際のエンジニアリングの痛みが構文エラーではないからだ。不完全なコンテキストに対する自信に満ちた-しかし間違った-推論だ。

Claude Code内では、これは次のように見える傾向がある：

編集する前にもう1つファイルを読む
型を変更する前にコールサイトを確認する
状態の形状やスキーマについての仮定を確認する
並行性やマイグレーションパスを検証するために一時停止する

その余分なステップが、クリーンな最初のパスと40分のループの違いになることが多い。

2. 長時間稼働のエージェント作業の脱線が減る

Devinは、Opus 4.7が何時間も一貫して作業し、早期に諦める代わりに難しいタスクを押し通すと報告した。Notionは複雑なマルチステップワークフローで14%の向上を報告し、Opus 4.6の約3分の1のツールエラーになった。Gensparksは、ループ耐性、一貫性、優雅な回復を最も重要な3つの本番特性として挙げた。

これによりOpus 4.7は以下に適している：

より長いリファクタリング
非同期コーディングエージェント
CIと自動化ワークフロー
サービス全体のレビューパス
モデルが繰り返し読み、比較し、修正しなければならない調査

3. ハードなコーディングが動いた、簡単なコーディングだけでなく

CursorBenchが58%から70%に上昇したことが重要なのは、コーディングエージェントに実際に渡される曖昧で複雑な実際のプロンプトに近いからだ。Rakutenの本番SWEタスクでの3倍の改善が重要なのは、その向上がおもちゃの例やベンチマークに優しい問題に限定されないことを示唆するからだ。

CodeRabbitは精度を安定させながらレビューワークロードで10%以上のリコール改善を報告した。WarpとQodoはともに、4.7が現在捕捉または解決するより難しいバグクラスを指摘した。Factoryは、少ないツールエラーとより信頼性の高いフォローアップにより、DroidsのタスクサクセスでFactoryは10〜15%の向上を報告した。

パターンは一貫している：Opus 4.7は単に「より雄弁」なだけではない。より難しいクラスのエンジニアリング作業をこなす。

4. 密なビジョン入力がついに一流になった

解像度のジャンプはリリースの中で最も過小評価されている変更の1つだ。1568px / 1.15MPから2576px / 3.75MPへの移動はコスメティックではない。クロッピングなしでモデルが読めると信頼できるものが変わる。

これは特に入力が以下の場合に役立つ：

パックされたダッシュボードスクリーンショット
小さいテキストのターミナルキャプチャ
技術図
密なラベルのデザインモックアップ
スキャンされた契約テーブルや文書の抜粋
化学や生命科学の図

XBOWの視覚的鮮明度が54.5%から98.5%へのジャンプは、追加されたピクセルが実際の有用性に変換されるという最も鋭い証拠だ。

5. 純粋なコーディング以外でも強くなった

Anthropicのリリースは、Opus 4.7がコーディング、エンタープライズワークフロー、長時間稼働のエージェントタスクでより強くなったと位置づけた。パートナーの例がそれを裏付ける：

サイバーセキュリティ：XBOWは自律ペンテストにおける最大の視覚的な痛みポイントが実質的に消えたと述べる。
法律：Harveyはhigh努力でBigLaw Benchで90.9%を報告し、曖昧な編集とレビューテーブルについてより良い推論をする。
ドキュメントとエンタープライズ推論：DatabricksはOfficeQA Proで21%少ないエラーを報告した。
金融とリサーチ：応用AIテスターは強化された開示規律とより良い長コンテキストパフォーマンスを強調した。
生命科学：Solve Intelligenceは化学構造と技術図での向上を指摘した。
デザインとUI：Lovableはデザインのセンスが実際に出荷するモデルの選択を作るほど強いと述べた。

これにより、Opus 4.7は単なるコーディングモデルではなく、より広い「高リスクなナレッジワーク」モデルになる。

重要なベンチマーク結果

完全なベンチマークの壁はローンチ日には有用だが、ユーザー価値にきれいにマッピングされる数字は一部だけだ。

ベンチマーク	重要な理由
CursorBench: 70%	狭いコーディング評価よりも実際のコーディングエージェントプロンプトに近い
Rakuten-SWE-Bench: 3倍多く解決	おもちゃのリポジトリだけでなく本番エンジニアリングタスクでの動きを示す
XBOW視覚的鮮明度: 98.5%	密な画像理解が実質的に改善されたことを証明
BigLaw Bench: 90.9%	契約と法務レビューユースケースへの強いシグナル
OfficeQA Pro: 21%少ないエラー	エンタープライズドキュメントとドキュメント推論の有用なプロキシ
Notionエージェント: +14%、少ないツールエラー	マルチステップエージェント信頼性の良い指標
CodeRabbit: リコール+10%	レビューとバグ発見ワークフローへの強いシグナル

Claude Code用のモデルを選んでいる場合、CursorBench、Rakuten、Notion、CodeRabbit、XBOWがこのリリースで最も実用的なシグナルだ。

Opus 4.7が最も活躍する場所

Claude Codeエンジニアリングセッション

これは明白なものだ。Opus 4.7はタスクが曖昧で、マルチファイルで、やり直しが高コストな場合に優れている。APIマイグレーション、横断的リファクタリング、並行性バグ、アーキテクチャレビュー、コードベース全体のクリーンアップはすべて、モデルがより文字通りで、より忍耐強く、より検証重視になったことから恩恵を受ける。

Opus 4.7はセキュリティで重要だ。コーディング能力とサイバー能力が今や密接にリンクしているからだ。Project Glasswingは2026年4月7日に発表され、Opus 4.7についてではなくMythos Previewについてのものだ。しかしAnthropicは2026年4月16日のOpus 4.7ローンチで明示的にGlasswingを参照し、新しいサイバーセーフガードが重要な理由を説明している：Opus 4.7は実世界でこれらのセーフガードの一部をテストしている最初のパブリックモデルだ。

それにより2つの結論が得られる：

このモデルは深刻な防御的セキュリティ作業に役立つほど強力だ
このモデルはAnthropicが積極的にリスクの高い悪用を制約するほど強力だ

正当な脆弱性リサーチ、ペネトレーションテスト、レッドチーミングを行うなら、AnthropicはプロフェッショナルをCyber Verification Programに向けている。

法律、金融、エンタープライズ運営

Opus 4.7は作業が「比較し、検証し、要約し、欠けているピースを幻覚せずに避ける」ものであれば強い。契約、監査証跡、レビューテーブル、財務メモ、ポリシードキュメント、内部運営文書はすべて、モデルの強化されたキャリブレーションとドキュメント推論から恩恵を受ける。

マルチモーダルプロダクト、デザイン、R&D作業

より良いスクリーンショット読み取りと図の処理により、デザイン批評、プロダクトQA、生命科学ワークフロー、特許、技術文書により有用になった。以前は手動でズームまたはクロッピングが必要だったソース素材なら、Opus 4.7ははるかに使いやすい。

より具体的なドメイン例とプロンプトアイデアはClaude Opus 4.7ユースケースを参照しよう。

サイバー、リスク、安全：このリリースが異なる理由

Opus 4.7に関するAnthropicのローンチメッセージは、能力を称えるだけでなく、リリースをライブのサイバーリスクストーリーの中に位置づけるという点で異常だ。

AnthropicはOpus 4.7がMythos Previewよりも能力が低いが、それでもMythosに対してサイバー能力を差別的に減らすためのトレーニング中の実験を行うほど強力だと述べている。また、禁止されたまたは高リスクのサイバーセキュリティ利用を示すリクエストを検出してブロックする自動化されたセーフガードも出荷した。

これはモデルについて書く誰にとっても重要だ。それが角度を変えるからだ：

Opus 4.7は単に速いコパイロットではない。
それはサイバーの利益とサイバーリスクが今や一緒に動くカテゴリに属する。
防御的ワークフローは正当な強みの領域だ。
安全でないまたは許可されていない攻撃的ワークフローは明示的なデプロイ上の懸念事項だ。

実際のところ、それはOpus 4.7を以下に強いと位置づけるべきことを意味する：

セキュアコードレビュー
防御的監査パス
脅威モデリング
脆弱性トリアージ
承認されたプログラム内のペンテストサポート
セキュリティ文書と修復プランニング

汎用の「なんでもサイバー」エンジンとしてではなく。

ビジョン：3倍の解像度アップグレード

Opus 4.7は、画像パイプラインが独自の購入判断に値する最初のClaudeリリースだ。

新しい解像度上限は以下を意味する：

スクリーンショットを送信する前のクロッピングが少ない
小さいテキストと密なUIでの信頼性向上
技術図のより強力な解釈
返された座標から実際のピクセルへのよりクリーンなマッピング

トレードオフはトークンコストだ。Anthropicは、フル解像度の画像は人々が慣れていた約1,600トークン範囲の代わりに約4,784トークンを消費する可能性があると指摘する。画像重視のワークフローでは、ダウンサンプリングがコスト管理の一部になる。

Claude CodeでのOpus 4.7のベストプラクティス

Claude Code内のOpus 4.7についてのAnthropicの独自ガイダンスは、技術的というよりも行動的だ。テーマは：より良く委任し、コンテキストを早めにバッチ処理し、不要な往復を減らすだ。

重要なシグナルとなる習慣：

最初のターンに本当のタスクを入れる：意図、制約、ファイルパス、受け入れ基準
インタラクティブな往復が推論オーバーヘッドを追加するため、可能な限りユーザーターンを減らす
深刻なコーディング作業のデフォルトとしてxhighを維持する
多くの並行セッションにわたってコストを管理する必要がある場合はhighに下げる
最も難しい作業と評価スタイルの上限テストにmaxを予約する
ツールをいつ使うべきか、サブエージェントにいつファンアウトするかをモデルに明示的に伝える
タスクがよく定義されていて全体的な方向性を信頼している場合はオートモードを使う
繰り返される安全なプロンプトを許可リストポリシーに変えるために数セッション後に新しい/fewer-permission-promptsスキルを実行する
完全なトランスクリプトを再読せずに状態を素早く回復できるよう、長時間稼働のセッションに戻るときは要約を使う
モデルを信頼していてすべての中間ステップではなく最終結果だけが欲しい場合はフォーカスビューを使う
デフォルトを常に正しいとして扱わずに/effortを意図的にチューニングする
古いコンテキストを引き引きずらず、タスクが変わったら新しいセッションを開始する

最後の4つのポイントはまさに「小さなワークフロー変更、大きな品質ジャンプ」アドバイスの種類で、Boris ChernyがそのOpus 4.7ローンチ当日のXスレッドで強調し始めたものだ。基本となるパターンは公式ドキュメントとも一致している：少ない割り込み、よりクリーンなセッション回復、トランスクリプトノイズの低減、より意図的な努力制御はすべて、モデルが長い自律的な実行に対応できるようになったときより重要になる。

その完全なワークフローバージョンはClaude Opus 4.7ベストプラクティスにある。

Opus 4.6からのマイグレーションノート

4.6から4.7にAPIワークロードを移行する場合、単にモデル名を交換して出荷しないこと。

アダプティブシンキングが固定バジェットシンキングを置き換える

古いthinking: { type: "enabled", budget_tokens: N }フローはOpus 4.7では廃止された。代わりにアダプティブシンキングと努力レベルを使おう。

デフォルト以外のサンプリングパラメータが廃止された

コードがまだtemperature、top_p、top_kをデフォルト値以外に設定している場合、Opus 4.7は400を返す。それらのノブを削除し、プロンプティングと努力を通じて動作を形成しよう。

シンキング表示が変わった

シンキングブロックは、要約表示に明示的にオプトインしない限りデフォルトで空だ。UIが表示されるシンキングテキストに依存していた場合、更新が必要だ。

トークナイザーが変わった

Anthropicは、コンテンツによって同じ入力が以前のトークン数の約1.0倍から1.35倍にマッピングされる可能性があると述べている。古い予算がまだ適用されると仮定する前に、コストとトークンの見積もりを再ベースラインしよう。

高解像度画像はより高コストになる

以前はスクリーンショットを気軽に送信していた場合、4.7は画像品質をはるかに良くし、画像トークンコストを実質的に高くする。ダウンサンプリングを意識的なレバーとして扱おう。

タスクバジェットをテストする価値がある

Anthropicはパブリックベータとしてタスクバジェットを導入し、モデルが完全なエージェントランにわたって自己ペースできるようにした。長いループを実行する場合、暴走したセッションに痛い目を見る前に今テストしよう。

価格とコスト

Opus 4.7はOpus 4.6と同じヘッドライン価格を維持している：

ティア	コスト
入力	1Mトークンあたり$5
出力	1Mトークンあたり$25

実際のコストが同一であることを意味しない。

実際の請求額は以下によって形成される：

新しいトークナイザー
より高い努力レベルでの高い推論コスト
より高コストなフル解像度画像
インタラクティブなマルチターンセッションかワンショットの委任タスクかどうか

楽観的な読み方はHexやReplitのようなローンチパートナーから来る：より低い努力でのより高い品質が生のトークン増加の一部を相殺できる。正しい動きは仮定することではない。実際のワークロードで測定しよう。

Claude Opus 4.7にアップグレードすべきか？

以下がペインポイントであればイエス：

途中で止まるエージェント
もっともらしく聞こえるが推測しすぎるモデル
難しいコードレビューとデバッグ作業
密なビジュアルまたはドキュメント入力
ツールを使うマルチステップワークフロー

以下がワークロードの大半なら、すぐには必要ないかもしれない：

小さな編集サイクル
安価な一括自動化
低リスクのコンテンツ生成
Sonnetでも十分な素早いQ&A

ほとんどの真剣なClaude Codeユーザーには、正しい戦略はシンプルだ：Sonnetを速い日常オプションとして維持し、インテリジェンス感度の高い作業のフラッグシップとしてOpus 4.7を使う。