Claude Sonnet 4.6

Claude Sonnet 4.6は、直接対決のコーディング作業で前世代のフラッグシップを超え始めた中間帯モデルです。Claude Codeの内部テストでは、開発者がSonnet 4.5より4.6を約70%の確率で選びました。2025年11月の前フロンティアモデルであるOpus 4.5に対しても、テスターの59%のセッションで4.6を好みました。これは100万トークンあたり入力$3、出力$15の価格帯でOpusモデルを上回る開発者選好を持つSonnetモデルです。

もう一つの大きな躍進はコンピュータ操作に表れています。そしてエンタープライズのドキュメント作業全般では、Sonnet 4.6はOpusと同等の水準に達しました。価格は以前と変わりません。

主要スペック

スペック	詳細
API ID	`claude-sonnet-4-6`
リリース日	2026年2月17日
コンテキストウィンドウ	100万トークン（2026年3月より正式版）
最大出力	16,384トークン
価格（入力）	100万トークンあたり$3
価格（出力）	100万トークンあたり$15
ステータス	現在推奨のSonnetモデル

変更点：コーディングの改善

差が最も顕著に現れるのは長いセッションです。Sonnet 4.6はコードを触る前にコンテキストを読み込み、共有ロジックを一箇所にまとめ重複を避け、古いモデルで苛立ちの原因だった過剰なリファクタリングを控えます。

コンテキスト把握能力の向上。 変更を加える前に、モデルは実際に周辺のコードを読みます。プロジェクトの規約が拾われます。冗長なパターンが避けられます。編集は対象のコードベースに馴染む形で着地します。

過剰エンジニアリングの削減。 小さな修正を求めると、小さな修正が返ってきます。ハルシネーションによる変更や偽りの「完了」宣言は、以前のモデルと比較して大幅に減りました。一行のパッチが欲しかっただけなのに「モジュール全体をリファクタリングしました」という答えが返ってくることはほとんどなくなりました。

複雑なタスクでの強さ。 バグ検出の精度が向上し、Sonnetはチームでの並行レビュワーとしてOpusの代わりを担えるようになりました。ファイルをまたいだリファクタリング、依存関係のチェーン、複雑なマルチステップの修正が大規模コードベース全体でより確実に完了するようになりました。

デザインセンスの改善。 フロントエンドの生成物が最初からより洗練されて見えます。レイアウトがよりクリーンに、アニメーションがより滑らかになり、実用可能なものに到達するまでに必要なラウンドが減りました。初期テスターは、フロントエンドページやデータレポートの構築において、このモデルが「完璧なデザインセンス」を持っていると述べました。

長期計画の立案。 戦略シミュレーションのVending-Bench Arenaでは、Sonnet 4.6はSonnet 4.5に対して、早期に容量に投資し最後に利益に転換するという戦略で勝利しました。そのような分岐したマルチステップの推論は、日々のより難しい作業に直接現れています。

ベンチマーク結果

かつてOpusクラスのモデルが必要だった数値が、今やSonnetから出てきます：

指標	結果
Sonnet 4.5比（Claude Code）	開発者選好70%
Opus 4.5比（2025年11月）	開発者選好59%
コンピュータ操作（Pace保険）	94%の精度、テスト済みモデル中最高
OfficeQA（Databricks）	Opus 4.6と同等
Box重度推論Q&A	Sonnet 4.5比+15パーセントポイント
プロンプトインジェクション耐性	Opus 4.6と同等

実際の開発者にとって、選好率の数値が最も重要です。$3/$15のモデルが、ほとんどのコーディングセッションで$5/$25のモデルより選ばれました。これにより、日々のClaude予算の使い方が変わります。

外部の検証が内部の結果を裏付けています。Cursorの共同創業者は「長期タスクやより難しい問題を含め、あらゆる面でSonnet 4.5から注目すべき改善」と述べました。GitHubは大規模コードベースにおける複雑なコード修正について「強い解決率と開発者が必要とする一貫性」を報告しました。Cognitionはバグ検出においてOpusとの差が「意味のある形で縮まった」ことで、コストを増やすことなくより多くの並行レビュワーを実行できると述べました。

コンピュータ操作

最大の躍進が現れるのはここです。16ヶ月にわたるSonnetリリースのOSWorldスコアは着実に上昇しており、4.6はそのグラフで最大の一歩となっています。

スプレッドシート、マルチステップのウェブフォーム、エンタープライズのドキュメント取り込みがすべてより高い精度で動作します。保険テック企業Paceでの申請受付と初回損失通知ワークフローでは、モデルが94%の精度を達成しました。これはPaceにとってこれまでどのモデルも記録したことのない最高の数値です。

敵対的なコンテンツもセッションを脱線させることが難しくなりました。Sonnet 4.6のプロンプトインジェクション耐性はOpus 4.6とほぼ同等であり、コンピュータ操作の実行が操作されにくくなっています。

セーフティプロフィール

知性の向上は安全性を犠牲にしていません。Anthropicの評価では、Sonnet 4.6を「幅広く温かく、誠実で、社会的で、時にユーモラス」なキャラクターと説明しています。また「非常に強力な安全性の挙動を示し、高リスクの不整合形態に関する重大な懸念の兆候はない」とも報告しています。

プロンプトインジェクションへの耐性はSonnet 4.5より向上し、現在のOpus層と同水準にあります。コンピュータ操作を実装したり、信頼できないドキュメントにモデルを向けたりするチームにとって、これは操作への耐性という点で実質的な改善です。

新しいプラットフォーム機能

モデルと合わせていくつかのプラットフォーム要素が追加されました。

Claude in ExcelとMCP。 ExcelアドインがMCPに対応しました。S&P Global、LSEG、Daloopa、PitchBook、Moody's、FactSetなどの金融ソースから直接読み込めます。Pro、Max、Team、Enterpriseプランで利用可能です。

無料プランのアップグレード。 ファイル作成、コネクター、スキル、コンテキストコンパクションが無料プランで利用可能になりました。以前はProの背後にあった機能がベースラインになっています。

Free・Proのデフォルト。 claude.aiおよびClaude Coworkで、Sonnet 4.6がFreeおよびProユーザーのデフォルトとしてSonnet 4.5の後継となります。

ツールアクセスの拡充。 ダイナミックフィルタリング付きウェブ検索、コード実行、メモリ、プログラマティックなツール呼び出し、ツール検索がすべてこのリリースで正式版となりました。

価格

価格変更はありません。100万トークンのコンテキストウィンドウ全体にわたって価格は均一です。長いコンテキストのプレミアムはありません。90万トークンのリクエストは9千トークンのリクエストと同じトークンあたりの料金が適用されます：

ティア	コスト
全コンテキスト	入力$3 / 出力$15（100万トークンあたり）
Proプラン	月$20
Maxプラン	月$100

すでにSonnet 4.5で使用量とコストを把握済みですか？同じ料金で純粋に上位に移行できます。

Claude CodeでSonnet 4.6を使用する方法

デフォルトモデルを切り替えるコマンドは一つです：

claude config set model claude-sonnet-4-6

デフォルトを変更せずにセッションごとにオーバーライドするには：

claude --model claude-sonnet-4-6

モデルはすべてのプラットフォームで利用可能です。これにはclaude.ai（FreeおよびProのデフォルト）、Claude Cowork、Messages API、Claude Code、Amazon Bedrock、Google Vertex AIが含まれます。APIモデル識別子はclaude-sonnet-4-6です。

Sonnet 4.6とSonnet 4.5：変更点

機能	Sonnet 4.5	Sonnet 4.6
コンテキストウィンドウ	200K（標準）、100万（ベータ）	100万（正式版、統一価格）
コーディング選好	ベースライン	4.5比70%選好
Opus 4.5比（2025年11月）	Opus層以下	59%選好
コンピュータ操作	良好	保険ベンチマーク94%（最高）
OfficeQA	未報告	Opus 4.6と同等
重度推論Q&A	ベースライン	+15pp（Box評価）
指示追従	良好	過剰エンジニアリングを大幅削減
プロンプトインジェクション	ベースライン	Opus 4.6と同等
デザイン品質	良好	「完璧なデザインセンス」（Triple Whale）
標準価格	$3/$15（100万トークンあたり）	$3/$15（変更なし）

中心的な改善点はコーディング品質、コンピュータ操作、指示追従です。Sonnet 4.5がすでに得意としていたこと、速度、コスト、エージェントの振る舞いもすべて引き継がれ、その上に実質的な知性の向上が加わっています。

モデルの選択はシンプルです。高速な反復と、速度とコストがトレードオフを決める日々のコーディング作業の90%以上にはSonnet 4.6をデフォルトにしてください。最も深い推論、大規模コードベースのリファクタリング、マルチエージェントの連携、精度が欠かせない作業にはOpus 4.6に頼ってください。Opus 4.6は依然としてTerminal-Bench 2.0とHumanity's Last Examでトップの座を保っています。