Claude Sonnet 4.6

Claude Sonnet 4.6, c'est le modèle de milieu de gamme qui a commencé à battre le flagship de la génération précédente dans les tâches de code en tête-à-tête. Dans les tests internes de Claude Code, les développeurs l'ont préféré à Sonnet 4.5 environ 70% du temps. Face à Opus 4.5, le précédent modèle frontier de novembre 2025, les testeurs préféraient quand même 4.6 sur 59% des sessions. Un modèle Sonnet qui surpasse un modèle Opus en préférence développeur, au prix de $3 en entrée et $15 en sortie par million de tokens.

Le deuxième grand saut, c'est l'utilisation informatique. Et sur le travail documentaire en entreprise, Sonnet 4.6 arrive au même niveau que son homologue Opus. Même prix qu'avant.

Specs clés

Spec	Détails
API ID	`claude-sonnet-4-6`
Date de sortie	17 février 2026
Fenêtre de contexte	1M tokens (GA depuis mars 2026)
Sortie max	16 384 tokens
Tarif (entrée)	$3 par million de tokens
Tarif (sortie)	$15 par million de tokens
Statut	Actif, Sonnet recommandé actuel

Ce qui a changé : les améliorations en code

Les longues sessions, c'est là où la différence se fait le plus entendre. Sonnet 4.6 lit le contexte avant de toucher au code, regroupe la logique partagée en un seul endroit au lieu de la dupliquer, et abandonne les refactorisations trop zélées qui rendaient les anciens modèles frustrants.

Meilleure compréhension du contexte. Avant de faire un changement, le modèle lit vraiment le code autour. Les conventions maison sont comprises. Les patterns redondants sont évités. Les modifications s'intègrent bien dans la base de code dans laquelle elles vont.

Moins de surengineering. Demande un petit correctif et tu obtiens un petit correctif. Les changements hallucinés et les fausses affirmations "c'est fait" chutent nettement par rapport aux modèles précédents. Tu verras bien moins de réponses "j'ai refactorisé tout le module pour toi" quand un patch d'une ligne était tout ce que tu voulais.

Plus fort sur les tâches complexes. La détection de bugs est assez bonne pour que Sonnet puisse remplacer Opus comme reviewer parallèle dans une équipe. Les refactorisations inter-fichiers, les chaînes de dépendances, et les correctifs difficiles multi-étapes arrivent plus fiablement sur les grandes bases de code.

Meilleur sens du design. La génération frontend est plus soignée dès le départ. Les mises en page sont plus propres, les animations moins maladroites, et moins de tours sont nécessaires pour arriver à quelque chose de livrable. Les premiers testeurs ont dit que le modèle avait "un goût parfait du design" pour construire des pages frontend et des rapports de données.

Planification à long horizon. Sur Vending-Bench Arena, une simulation stratégique, Sonnet 4.6 a battu Sonnet 4.5 en investissant tôt dans la capacité puis en pivotant vers le profit à la fin. Ce type de raisonnement ramifié et multi-étapes se retrouve directement dans le travail quotidien difficile.

Résultats des benchmarks

Des chiffres qui nécessitaient auparavant un modèle de classe Opus sortent maintenant de Sonnet :

Métrique	Résultat
vs Sonnet 4.5 (Claude Code)	70% de préférence développeur
vs Opus 4.5 (nov. 2025)	59% de préférence développeur
Utilisation informatique (Pace insurance)	94% de précision, meilleur modèle testé
OfficeQA (Databricks)	Égale Opus 4.6
Q&A raisonnement lourd (Box)	+15 points de pourcentage sur Sonnet 4.5
Résistance aux injections de prompt	Comparable à Opus 4.6

Pour un développeur au travail, les chiffres de préférence comptent le plus. Un modèle à $3/$15 préféré à un modèle à $5/$25 sur la plupart des sessions de code. Ça change comment tu dépenses ton budget Claude quotidien.

La validation externe confirme les résultats internes. Le co-fondateur de Cursor l'a qualifié de "nette amélioration par rapport à Sonnet 4.5 sur tous les plans, y compris les tâches à long horizon et les problèmes plus difficiles." GitHub a rapporté "de forts taux de résolution et le type de cohérence dont les développeurs ont besoin" sur les correctifs de code complexes dans de grandes bases de code. Cognition a trouvé qu'il "a significativement comblé l'écart avec Opus sur la détection de bugs", leur permettant de faire tourner plus de reviewers en parallèle sans augmenter les coûts.

Utilisation informatique

C'est là que le plus grand saut se manifeste. Les scores OSWorld sur 16 mois de versions Sonnet ont grimpé régulièrement, et 4.6 est le plus grand pas unique sur ce graphique.

Les tableurs, les formulaires web multi-étapes, et l'intégration de documents en entreprise fonctionnent tous avec une plus grande précision. Sur les workflows de soumission et de premier avis de sinistre chez Pace, une entreprise d'insurtech, le modèle a atteint 94% de précision. C'est le meilleur chiffre qu'un modèle ait jamais affiché pour Pace jusqu'à présent.

Le contenu adversarial a aussi plus de mal à faire dérailler une session. La résistance aux injections de prompt sur Sonnet 4.6 est à peu près au niveau d'Opus 4.6, donc les sessions d'utilisation informatique sont plus difficiles à faire dévier.

Profil de sécurité

Le saut d'intelligence n'a pas coûté la sécurité. Les évaluations d'Anthropic décrivent Sonnet 4.6 comme "globalement chaleureux, honnête, prosocial, et parfois drôle" dans son caractère. Ils rapportent aussi "de très forts comportements de sécurité et aucun signe de problèmes majeurs autour des formes à hauts enjeux de désalignement."

La résistance aux injections de prompt est en hausse par rapport à Sonnet 4.5 et se situe maintenant au niveau du niveau Opus actuel. Pour les équipes qui déploient l'utilisation informatique ou qui dirigent le modèle vers des documents non fiables, c'est une vraie amélioration dans sa capacité à résister à la manipulation.

Nouvelles capacités de la plateforme

Quelques éléments de plateforme ont été livrés avec le modèle.

Claude dans Excel avec MCP. Le complément Excel parle maintenant MCP. Tu peux lire directement depuis des sources financières comme S&P Global, LSEG, Daloopa, PitchBook, Moody's, et FactSet. Les plans Pro, Max, Team, et Enterprise y ont accès.

Améliorations du niveau gratuit. La création de fichiers, les connecteurs, les compétences, et la compaction de contexte sont maintenant sur le plan Free. Des fonctionnalités qui étaient derrière Pro deviennent des bases.

Défaut sur Free et Pro. Sur claude.ai et Claude Cowork, Sonnet 4.6 remplace Sonnet 4.5 comme défaut pour les utilisateurs Free et Pro.

Accès étendu aux outils. La recherche web avec filtrage dynamique, l'exécution de code, la mémoire, les appels d'outils programmatiques, et la recherche d'outils sont tous en GA avec cette version.

Tarifs

Pas de changement de prix. Le tarif est unifié sur toute la fenêtre de 1M de contexte. Il n'y a pas de prime de contexte long. Une requête à 900K tokens est facturée au même taux par token qu'une requête à 9K :

Niveau	Coût
Tous les contextes	$3 entrée / $15 sortie par 1M tokens
Plan Pro	$20/mois
Plan Max	$100/mois

Tu es déjà sur Sonnet 4.5 avec ton utilisation et tes coûts en main ? Passer à la version supérieure est du gain pur au même tarif.

Comment utiliser Sonnet 4.6 dans Claude Code

Change ton modèle par défaut avec une seule commande :

claude config set model claude-sonnet-4-6

Pour des remplacements par session sans changer ton défaut :

claude --model claude-sonnet-4-6

Le modèle est en ligne sur toutes les plateformes. Ça couvre claude.ai (où c'est le défaut Free et Pro), Claude Cowork, l'API Messages, Claude Code, Amazon Bedrock, et Google Vertex AI. L'identifiant de modèle API est claude-sonnet-4-6.

Sonnet 4.6 vs Sonnet 4.5 : ce qui a changé

Fonctionnalité	Sonnet 4.5	Sonnet 4.6
Fenêtre de contexte	200K (standard), 1M (bêta)	1M (GA, tarif unifié)
Préférence en code	Référence	70% préféré à 4.5
vs Opus 4.5 (nov.)	En dessous du niveau Opus	59% préféré
Utilisation informatique	Bon	94% benchmark assurance (le plus haut)
OfficeQA	Non rapporté	Égale Opus 4.6
Q&A raisonnement lourd	Référence	+15pp (évaluation Box)
Suivi d'instructions	Bon	Surengineering significativement réduit
Injection de prompt	Référence	Comparable à Opus 4.6
Qualité du design	Bon	"Goût parfait du design" (Triple Whale)
Tarif standard	$3/$15 par 1M	$3/$15 par 1M (inchangé)

Les gains principaux sont la qualité du code, l'utilisation informatique, et le suivi d'instructions. Tout ce que Sonnet 4.5 faisait déjà bien, comme la vitesse, le coût, et le comportement agent, est repris avec un vrai pas d'intelligence en plus.

Le choix de modèle est simple. Mets Sonnet 4.6 par défaut pour l'itération rapide et pour les 90%+ du travail de code quotidien où la vitesse et le coût décident du compromis. Utilise Opus 4.6 pour le raisonnement le plus profond, les refactorisations de grandes bases de code, la coordination multi-agents, et le travail où la précision ne peut pas glisser. Opus 4.6 tient encore le premier rang sur Terminal-Bench 2.0 et Humanity's Last Exam.

Pages associées

All Claude Models pour la chronologie complète des modèles
Opus 4.6 pour l'option de premier niveau de la même génération
Sonnet 4.5 pour la version Sonnet précédente
Guide de sélection de modèle pour le changement stratégique de modèle
Optimisation d'utilisation pour gérer les coûts entre les modèles

Claude Sonnet 4.6

On this page