Claude Sonnet 4.6
Claude Sonnet 4.6 sort en février 2026 à $3/$15 avec 1M de contexte en GA. 70% de préférence développeur sur Sonnet 4.5, bat Opus 4.5 sur 59% des sessions de code.
Arrêtez de configurer. Commencez à construire.
Templates SaaS avec orchestration IA.
Claude Sonnet 4.6, c'est le modèle de milieu de gamme qui a commencé à battre le flagship de la génération précédente dans les tâches de code en tête-à-tête. Dans les tests internes de Claude Code, les développeurs l'ont préféré à Sonnet 4.5 environ 70% du temps. Face à Opus 4.5, le précédent modèle frontier de novembre 2025, les testeurs préféraient quand même 4.6 sur 59% des sessions. Un modèle Sonnet qui surpasse un modèle Opus en préférence développeur, au prix de $3 en entrée et $15 en sortie par million de tokens.
Le deuxième grand saut, c'est l'utilisation informatique. Et sur le travail documentaire en entreprise, Sonnet 4.6 arrive au même niveau que son homologue Opus. Même prix qu'avant.
Specs clés
| Spec | Détails |
|---|---|
| API ID | claude-sonnet-4-6 |
| Date de sortie | 17 février 2026 |
| Fenêtre de contexte | 1M tokens (GA depuis mars 2026) |
| Sortie max | 16 384 tokens |
| Tarif (entrée) | $3 par million de tokens |
| Tarif (sortie) | $15 par million de tokens |
| Statut | Actif, Sonnet recommandé actuel |
Ce qui a changé : les améliorations en code
Les longues sessions, c'est là où la différence se fait le plus entendre. Sonnet 4.6 lit le contexte avant de toucher au code, regroupe la logique partagée en un seul endroit au lieu de la dupliquer, et abandonne les refactorisations trop zélées qui rendaient les anciens modèles frustrants.
Meilleure compréhension du contexte. Avant de faire un changement, le modèle lit vraiment le code autour. Les conventions maison sont comprises. Les patterns redondants sont évités. Les modifications s'intègrent bien dans la base de code dans laquelle elles vont.
Moins de surengineering. Demande un petit correctif et tu obtiens un petit correctif. Les changements hallucinés et les fausses affirmations "c'est fait" chutent nettement par rapport aux modèles précédents. Tu verras bien moins de réponses "j'ai refactorisé tout le module pour toi" quand un patch d'une ligne était tout ce que tu voulais.
Plus fort sur les tâches complexes. La détection de bugs est assez bonne pour que Sonnet puisse remplacer Opus comme reviewer parallèle dans une équipe. Les refactorisations inter-fichiers, les chaînes de dépendances, et les correctifs difficiles multi-étapes arrivent plus fiablement sur les grandes bases de code.
Meilleur sens du design. La génération frontend est plus soignée dès le départ. Les mises en page sont plus propres, les animations moins maladroites, et moins de tours sont nécessaires pour arriver à quelque chose de livrable. Les premiers testeurs ont dit que le modèle avait "un goût parfait du design" pour construire des pages frontend et des rapports de données.
Planification à long horizon. Sur Vending-Bench Arena, une simulation stratégique, Sonnet 4.6 a battu Sonnet 4.5 en investissant tôt dans la capacité puis en pivotant vers le profit à la fin. Ce type de raisonnement ramifié et multi-étapes se retrouve directement dans le travail quotidien difficile.
Résultats des benchmarks
Des chiffres qui nécessitaient auparavant un modèle de classe Opus sortent maintenant de Sonnet :
| Métrique | Résultat |
|---|---|
| vs Sonnet 4.5 (Claude Code) | 70% de préférence développeur |
| vs Opus 4.5 (nov. 2025) | 59% de préférence développeur |
| Utilisation informatique (Pace insurance) | 94% de précision, meilleur modèle testé |
| OfficeQA (Databricks) | Égale Opus 4.6 |
| Q&A raisonnement lourd (Box) | +15 points de pourcentage sur Sonnet 4.5 |
| Résistance aux injections de prompt | Comparable à Opus 4.6 |
Pour un développeur au travail, les chiffres de préférence comptent le plus. Un modèle à $3/$15 préféré à un modèle à $5/$25 sur la plupart des sessions de code. Ça change comment tu dépenses ton budget Claude quotidien.
La validation externe confirme les résultats internes. Le co-fondateur de Cursor l'a qualifié de "nette amélioration par rapport à Sonnet 4.5 sur tous les plans, y compris les tâches à long horizon et les problèmes plus difficiles." GitHub a rapporté "de forts taux de résolution et le type de cohérence dont les développeurs ont besoin" sur les correctifs de code complexes dans de grandes bases de code. Cognition a trouvé qu'il "a significativement comblé l'écart avec Opus sur la détection de bugs", leur permettant de faire tourner plus de reviewers en parallèle sans augmenter les coûts.
Utilisation informatique
C'est là que le plus grand saut se manifeste. Les scores OSWorld sur 16 mois de versions Sonnet ont grimpé régulièrement, et 4.6 est le plus grand pas unique sur ce graphique.
Les tableurs, les formulaires web multi-étapes, et l'intégration de documents en entreprise fonctionnent tous avec une plus grande précision. Sur les workflows de soumission et de premier avis de sinistre chez Pace, une entreprise d'insurtech, le modèle a atteint 94% de précision. C'est le meilleur chiffre qu'un modèle ait jamais affiché pour Pace jusqu'à présent.
Le contenu adversarial a aussi plus de mal à faire dérailler une session. La résistance aux injections de prompt sur Sonnet 4.6 est à peu près au niveau d'Opus 4.6, donc les sessions d'utilisation informatique sont plus difficiles à faire dévier.
Profil de sécurité
Le saut d'intelligence n'a pas coûté la sécurité. Les évaluations d'Anthropic décrivent Sonnet 4.6 comme "globalement chaleureux, honnête, prosocial, et parfois drôle" dans son caractère. Ils rapportent aussi "de très forts comportements de sécurité et aucun signe de problèmes majeurs autour des formes à hauts enjeux de désalignement."
La résistance aux injections de prompt est en hausse par rapport à Sonnet 4.5 et se situe maintenant au niveau du niveau Opus actuel. Pour les équipes qui déploient l'utilisation informatique ou qui dirigent le modèle vers des documents non fiables, c'est une vraie amélioration dans sa capacité à résister à la manipulation.
Nouvelles capacités de la plateforme
Quelques éléments de plateforme ont été livrés avec le modèle.
Claude dans Excel avec MCP. Le complément Excel parle maintenant MCP. Tu peux lire directement depuis des sources financières comme S&P Global, LSEG, Daloopa, PitchBook, Moody's, et FactSet. Les plans Pro, Max, Team, et Enterprise y ont accès.
Améliorations du niveau gratuit. La création de fichiers, les connecteurs, les compétences, et la compaction de contexte sont maintenant sur le plan Free. Des fonctionnalités qui étaient derrière Pro deviennent des bases.
Défaut sur Free et Pro. Sur claude.ai et Claude Cowork, Sonnet 4.6 remplace Sonnet 4.5 comme défaut pour les utilisateurs Free et Pro.
Accès étendu aux outils. La recherche web avec filtrage dynamique, l'exécution de code, la mémoire, les appels d'outils programmatiques, et la recherche d'outils sont tous en GA avec cette version.
Tarifs
Pas de changement de prix. Le tarif est unifié sur toute la fenêtre de 1M de contexte. Il n'y a pas de prime de contexte long. Une requête à 900K tokens est facturée au même taux par token qu'une requête à 9K :
| Niveau | Coût |
|---|---|
| Tous les contextes | $3 entrée / $15 sortie par 1M tokens |
| Plan Pro | $20/mois |
| Plan Max | $100/mois |
Tu es déjà sur Sonnet 4.5 avec ton utilisation et tes coûts en main ? Passer à la version supérieure est du gain pur au même tarif.
Comment utiliser Sonnet 4.6 dans Claude Code
Change ton modèle par défaut avec une seule commande :
claude config set model claude-sonnet-4-6
Pour des remplacements par session sans changer ton défaut :
claude --model claude-sonnet-4-6
Le modèle est en ligne sur toutes les plateformes. Ça couvre claude.ai (où c'est le défaut Free et Pro), Claude Cowork, l'API Messages, Claude Code, Amazon Bedrock, et Google Vertex AI. L'identifiant de modèle API est claude-sonnet-4-6.
Sonnet 4.6 vs Sonnet 4.5 : ce qui a changé
| Fonctionnalité | Sonnet 4.5 | Sonnet 4.6 |
|---|---|---|
| Fenêtre de contexte | 200K (standard), 1M (bêta) | 1M (GA, tarif unifié) |
| Préférence en code | Référence | 70% préféré à 4.5 |
| vs Opus 4.5 (nov.) | En dessous du niveau Opus | 59% préféré |
| Utilisation informatique | Bon | 94% benchmark assurance (le plus haut) |
| OfficeQA | Non rapporté | Égale Opus 4.6 |
| Q&A raisonnement lourd | Référence | +15pp (évaluation Box) |
| Suivi d'instructions | Bon | Surengineering significativement réduit |
| Injection de prompt | Référence | Comparable à Opus 4.6 |
| Qualité du design | Bon | "Goût parfait du design" (Triple Whale) |
| Tarif standard | $3/$15 par 1M | $3/$15 par 1M (inchangé) |
Les gains principaux sont la qualité du code, l'utilisation informatique, et le suivi d'instructions. Tout ce que Sonnet 4.5 faisait déjà bien, comme la vitesse, le coût, et le comportement agent, est repris avec un vrai pas d'intelligence en plus.
Le choix de modèle est simple. Mets Sonnet 4.6 par défaut pour l'itération rapide et pour les 90%+ du travail de code quotidien où la vitesse et le coût décident du compromis. Utilise Opus 4.6 pour le raisonnement le plus profond, les refactorisations de grandes bases de code, la coordination multi-agents, et le travail où la précision ne peut pas glisser. Opus 4.6 tient encore le premier rang sur Terminal-Bench 2.0 et Humanity's Last Exam.
Pages associées
- All Claude Models pour la chronologie complète des modèles
- Opus 4.6 pour l'option de premier niveau de la même génération
- Sonnet 4.5 pour la version Sonnet précédente
- Guide de sélection de modèle pour le changement stratégique de modèle
- Optimisation d'utilisation pour gérer les coûts entre les modèles
Arrêtez de configurer. Commencez à construire.
Templates SaaS avec orchestration IA.