Build This Now
Build This Now
Modèles Claude CodeClaude Opus 4.5 dans Claude CodeClaude Opus 4.7Cas d'usage de Claude Opus 4.7Claude Opus 4.6Claude Sonnet 4.6Claude Opus 4.5Claude Sonnet 4.5Claude Haiku 4.5Claude Opus 4.1Claude 4Claude 3.7 SonnetClaude 3.5 Sonnet v2 et Claude 3.5 HaikuClaude 3.5 SonnetClaude 3Tous les modèles Claude
speedy_devvkoen_salo
Blog/Model Picker/Claude 3.7 Sonnet

Claude 3.7 Sonnet

Claude 3.7 Sonnet est sorti en février 2025 avec le raisonnement hybride et la réflexion étendue. 64K tokens en sortie, contrôle du budget de réflexion, gains en codage sur SWE-bench à $3/$15.

Arrêtez de configurer. Commencez à construire.

Templates SaaS avec orchestration IA.

Published Feb 21, 2026Model Picker hub

Claude 3.7 Sonnet est le modèle qui a appris à Claude à réfléchir avant de parler. Sorti le 25 février 2025, il a introduit le raisonnement hybride : un mode où Claude peut travailler un problème en interne, étape par étape, puis livrer une réponse plus précise. C'était le dernier modèle Claude 3.x, et il a posé les bases de tout ce qui est arrivé avec Claude 4.

Spécifications clés

SpecDétails
API IDclaude-3-7-sonnet-20250225
Fenêtre de contexte200K tokens
Tarif en entrée$3 / 1M tokens
Tarif en sortie$15 / 1M tokens
Tarif des tokens de réflexionInclus dans le tarif de sortie
Tokens de sortie max64 000 (avec réflexion étendue)
Date de sortie25 février 2025

La réflexion étendue

La fonctionnalité clé. Quand tu l'actives, Claude lance une boucle de raisonnement interne avant d'écrire le moindre token en sortie. Le modèle utilise un budget de réflexion pour travailler le problème, puis livre la réponse. Pour les preuves mathématiques, la logique de code multi-étapes, le travail scientifique et les tâches de planification, les résultats étaient bien meilleurs.

Les utilisateurs de l'API avaient un contrôle fin du budget. Tu le règles bas pour les questions rapides. Tu le règles haut pour les problèmes difficiles. Les tokens de réflexion comptaient dans le tarif de sortie, mais sur les tâches difficiles, le gain de qualité valait le coût.

Le raisonnement hybride

Une seule conversation, deux modes. Réponses rapides pour les questions simples. Raisonnement lent, étape par étape, pour les problèmes difficiles. Tu n'as pas à choisir entre un "modèle de réflexion" et un "modèle rapide". Le même modèle gère les deux et bascule selon la tâche.

Codage agentique de pointe

Claude 3.7 Sonnet a établi de nouveaux records sur SWE-bench Verified, le benchmark qui teste de vraies issues GitHub (pas des problèmes synthétiques). Il pouvait lire un rapport de bug, parcourir la codebase, trouver la cause racine et livrer un correctif fonctionnel plus fiablement que n'importe quel Claude avant lui.

Suivi d'instructions et multimodal

En s'appuyant sur les gains de Claude 3.5 Sonnet v2, Claude 3.7 Sonnet est devenu meilleur pour suivre des instructions longues avec plusieurs contraintes. Les images, graphiques et entrées multimédia revenaient aussi avec une plus grande précision.

Comment la réflexion étendue fonctionnait en pratique

Le principe était simple :

  1. Tu envoies un prompt complexe (revue de code, preuve mathématique, décision architecturale)
  2. Claude utilise son budget de réflexion pour raisonner en interne
  3. La réponse revient avec une plus grande précision et moins d'erreurs logiques

Les plus grandes victoires se trouvaient en maths, en science et dans les changements de code multi-fichiers. Les tâches qui nécessitaient avant plusieurs allers-retours revenaient souvent justes du premier coup.

Pour aller plus loin sur comment en tirer le maximum, consulte le guide des techniques de réflexion approfondie.

Tarifs et taille de sortie

Toujours $3/$15 par million de tokens. Toujours 200K de fenêtre de contexte. Mais un raisonnement, un codage et un suivi d'instructions nettement meilleurs. La limite de tokens de sortie max est passée à 64 000 avec la réflexion étendue activée (contre 8 192 avant), ce qui le rendait utilisable pour générer du code long, de la documentation ou des analyses en une seule réponse.

La différence la plus importante était qualitative : Claude 3.7 Sonnet faisait moins d'erreurs de raisonnement sur les tâches difficiles. La réflexion étendue lui donnait un moyen de "montrer son travail" en interne, en attrapant les erreurs avant qu'elles n'arrivent en sortie.

Statut

ModèleStatut
Claude 3.7 SonnetRemplacé par la génération Claude 4

Claude 3.7 Sonnet était le pont entre 3.x et 4.x. Le raisonnement hybride et les idées de réflexion étendue qu'il a pionnés sont devenus standard dans Claude 4 et tous les modèles qui ont suivi.

Pages associées

  • Tous les modèles Claude pour l'index complet des modèles
  • Claude 3.5 Sonnet v2, le prédécesseur d'octobre 2024
  • Claude 4, la génération suivante
  • Techniques de réflexion approfondie pour tirer le maximum de la réflexion étendue
  • Stratégies de sélection de modèle pour choisir entre les modèles Claude

More in Model Picker

  • Tous les modèles Claude
    Tous les modèles Claude sur une seule page : Claude 3, 3.5, 3.7, 4, Opus 4.1 à 4.6, Sonnet 4.5 et 4.6, Haiku 4.5. Specs, tarifs, benchmarks, et quand utiliser chacun.
  • Claude 3.5 Sonnet v2 et Claude 3.5 Haiku
    Claude 3.5 Sonnet v2 et 3.5 Haiku ont été lancés en octobre 2024 avec Computer Use en bêta, contrôle du curseur, codage et utilisation d'outils améliorés, et Haiku moins cher à $0.80/$4.
  • Claude 3.5 Sonnet
    Claude 3.5 Sonnet lancé en juin 2024 à $3/$15, surpassant Claude 3 Opus sur MMLU, GPQA, HumanEval au cinquième du coût. Specs, benchmarks et gains en codage.
  • Claude 3
    Claude 3 lancé en mars 2024 avec les niveaux Opus, Sonnet, Haiku, entrée visuelle, fenêtres de contexte de 200K. Specs, scores de benchmark, tarifs et le modèle à trois niveaux.
  • Claude 4
    Claude 4 lancé en mai 2025 avec Sonnet 4 et Opus 4, rendant Claude Code grand public. 200K contexte, 16K sortie, fiabilité agentique, extended thinking intégré.
  • Claude Haiku 4.5
    Claude Haiku 4.5 est sorti en octobre 2025 comme modèle budget pour le changement automatique de modèle dans Claude Code. Contexte 200K, latence sous 2s, traite le travail de routine à moindre coût.

Arrêtez de configurer. Commencez à construire.

Templates SaaS avec orchestration IA.

On this page

Spécifications clés
La réflexion étendue
Le raisonnement hybride
Codage agentique de pointe
Suivi d'instructions et multimodal
Comment la réflexion étendue fonctionnait en pratique
Tarifs et taille de sortie
Statut
Pages associées

Arrêtez de configurer. Commencez à construire.

Templates SaaS avec orchestration IA.