Claude Opus 4.5 dans Claude Code
Configure Claude Opus 4.5 comme modèle par défaut dans Claude Code en deux commandes. 76 % de tokens de sortie en moins que Sonnet 4.5, 50 % d'appels d'outils en moins, 5 $/25 $, même fenêtre 200K.
Arrêtez de configurer. Commencez à construire.
Templates SaaS avec orchestration IA.
Ta facture Claude Code, c'est surtout des tokens de sortie. Opus 4.5 la coupe de 67 % et écrit du code plus propre en même temps. Voilà comment l'activer et ce qui change une fois que c'est fait.
Gain rapide : définis Opus 4.5 comme modèle par défaut et ouvre une session :
claude config set model claude-opus-4-5-20251101
claudeTu fais maintenant tourner le modèle de code le plus efficace en tokens disponible.
Efficacité des tokens
Ce ne sont pas des arguments marketing. GitHub rapporte qu'Opus 4.5 "dépasse les benchmarks internes de codage tout en réduisant l'utilisation des tokens de moitié." Replit dit qu'il "bat Sonnet 4.5 et la concurrence sur nos benchmarks internes, en résolvant les mêmes problèmes avec moins de tokens."
Voilà ce que ça donne au quotidien :
| Métrique | Amélioration |
|---|---|
| Tokens de sortie vs Sonnet 4.5 | Réduction de 76 % |
| Appels d'outils par tâche | 50 % de moins |
| Tâches longue durée | Jusqu'à 65 % de réduction |
| Avec Tool Search activé | Réduction de 85 % |
Moins de tokens, ça veut dire des réponses plus rapides, un coût moins élevé, et plus de marge avant d'atteindre la limite de contexte.
Conçu pour la délégation aux sous-agents
Opus 4.5 écrit de meilleurs prompts pour les sous-agents que n'importe quel autre modèle Claude. Anthropic l'a entraîné pour la délégation exprès.
Ça paye quand tu fais tourner des agents en parallèle pour les tests, la génération de code ou la distribution des tâches. L'agent principal distribue le travail plus proprement :
# Example: Running parallel browser tests
claude "Run 4 parallel test agents against staging -
test login flow, checkout, search, and user settings"Le modèle gère la coordination. Chaque sous-agent reçoit des instructions claires et précises. Les résultats te reviennent sans le chaos des modèles précédents.
Le paramètre Effort
Un nouveau contrôle API pour échanger vitesse contre profondeur. Tu le règles par appel sans changer de modèle :
const response = await anthropic.messages.create({
model: "claude-opus-4-5-20251101",
max_tokens: 8192,
thinking: {
type: "enabled",
budget_tokens: 10000, // Low: 1024, Medium: 5000, High: 10000+
},
messages: [{ role: "user", content: prompt }],
});Effort faible pour les questions rapides. Effort élevé pour les gros refactors. Tu décides du budget de réflexion par appel.
Compaction automatique pour les longues sessions
Tu atteins 95 % de ta fenêtre de contexte de 200K ? Claude compacte automatiquement les messages précédents tout en conservant l'historique complet de ta conversation. Alex Albert appelle ça "un contexte effectivement infini."
Le contrôle manuel est là quand tu en as besoin :
/compact
Bonne pratique : compacte aux jalons logiques plutôt que d'attendre le déclenchement automatique. Tu gardes plus de détails dans les parties qui comptent.
Quand quelque chose se casse
Erreur : "model not found". Mets à jour ton installation Claude Code :
npm update -g @anthropic-ai/claude-code
Erreur : "rate limit exceeded". Opus 4.5 a des limites séparées de Sonnet. Vérifie ton niveau de plan ou ajoute un court délai entre les requêtes.
Erreur : "context too long". Lance /compact manuellement ou divise la tâche en morceaux plus petits. Voir l'optimisation mémoire pour des patterns plus avancés.
Ce que ça change pour ton workflow
Opus 4.5 n'est pas juste une montée de version. C'est une façon différente de travailler :
- Délègue plus. Confie une coordination complexe que tu ne ferais pas confiance aux modèles précédents.
- Fais tourner des sessions plus longues. L'efficacité des tokens signifie plus de travail avant que la compaction ne s'enclenche.
- Paye moins. Une baisse de coût de 67 % à qualité identique ou meilleure.
Le modèle obtient 80,9 % sur SWE-bench Verified (un nouveau record) et mène sur 7 des 8 langages de programmation. Ton code fonctionne du premier coup, pas au cinquième.
Pages associées
- Sélection de modèle pour savoir quand utiliser Opus plutôt que Sonnet
- Patterns de conception de sous-agents pour tirer le maximum de la délégation
- Patterns d'efficacité pour les workflows en production
Mise à jour : Claude Opus 4.6 est maintenant disponible avec un contexte de 1M de tokens et des équipes d'agents natives. Voir la chronologie complète des modèles pour tous les modèles Claude.
Arrêtez de configurer. Commencez à construire.
Templates SaaS avec orchestration IA.