Claude Opus 4.5 dans Claude Code

Ta facture Claude Code, c'est surtout des tokens de sortie. Opus 4.5 la coupe de 67 % et écrit du code plus propre en même temps. Voilà comment l'activer et ce qui change une fois que c'est fait.

Gain rapide : définis Opus 4.5 comme modèle par défaut et ouvre une session :

claude config set model claude-opus-4-5-20251101
claude

Tu fais maintenant tourner le modèle de code le plus efficace en tokens disponible.

Efficacité des tokens

Ce ne sont pas des arguments marketing. GitHub rapporte qu'Opus 4.5 "dépasse les benchmarks internes de codage tout en réduisant l'utilisation des tokens de moitié." Replit dit qu'il "bat Sonnet 4.5 et la concurrence sur nos benchmarks internes, en résolvant les mêmes problèmes avec moins de tokens."

Voilà ce que ça donne au quotidien :

Métrique	Amélioration
Tokens de sortie vs Sonnet 4.5	Réduction de 76 %
Appels d'outils par tâche	50 % de moins
Tâches longue durée	Jusqu'à 65 % de réduction
Avec Tool Search activé	Réduction de 85 %

Moins de tokens, ça veut dire des réponses plus rapides, un coût moins élevé, et plus de marge avant d'atteindre la limite de contexte.

Conçu pour la délégation aux sous-agents

Opus 4.5 écrit de meilleurs prompts pour les sous-agents que n'importe quel autre modèle Claude. Anthropic l'a entraîné pour la délégation exprès.

Ça paye quand tu fais tourner des agents en parallèle pour les tests, la génération de code ou la distribution des tâches. L'agent principal distribue le travail plus proprement :

# Example: Running parallel browser tests
claude "Run 4 parallel test agents against staging -
test login flow, checkout, search, and user settings"

Le modèle gère la coordination. Chaque sous-agent reçoit des instructions claires et précises. Les résultats te reviennent sans le chaos des modèles précédents.

Le paramètre Effort

Un nouveau contrôle API pour échanger vitesse contre profondeur. Tu le règles par appel sans changer de modèle :

const response = await anthropic.messages.create({
  model: "claude-opus-4-5-20251101",
  max_tokens: 8192,
  thinking: {
    type: "enabled",
    budget_tokens: 10000, // Low: 1024, Medium: 5000, High: 10000+
  },
  messages: [{ role: "user", content: prompt }],
});

Effort faible pour les questions rapides. Effort élevé pour les gros refactors. Tu décides du budget de réflexion par appel.

Compaction automatique pour les longues sessions

Tu atteins 95 % de ta fenêtre de contexte de 200K ? Claude compacte automatiquement les messages précédents tout en conservant l'historique complet de ta conversation. Alex Albert appelle ça "un contexte effectivement infini."

Le contrôle manuel est là quand tu en as besoin :

/compact

Bonne pratique : compacte aux jalons logiques plutôt que d'attendre le déclenchement automatique. Tu gardes plus de détails dans les parties qui comptent.

Quand quelque chose se casse

Erreur : "model not found". Mets à jour ton installation Claude Code :

npm update -g @anthropic-ai/claude-code

Erreur : "rate limit exceeded". Opus 4.5 a des limites séparées de Sonnet. Vérifie ton niveau de plan ou ajoute un court délai entre les requêtes.

Erreur : "context too long". Lance /compact manuellement ou divise la tâche en morceaux plus petits. Voir l'optimisation mémoire pour des patterns plus avancés.

Ce que ça change pour ton workflow

Opus 4.5 n'est pas juste une montée de version. C'est une façon différente de travailler :

Délègue plus. Confie une coordination complexe que tu ne ferais pas confiance aux modèles précédents.
Fais tourner des sessions plus longues. L'efficacité des tokens signifie plus de travail avant que la compaction ne s'enclenche.
Paye moins. Une baisse de coût de 67 % à qualité identique ou meilleure.

Le modèle obtient 80,9 % sur SWE-bench Verified (un nouveau record) et mène sur 7 des 8 langages de programmation. Ton code fonctionne du premier coup, pas au cinquième.

Pages associées

Sélection de modèle pour savoir quand utiliser Opus plutôt que Sonnet
Patterns de conception de sous-agents pour tirer le maximum de la délégation
Patterns d'efficacité pour les workflows en production

Mise à jour : Claude Opus 4.6 est maintenant disponible avec un contexte de 1M de tokens et des équipes d'agents natives. Voir la chronologie complète des modèles pour tous les modèles Claude.