Claude Opus 4.7

Claude Opus 4.7 est la première release Claude depuis un moment qui semble plus grande qu'une mise à jour ponctuelle. Le prix est inchangé. La fenêtre de contexte 1M est inchangée. Le plafond de sortie 128K est inchangé. Ce qui a changé, c'est la partie que les gens ressentent vraiment dans Claude Code : le modèle est meilleur sur le travail difficile, ambigu, longue durée qui nécessitait auparavant une supervision constante.

Ça se voit à trois endroits.

Il repère plus de ses propres erreurs avant d'agir.
Il reste cohérent plus longtemps dans les boucles d'agents multi-étapes.
Il performe mieux dans des domaines qui ne sont pas juste "écrire du code" : workflows cyber, revue de code, captures d'écran denses, docs d'entreprise, contrats, diagrammes, et autre travail source-heavy ambigu.

Si tu vis déjà dans Claude Code, la réponse courte est simple : Opus 4.7 est la nouvelle mise à niveau par défaut pour les sessions d'ingénierie à enjeux élevés. Si tu veux les conseils de workflow, lis le guide des meilleures pratiques Opus 4.7. Si tu veux des exemples concrets par domaine, lis la page des cas d'usage Opus 4.7.

Verdict rapide

Utilise Opus 4.7 quand le travail coûte cher à rater :

refactors complexes sur de nombreux fichiers
débogage avec des preuves incomplètes ou contradictoires
revue de code où les bugs subtils comptent
cyber-défense, recherche de vulnérabilités, ou audit de sécurité
travail document-heavy en juridique, finance, et opérations
tâches multimodales avec des captures d'écran denses, diagrammes, ou maquettes UI

Reste sur Sonnet pour les petites éditions quotidiennes où la vitesse et le coût comptent plus que la profondeur de raisonnement maximale.

Spécifications clés

Spec	Détails
API ID	`claude-opus-4-7`
Date de release	16 avril 2026
Fenêtre de contexte	1M tokens
Sortie max	128 000 tokens
Tarification	$5 entrée / $25 sortie par 1M tokens
Mode thinking	Adaptive thinking
Niveaux d'effort	`low`, `medium`, `high`, `xhigh`, `max`
Effort par défaut Claude Code	`xhigh`
Limite de connaissance	Janvier 2026
Statut	Opus phare actuel

Claude Opus 4.7 vs Opus 4.6

L'histoire de base n'est pas "un peu plus intelligent." C'est "plus fiable sur la tranche difficile du travail."

Domaine	Opus 4.6	Opus 4.7
CursorBench	58%	70%
Rakuten-SWE-Bench	Référence	3x plus de tâches de production résolues
XBOW visual-acuity	54,5%	98,5%
OfficeQA Pro	Référence	21% moins d'erreurs
BigLaw Bench	Plus bas	90,9% à l'effort `high`
Erreurs d'outils Notion Agent	Référence	environ un tiers
Support de résolution	1568px / 1,15MP	2576px / 3,75MP
Effort par défaut Claude Code	`high`	`xhigh`
Contrôle du thinking	adaptive, ancien chemin de migration	adaptive uniquement, thinking à budget fixe supprimé
Style d'utilisation des outils	plus friand d'outils	plus sélectif, raisonnement d'abord
Comportement des sous-agents	délègue plus librement	délègue plus sélectivement

La partie importante est comportementale, pas seulement numérique. Anthropic et les partenaires de lancement décrivent Opus 4.7 comme plus littéral sur les instructions, plus disposé à vérifier les hypothèses, meilleur pour pousser à travers les longues tâches, et moins susceptible de boucler ou d'échouer silencieusement à mi-chemin.

Ce qui s'est vraiment amélioré en pratique

1. L'auto-vérification apparaît plus souvent

L'un des signaux de lancement les plus clairs est qu'Opus 4.7 fait plus de vérifications avant de s'engager sur une réponse ou un changement de code.

La page de lancement d'Anthropic inclut Vercel décrivant un nouveau comportement : le modèle fait des preuves sur le code systèmes avant de commencer le travail. Hex dit qu'il est meilleur pour admettre quand les données manquent au lieu d'inventer une logique de repli plausible. Ça compte parce qu'une grande partie de la vraie douleur en ingénierie n'est pas un échec de syntaxe. C'est un raisonnement confiant-mais-faux sur un contexte incomplet.

Dans Claude Code, ça tend à ressembler à :

lire un fichier de plus avant d'éditer
vérifier un site d'appel avant de changer un type
confirmer une hypothèse sur la forme d'état ou le schéma
faire une pause pour valider un chemin de concurrence ou de migration

Cette étape supplémentaire est souvent la différence entre un premier passage propre et une boucle de 40 minutes.

2. Le travail agentique longue durée déraille moins

Devin a rapporté qu'Opus 4.7 travaille de façon cohérente pendant des heures et pousse à travers les tâches difficiles au lieu d'abandonner tôt. Notion a rapporté un gain de 14% sur les workflows complexes multi-étapes avec environ un tiers des erreurs d'outils d'Opus 4.6. Genspark a mis en avant la résistance aux boucles, la cohérence, et la récupération gracieuse comme les trois traits de production qui comptent le plus.

Ça fait d'Opus 4.7 un meilleur choix pour :

les refactors plus longs
les agents de coding asynchrones
les workflows CI et d'automatisation
les passes de revue à l'échelle d'un service
les investigations où le modèle doit lire, comparer, et réviser de façon répétée

3. Le coding difficile a bougé, pas seulement le coding facile

CursorBench passant de 58% à 70% compte parce que c'est plus proche des vraies prompts vagues et désordonnées que les développeurs donnent aux agents de coding. L'amélioration 3x de Rakuten sur les tâches SWE de production compte parce que ça suggère que le gain n'est pas limité aux exemples jouets ou aux problèmes favorables aux benchmarks.

CodeRabbit a rapporté plus de 10% de meilleur recall sur les charges de travail de revue tout en gardant la précision stable. Warp et Qodo ont tous deux mis en avant des classes de bugs plus difficiles que 4.7 repère ou résout maintenant. Factory a rapporté un lift de 10-15% dans le succès des tâches pour les Droids avec moins d'erreurs d'outils et un meilleur suivi.

Le pattern est cohérent : Opus 4.7 n'est pas juste "plus éloquent." Il franchit une classe d'ingénierie plus difficile.

4. Les entrées visuelles denses sont enfin de première classe

Le saut de résolution est l'un des changements les plus sous-estimés de la release. Passer de 1568px / 1,15MP à 2576px / 3,75MP n'est pas cosmétique. Ça change ce que tu peux faire confiance au modèle de lire sans rogner.

Ça aide particulièrement quand l'entrée est :

une capture d'écran de dashboard dense
une capture de terminal avec du petit texte
un diagramme technique
une maquette de design avec des étiquettes denses
un tableau de contrat scanné ou un extrait de document
une figure de chimie ou de sciences de la vie

Le saut d'acuité visuelle de XBOW de 54,5% à 98,5% est la preuve la plus nette que les pixels ajoutés se traduisent en utilité réelle.

5. Il est plus fort en dehors du coding pur

La release d'Anthropic a positionné Opus 4.7 comme plus fort sur le coding, les workflows d'entreprise, et les tâches agentiques longue durée. Les exemples des partenaires confirment :

Cybersécurité : XBOW dit que leur plus grand point de douleur visuel dans le pentesting autonome a effectivement disparu.
Juridique : Harvey rapporte 90,9% sur BigLaw Bench à l'effort high, avec un meilleur raisonnement sur les éditions ambiguës et les tableaux de revue.
Docs et raisonnement d'entreprise : Databricks a rapporté 21% moins d'erreurs sur OfficeQA Pro.
Finance et recherche : Les testeurs d'IA appliquée ont mis en avant une meilleure discipline de divulgation et de meilleures performances sur long contexte.
Sciences de la vie : Solve Intelligence a mis en avant des gains sur les structures chimiques et les diagrammes techniques.
Design et UI : Lovable dit que le goût de design est assez fort pour que le modèle fasse des choix qu'ils livreraient vraiment.

Ça fait d'Opus 4.7 un modèle plus large de "travail de connaissance à enjeux élevés", pas seulement un modèle de coding.

Résultats de benchmarks qui comptent

Le mur complet de benchmarks est utile pour le jour de lancement, mais seuls certains chiffres correspondent clairement à la valeur utilisateur.

Benchmark	Pourquoi ça compte
CursorBench : 70%	Plus proche des vraies prompts d'agents de coding que des évaluations de coding étroites
Rakuten-SWE-Bench : 3x plus résolus	Signale un mouvement sur les tâches d'ingénierie de production, pas seulement les repos jouets
XBOW visual-acuity : 98,5%	Prouve que la compréhension des images denses est matériellement meilleure
BigLaw Bench : 90,9%	Signal fort pour les cas d'usage de contrats et de revue juridique
OfficeQA Pro : 21% moins d'erreurs	Proxy utile pour les docs d'entreprise et le raisonnement documentaire
Notion Agent : +14%, moins d'erreurs d'outils	Bon indicateur pour la fiabilité des agents multi-étapes
CodeRabbit : recall +10%	Signal fort pour les workflows de revue et de recherche de bugs

Si tu choisis un modèle pour Claude Code, CursorBench, Rakuten, Notion, CodeRabbit, et XBOW sont les signaux les plus actionnables de cette release.

Là où Opus 4.7 atterrit le plus fort

Sessions d'ingénierie Claude Code

C'est l'évident. Opus 4.7 est meilleur quand la tâche est vague, multi-fichiers, ou coûteuse à refaire. Les migrations d'API, les refactors cross-cutting, les bugs de concurrence, les revues d'architecture, et les nettoyages à l'échelle de la codebase bénéficient tous du modèle étant plus littéral, plus patient, et plus orienté vérification.

Workflows de sécurité et de cyber-défense

Opus 4.7 compte en sécurité parce que la capacité de coding et la capacité cyber sont maintenant étroitement liées. Project Glasswing, annoncé le 7 avril 2026, concerne Mythos Preview, pas Opus 4.7. Mais Anthropic référence explicitement Glasswing dans le lancement Opus 4.7 du 16 avril 2026 pour expliquer pourquoi les nouvelles protections cyber comptent ici : Opus 4.7 est le premier modèle public où certaines de ces protections sont testées dans le monde réel.

Ça te donne deux conclusions :

le modèle est assez fort pour être utile pour du vrai travail de sécurité défensive
le modèle est assez fort pour qu'Anthropic contraigne activement les mauvais usages risqués

Si tu fais de la recherche légitime sur les vulnérabilités, des tests de pénétration, ou du red-teaming, Anthropic dirige les professionnels vers le Cyber Verification Program.

Opérations juridiques, financières et d'entreprise

Opus 4.7 est un bon choix quand le travail est : comparer, vérifier, résumer, et éviter d'halluciner les parties manquantes. Les contrats, les pistes d'audit, les tableaux de revue, les mémos financiers, les docs de politique, et les documents opérationnels internes bénéficient tous de la meilleure calibration et du raisonnement documentaire du modèle.

Travail multimodal de produit, design et R&D

La meilleure lecture des captures d'écran et la gestion des diagrammes le rendent plus utile pour la critique de design, le QA produit, les workflows des sciences de la vie, les brevets, et la documentation technique. Si le matériel source nécessitait auparavant un zoom ou un rogner manuel, Opus 4.7 est bien plus utilisable.

Pour des exemples de domaines plus concrets et des idées de prompts, voir les cas d'usage Claude Opus 4.7.

Cyber, risque et sécurité : pourquoi cette release est différente

La communication de lancement d'Anthropic autour d'Opus 4.7 est inhabituelle parce qu'elle ne célèbre pas juste la capacité. Elle place la release dans une histoire de risque cyber active.

Anthropic dit qu'Opus 4.7 est moins capable que Mythos Preview, mais toujours assez fort pour qu'ils aient expérimenté pendant l'entraînement en réduisant différentiellement les capacités cyber par rapport à Mythos. Ils ont aussi livré des protections automatisées qui détectent et bloquent les demandes indiquant une utilisation cybersécurité interdite ou à haut risque.

Ça compte pour quiconque écrit sur le modèle parce que ça change l'angle :

Opus 4.7 n'est pas juste un copilote plus rapide.
Il est dans la catégorie où le bénéfice cyber et le risque cyber bougent maintenant ensemble.
Les workflows défensifs sont un domaine de force légitime.
Les workflows offensifs non sécurisés ou non autorisés sont une préoccupation de déploiement explicite.

En termes pratiques, ça signifie que tu devrais positionner Opus 4.7 comme fort pour :

la revue de code sécurisée
les passes d'audit défensives
la modélisation des menaces
le triage des vulnérabilités
le support pentest dans les programmes approuvés
la documentation de sécurité et la planification de remédiation

Pas comme un moteur générique "fais n'importe quoi en cyber."

Vision : la mise à niveau de résolution 3x

Opus 4.7 est la première release Claude où le pipeline d'image mérite sa propre décision d'achat.

Le nouveau plafond de résolution signifie :

moins de rognage avant d'envoyer des captures d'écran
meilleure fiabilité sur le petit texte et les UIs denses
interprétation plus forte des diagrammes techniques
mappage plus propre des coordonnées renvoyées aux vrais pixels

Le compromis est le coût en tokens. Anthropic note qu'une image en pleine résolution peut consommer environ 4 784 tokens au lieu de la fourchette d'environ 1 600 tokens à laquelle les gens étaient habitués. Pour les workflows lourds en images, le sous-échantillonnage fait maintenant partie du contrôle des coûts.

Meilleures pratiques pour Opus 4.7 dans Claude Code

Les propres conseils d'Anthropic pour Opus 4.7 dans Claude Code sont plus comportementaux que techniques. Le thème est : mieux déléguer, regrouper le contexte plus tôt, et réduire les allers-retours inutiles.

Les habitudes à fort signal sont :

mettre la vraie tâche dans le premier tour : intention, contraintes, chemins de fichiers, critères d'acceptation
réduire les tours utilisateur autant que possible, parce que les allers-retours interactifs ajoutent une surcharge de raisonnement
garder xhigh comme défaut pour le vrai travail de coding
descendre à high quand tu dois contrôler les dépenses sur de nombreuses sessions parallèles
réserver max pour le travail très difficile et les tests de plafond de type éval
dire explicitement au modèle quand utiliser des outils et quand se ramifier vers des sous-agents
utiliser le mode auto quand la tâche est bien délimitée et que tu fais confiance à la direction générale
lancer la nouvelle skill /fewer-permission-prompts après quelques sessions pour transformer les prompts sûrs répétés en politique d'allowlist
utiliser des récapitulatifs quand tu reviens à une session longue durée pour récupérer l'état rapidement sans relire toute la transcription
utiliser la vue focus quand tu fais confiance au modèle et ne veux que le résultat final au lieu de chaque étape intermédiaire
régler /effort délibérément au lieu de traiter le défaut comme toujours correct
démarrer une session fraîche quand la tâche change, au lieu de traîner du contexte périmé

Ces quatre derniers points sont exactement le type de "petit changement de workflow, grand saut de qualité" que Boris Cherny a commencé à souligner dans son fil X du jour de lancement d'Opus 4.7. Le pattern sous-jacent est cohérent avec les docs officiels aussi : moins d'interruptions, récupération de session plus propre, moins de bruit de transcription, et contrôle d'effort plus délibéré comptent tous plus une fois que le modèle est capable de runs autonomes plus longs.

La version complète du workflow est dans les meilleures pratiques Claude Opus 4.7.

Notes de migration depuis Opus 4.6

Si tu déplaces des charges de travail API de 4.6 à 4.7, ne fais pas juste un swap du nom du modèle et ship.

Le adaptive thinking remplace le fixed-budget thinking

L'ancien flux thinking: { type: "enabled", budget_tokens: N } est parti pour Opus 4.7. Utilise le adaptive thinking et les niveaux d'effort à la place.

Les paramètres d'échantillonnage non-défaut sont partis

Si ton code définit encore temperature, top_p, ou top_k à des valeurs non-défaut, Opus 4.7 retourne un 400. Supprime ces paramètres et façonne le comportement par le prompting et l'effort.

L'affichage du thinking a changé

Les blocs de thinking sont vides par défaut sauf si tu optes explicitement pour l'affichage résumé. Si ton UI dépendait du texte de thinking visible, tu dois le mettre à jour.

Le tokenizer a changé

Anthropic dit que la même entrée peut mapper à environ 1,0x à 1,35x le nombre de tokens précédent selon le contenu. Réétablis les estimations de coût et de tokens avant de supposer que les anciens budgets s'appliquent encore.

Les images haute résolution coûtent plus cher

Si tu envoyais des captures d'écran de façon désinvolte, 4.7 rend la qualité d'image bien meilleure et le coût en tokens d'image matériellement plus élevé. Traite le sous-échantillonnage comme un levier conscient.

Les budgets de tâches valent la peine d'être testés

Anthropic a introduit les budgets de tâches comme beta publique pour que les modèles puissent s'auto-rythmer sur un run agentique complet. Si tu fais des boucles plus longues, teste-les maintenant plutôt d'attendre qu'une session incontrôlée te pique.

Tarification et coût

Opus 4.7 a gardé le même prix affiché qu'Opus 4.6 :

Niveau	Coût
Entrée	$5 par 1M tokens
Sortie	$25 par 1M tokens

Ça ne veut pas dire que le coût est identique en pratique.

Ta vraie facture est façonnée par :

le nouveau tokenizer
plus de dépenses de raisonnement aux niveaux d'effort plus élevés
images en pleine résolution plus chères
si tu lances des sessions interactives multi-tours ou des tâches déléguées en une seule fois

La lecture optimiste vient des partenaires de lancement comme Hex et Replit : une meilleure qualité à un effort inférieur peut compenser une partie de l'augmentation brute de tokens. Le bon mouvement n'est pas de supposer. Mesure sur des charges de travail réelles.

Devrais-tu passer à Claude Opus 4.7 ?

Oui, si tes points de douleur sont :

des agents qui s'arrêtent à mi-chemin
des modèles qui semblent plausibles mais supposent trop
du travail difficile de revue de code et de débogage
des entrées visuelles ou documentaires denses
des workflows multi-étapes avec des outils

Peut-être pas immédiatement, ou pas comme défaut, si ta charge de travail est surtout :

des petits cycles d'édition
de l'automatisation en masse bon marché
de la génération de contenu à faible risque
des questions-réponses rapides où Sonnet atterrit déjà

Pour la plupart des utilisateurs sérieux de Claude Code, la bonne stratégie est simple : garde Sonnet comme option quotidienne rapide, et utilise Opus 4.7 comme phare pour le travail sensible à l'intelligence.

Questions fréquentes

Claude Opus 4.7 vaut-il mieux qu'Opus 4.6 ?

Pour l'ingénierie difficile, la revue, le travail document-heavy, et les tâches agentiques longue durée, oui. Les gains les plus importants ne sont pas les chiffres bruts de benchmarks. Ce sont la meilleure calibration, l'auto-vérification plus forte, le taux d'erreurs d'outils plus bas, et le meilleur comportement sur les tâches ambiguës.

Quel est le meilleur réglage d'effort Claude Code pour Opus 4.7 ?

xhigh est le défaut dans Claude Code et le bon point de départ pour la plupart des sessions de coding sérieuses. Utilise high quand tu as besoin d'un meilleur contrôle des coûts sur de nombreuses sessions. Utilise max délibérément pour le travail le plus difficile, pas comme défaut systématique.

Claude Opus 4.7 est-il meilleur pour la cybersécurité ?

Il est meilleur pour les workflows de sécurité défensive légitimes, la revue de code, le triage des vulnérabilités, et l'analyse cyber-adjacente. Anthropic a aussi livré des protections cyber explicites avec le modèle, ce qui fait partie de pourquoi la release est importante.

Opus 4.7 coûte-t-il plus qu'Opus 4.6 ?

Le prix affiché est inchangé, mais le coût pratique peut augmenter à cause du nouveau tokenizer, des dépenses de raisonnement plus élevées à un effort supérieur, et des entrées d'images plus chères. Mesure par rapport à tes charges de travail réelles.