Techniques de réflexion approfondie
Des phrases déclencheurs comme think harder, ultrathink et think step by step poussent Claude Code en raisonnement étendu et en plus de calcul au moment du test, même modèle.
Arrêtez de configurer. Commencez à construire.
Templates SaaS avec orchestration IA.
Problème : Travail difficile, réponses superficielles. Tu voulais la cause racine. Tu as eu un patch de surface.
Gain rapide : Mets une phrase déclencheur sur ton prochain prompt Claude Code :
claude "think harder about this: Analyze this codebase and suggest architectural improvements"think harder, ultrathink, et think step by step disent à Claude de brûler plus de calcul au moment du test avant de répondre.
C'est quoi la réflexion approfondie ?
La réflexion approfondie, c'est ce qu'une phrase déclencheur active. Mets think harder, ultrathink, ou think step by step dans le prompt, et Claude dépense plus de calcul au moment du test sur le problème avant que la réponse arrive.
Ce ne sont pas des commandes CLI. Ce sont des signaux en anglais ordinaire qui activent le raisonnement étendu. Les prompts normaux reviennent vite. Les prompts avec phrase déclencheur reviennent réfléchis.
La pile de performance
Niveau 1 : Réflexion améliorée
Commence avec une phrase déclencheur pour n'importe quelle tâche complexe :
claude "think step by step: Optimize this React component for performance"Le raisonnement étendu se déclenche sans changer de modèle. Les trois phrases sont interchangeables.
Niveau 2 : Mode plan + réflexion approfondie
Combine une phrase de réflexion avec la planification pour une analyse structurée :
claude "think harder + plan mode: Create a migration strategy from JavaScript to TypeScript"Tu obtiens un raisonnement étendu ET un plan structuré.
Niveau 3 : Le moteur de révision
Utilise plusieurs tours de critique pour pousser la performance plus loin :
claude "ultrathink + plan mode: Create deployment strategy. Then critique your plan for edge cases and improvements."Chaque tour affine la réponse. Phrase déclencheur plus auto-critique tire le maximum du calcul au moment du test.
Applications concrètes
Débogage de problèmes complexes
Faible : "Pourquoi ça ne marche pas ?"
Fort : "think harder: Analyze this error stack trace and provide root cause analysis with multiple potential solutions."
Décisions d'architecture
Faible : "Quelle est la meilleure base de données pour ça ?"
Fort : "think step by step + plan mode: Evaluate database options for a real-time chat application with 100K users."
Revues de code
Faible : "Revois ce code"
Fort : "ultrathink: Perform comprehensive code review focusing on performance, security, and maintainability."
Configuration persistante de la réflexion
Si la réflexion approfondie tourne la plupart de tes journées, active-la par défaut plutôt que de préfixer chaque prompt.
Raisonnement étendu permanent
Ajoute alwaysThinkingEnabled à ton settings.json pour activer le raisonnement étendu pour chaque réponse :
// ~/.claude/settings.json
{
"alwaysThinkingEnabled": true
}Le raisonnement étendu tourne alors sur chaque prompt, sans think harder. C'est un bon choix quand la plupart des sessions exigent cette profondeur par défaut.
Contrôler le budget de réflexion
La variable d'environnement MAX_THINKING_TOKENS contrôle combien de tokens Claude peut dépenser sur son processus de raisonnement interne :
# Set a custom thinking budget (default is 31,999)
export MAX_THINKING_TOKENS=31999
# Disable extended thinking entirely
export MAX_THINKING_TOKENS=0Monte le chiffre et Claude a plus de place pour raisonner, mais la latence et les tokens augmentent avec. Baisse-le et le raisonnement reste concis. 0 désactive le raisonnement étendu, pratique quand la vitesse prime sur la profondeur.
Mise en cache de prompt et raisonnement étendu
Le raisonnement étendu entre en conflit avec la mise en cache de prompt. Les tokens de réflexion voyagent avec la réponse et ne sont pas mis en cache pour les tours suivants. Pour du travail répétitif, genre le même refactor sur de nombreux fichiers, le débit est souvent meilleur avec le raisonnement étendu désactivé et un prompt précis qui fait le boulot.
Compromis coût vs performance
Avant de passer à un modèle plus cher comme Claude Opus, tire plus de celui que tu utilises déjà :
- Phrases de réflexion.
think harder,ultrathink, outhink step by stepcomblent la plupart du fossé d'intelligence - Mode plan. Ajoute de la structure au raisonnement étendu
- Cycles de révision. Plus de critiques, réponses plus précises
- Sous-agents. Des angles frais sur le même problème difficile
Cette combinaison livre environ 80 % de la qualité d'Opus à 20 % du coût. Le calcul au moment du test rapporte plus par dollar que le changement de modèle.
Patterns courants de réflexion approfondie
L'approche systématique
claude "think step by step + plan mode:
1. Analyze the current system
2. Identify bottlenecks
3. Propose solutions
4. Create implementation plan
5. Critique the plan for missing elements"L'analyse multi-perspectives
claude "think harder: Analyze this API design from the perspectives of:
- Performance engineer
- Security auditor
- Frontend developer
- DevOps engineer"Le raffinement itératif
claude "ultrathink + plan mode: Design a caching strategy.
Then critique it for edge cases and suggest improvements."Quand la réflexion approfondie ne suffit pas
Quand les phrases déclencheurs, la planification et les tours de révision ne suffisent toujours pas :
- Amène des sous-agents pour des angles de spécialistes différents
- Divise le problème en tâches plus petites et plus précises
- Passe à Claude Opus pour le travail vraiment complexe
- Intègre des extensions MCP adaptées au domaine
Indicateurs de succès
Les phrases déclencheurs fonctionnent quand Claude :
- Te donne plus d'une solution
- Repère des cas limites que tu n'avais pas vus
- Te détaille les compromis qu'il a pesés
- Esquisse comment livrer chaque option
- Signale des améliorations qui valent d'être faites
Actions suivantes
Immédiat : Mets think harder: sur ton prochain prompt difficile et compare la réponse.
Avancé : Apprends les stratégies du mode plan qui façonnent le raisonnement étendu.
Optimisation : Regarde la sélection de modèle pour équilibrer coût et profondeur.
Mise à l'échelle : Monte des agents personnalisés pour des tâches de réflexion spécialisées.
Dépannage : Lis le guide d'optimisation des performances si la réflexion approfondie te semble lente.
Sans phrases déclencheurs, Claude te donne la première réponse qui fonctionne. Avec elles, il te donne la meilleure qu'il peut construire. Les phrases ne coûtent rien à ajouter.
Arrêtez de configurer. Commencez à construire.
Templates SaaS avec orchestration IA.
Tarification et utilisation des tokens Claude Code
Réduis les coûts Claude Code de 40 à 70 % avec le suivi ccusage, la commande /model, /compact et /clear, le mode plan, et le niveau de forfait adapté à ton usage.
Optimisation de la vitesse
Le choix du modèle, la taille du contexte et la spécificité de l'invite sont les trois leviers qui décident de la rapidité des réponses de Claude Code. /model haiku, /compact, et /clear covered.