Build This Now
Build This Now
Qu'est-ce que le code Claude ?Installer Claude CodeL'installateur natif de Claude CodeTon premier projet Claude Code
Techniques de réflexion approfondieOptimisation de la vitesseLe mode rapide de Claude CodeModèles d'efficacité
speedy_devvkoen_salo
Blog/Handbook/Performance/Deep Thinking Techniques

Techniques de réflexion approfondie

Des phrases déclencheurs comme think harder, ultrathink et think step by step poussent Claude Code en raisonnement étendu et en plus de calcul au moment du test, même modèle.

Arrêtez de configurer. Commencez à construire.

Templates SaaS avec orchestration IA.

Published Mar 29, 2026Handbook hubPerformance index

Problème : Travail difficile, réponses superficielles. Tu voulais la cause racine. Tu as eu un patch de surface.

Gain rapide : Mets une phrase déclencheur sur ton prochain prompt Claude Code :

claude "think harder about this: Analyze this codebase and suggest architectural improvements"

think harder, ultrathink, et think step by step disent à Claude de brûler plus de calcul au moment du test avant de répondre.

C'est quoi la réflexion approfondie ?

La réflexion approfondie, c'est ce qu'une phrase déclencheur active. Mets think harder, ultrathink, ou think step by step dans le prompt, et Claude dépense plus de calcul au moment du test sur le problème avant que la réponse arrive.

Ce ne sont pas des commandes CLI. Ce sont des signaux en anglais ordinaire qui activent le raisonnement étendu. Les prompts normaux reviennent vite. Les prompts avec phrase déclencheur reviennent réfléchis.

La pile de performance

Niveau 1 : Réflexion améliorée

Commence avec une phrase déclencheur pour n'importe quelle tâche complexe :

claude "think step by step: Optimize this React component for performance"

Le raisonnement étendu se déclenche sans changer de modèle. Les trois phrases sont interchangeables.

Niveau 2 : Mode plan + réflexion approfondie

Combine une phrase de réflexion avec la planification pour une analyse structurée :

claude "think harder + plan mode: Create a migration strategy from JavaScript to TypeScript"

Tu obtiens un raisonnement étendu ET un plan structuré.

Niveau 3 : Le moteur de révision

Utilise plusieurs tours de critique pour pousser la performance plus loin :

claude "ultrathink + plan mode: Create deployment strategy. Then critique your plan for edge cases and improvements."

Chaque tour affine la réponse. Phrase déclencheur plus auto-critique tire le maximum du calcul au moment du test.

Applications concrètes

Débogage de problèmes complexes

Faible : "Pourquoi ça ne marche pas ?"

Fort : "think harder: Analyze this error stack trace and provide root cause analysis with multiple potential solutions."

Décisions d'architecture

Faible : "Quelle est la meilleure base de données pour ça ?"

Fort : "think step by step + plan mode: Evaluate database options for a real-time chat application with 100K users."

Revues de code

Faible : "Revois ce code"

Fort : "ultrathink: Perform comprehensive code review focusing on performance, security, and maintainability."

Configuration persistante de la réflexion

Si la réflexion approfondie tourne la plupart de tes journées, active-la par défaut plutôt que de préfixer chaque prompt.

Raisonnement étendu permanent

Ajoute alwaysThinkingEnabled à ton settings.json pour activer le raisonnement étendu pour chaque réponse :

// ~/.claude/settings.json
{
  "alwaysThinkingEnabled": true
}

Le raisonnement étendu tourne alors sur chaque prompt, sans think harder. C'est un bon choix quand la plupart des sessions exigent cette profondeur par défaut.

Contrôler le budget de réflexion

La variable d'environnement MAX_THINKING_TOKENS contrôle combien de tokens Claude peut dépenser sur son processus de raisonnement interne :

# Set a custom thinking budget (default is 31,999)
export MAX_THINKING_TOKENS=31999
 
# Disable extended thinking entirely
export MAX_THINKING_TOKENS=0

Monte le chiffre et Claude a plus de place pour raisonner, mais la latence et les tokens augmentent avec. Baisse-le et le raisonnement reste concis. 0 désactive le raisonnement étendu, pratique quand la vitesse prime sur la profondeur.

Mise en cache de prompt et raisonnement étendu

Le raisonnement étendu entre en conflit avec la mise en cache de prompt. Les tokens de réflexion voyagent avec la réponse et ne sont pas mis en cache pour les tours suivants. Pour du travail répétitif, genre le même refactor sur de nombreux fichiers, le débit est souvent meilleur avec le raisonnement étendu désactivé et un prompt précis qui fait le boulot.

Compromis coût vs performance

Avant de passer à un modèle plus cher comme Claude Opus, tire plus de celui que tu utilises déjà :

  1. Phrases de réflexion. think harder, ultrathink, ou think step by step comblent la plupart du fossé d'intelligence
  2. Mode plan. Ajoute de la structure au raisonnement étendu
  3. Cycles de révision. Plus de critiques, réponses plus précises
  4. Sous-agents. Des angles frais sur le même problème difficile

Cette combinaison livre environ 80 % de la qualité d'Opus à 20 % du coût. Le calcul au moment du test rapporte plus par dollar que le changement de modèle.

Patterns courants de réflexion approfondie

L'approche systématique

claude "think step by step + plan mode:
1. Analyze the current system
2. Identify bottlenecks
3. Propose solutions
4. Create implementation plan
5. Critique the plan for missing elements"

L'analyse multi-perspectives

claude "think harder: Analyze this API design from the perspectives of:
- Performance engineer
- Security auditor
- Frontend developer
- DevOps engineer"

Le raffinement itératif

claude "ultrathink + plan mode: Design a caching strategy.
Then critique it for edge cases and suggest improvements."

Quand la réflexion approfondie ne suffit pas

Quand les phrases déclencheurs, la planification et les tours de révision ne suffisent toujours pas :

  1. Amène des sous-agents pour des angles de spécialistes différents
  2. Divise le problème en tâches plus petites et plus précises
  3. Passe à Claude Opus pour le travail vraiment complexe
  4. Intègre des extensions MCP adaptées au domaine

Indicateurs de succès

Les phrases déclencheurs fonctionnent quand Claude :

  • Te donne plus d'une solution
  • Repère des cas limites que tu n'avais pas vus
  • Te détaille les compromis qu'il a pesés
  • Esquisse comment livrer chaque option
  • Signale des améliorations qui valent d'être faites

Actions suivantes

Immédiat : Mets think harder: sur ton prochain prompt difficile et compare la réponse.

Avancé : Apprends les stratégies du mode plan qui façonnent le raisonnement étendu.

Optimisation : Regarde la sélection de modèle pour équilibrer coût et profondeur.

Mise à l'échelle : Monte des agents personnalisés pour des tâches de réflexion spécialisées.

Dépannage : Lis le guide d'optimisation des performances si la réflexion approfondie te semble lente.

Sans phrases déclencheurs, Claude te donne la première réponse qui fonctionne. Avec elles, il te donne la meilleure qu'il peut construire. Les phrases ne coûtent rien à ajouter.

Continue in Performance

  • Modèles d'efficacité
    Les frameworks de permutation transforment 8 à 12 builds manuels en un template CLAUDE.md que Claude Code utilise pour générer les variations 11, 12 et 13 à la demande. Capturé une seule fois.
  • Le mode rapide de Claude Code
    Le mode rapide route tes requêtes Opus 4.6 sur un chemin de service prioritaire dans Claude Code. Mêmes poids, même plafond, réponses 2,5x plus vite à un tarif token plus élevé.
  • Optimisation de la vitesse
    Le choix du modèle, la taille du contexte et la spécificité de l'invite sont les trois leviers qui décident de la rapidité des réponses de Claude Code. /model haiku, /compact, et /clear covered.

More from Handbook

  • Principes de base de l'agent
    Cinq façons de construire des agents spécialisés dans le code Claude : Sous-agents de tâches, .claude/agents YAML, commandes slash personnalisées, personas CLAUDE.md, et invites de perspective.
  • Patterns d'agents
    Orchestrateur, fan-out, chaîne de validation, routage par spécialiste, raffinement progressif, et watchdog. Six formes d'orchestration pour câbler des sub-agents Claude Code.
  • Meilleures pratiques des équipes d'agents
    Patterns éprouvés pour les équipes d'agents Claude Code. Prompts de création riches en contexte, tâches bien calibrées, propriété des fichiers, mode délégué, et correctifs v2.1.33-v2.1.45.
  • Contrôles des équipes d'agents
    Configure le mode délégué, les modes d'affichage, l'approbation des plans, les limites de fichiers et les règles CLAUDE.md pour que le chef d'équipe Claude Code coordonne au lieu de coder.

Arrêtez de configurer. Commencez à construire.

Templates SaaS avec orchestration IA.

Tarification et utilisation des tokens Claude Code

Réduis les coûts Claude Code de 40 à 70 % avec le suivi ccusage, la commande /model, /compact et /clear, le mode plan, et le niveau de forfait adapté à ton usage.

Optimisation de la vitesse

Le choix du modèle, la taille du contexte et la spécificité de l'invite sont les trois leviers qui décident de la rapidité des réponses de Claude Code. /model haiku, /compact, et /clear covered.

On this page

C'est quoi la réflexion approfondie ?
La pile de performance
Niveau 1 : Réflexion améliorée
Niveau 2 : Mode plan + réflexion approfondie
Niveau 3 : Le moteur de révision
Applications concrètes
Débogage de problèmes complexes
Décisions d'architecture
Revues de code
Configuration persistante de la réflexion
Raisonnement étendu permanent
Contrôler le budget de réflexion
Mise en cache de prompt et raisonnement étendu
Compromis coût vs performance
Patterns courants de réflexion approfondie
L'approche systématique
L'analyse multi-perspectives
Le raffinement itératif
Quand la réflexion approfondie ne suffit pas
Indicateurs de succès
Actions suivantes

Arrêtez de configurer. Commencez à construire.

Templates SaaS avec orchestration IA.