Build This Now
Build This Now
Qu'est-ce que le code Claude ?Installer Claude CodeL'installateur natif de Claude CodeTon premier projet Claude Code
La Fenêtre de Contexte 1M dans Claude CodeIngénierie contextuelleGestion du contexte dans le code ClaudeBuffer de contexte Claude Code
speedy_devvkoen_salo
Blog/Handbook/Core/Context Engineering

Ingénierie contextuelle

L'ingénierie contextuelle décide ce que Claude Code voit, quand il le voit et ce qui reste en dehors. Flux d'informations échelonné, chargement différé et contextes proprement délimités.

Arrêtez de configurer. Commencez à construire.

Templates SaaS avec orchestration IA.

Published Apr 10, 2026Handbook hubCore index

Problème : Claude Code oscille sans cesse entre le génial et le frustrant. Une session permet de résoudre la tâche du premier coup. La suivante part dans tous les sens pour la même demande. Tu ne peux pas savoir à l'avance sur quelle version tu vas tomber.

Solution rapide : Arrête de tout mettre d'un coup dans la ligne de commande. Donne plutôt les informations à Claude par étapes :

# Bad: dump everything upfront
claude "Here's my entire codebase architecture, all conventions,
every pattern we use, plus the task..."
 
# Good: let Skills load what's needed, when needed
claude "Build the auth module"
# Skills load authentication patterns only when Claude needs them

L'ingénierie de la ligne de commande consiste à bien formuler une question. L'ingénierie du contexte consiste à s'assurer que Claude dispose des bonnes informations au bon moment.

Cela marque également la limite avec les pages voisines. Lis cette page lorsque le problème de conception concerne le flux d'informations : quoi précharger, quoi différer et comment exclure le contexte non pertinent. Si tu as besoin de règles de récupération de session, lis Gestion du contexte. Si tu veux une méthode spécifique à une tâche pour précharger le bon ensemble de données au début de la session, lis Contexte de démarrage dynamique.

Qu'est-ce que l'ingénierie du contexte ?

L'ingénierie du contexte, c'est la façon dont tu conçois le flux d'informations vers le modèle. Si tu le fais bien, Claude Code commence à se comporter comme un partenaire de codage qui comprend ton intention. Si tu te trompes, tu passeras la session à te battre contre lui.

Voici en quoi consiste le problème. Une fenêtre de contexte est un espace de travail délimité, mesuré en tokens. Les instructions, les documents récupérés, les résultats des outils et l'historique des conversations se partagent cet espace. Atteins la limite et le contenu le plus ancien disparaît. Organise-le mal et Claude perd le fil.

Ce qui signifie que le contexte est une ressource rare. La façon dont tu le structures est ce qui distingue une version qui intègre la fonctionnalité que tu avais en tête d’une version qui y arrive presque.

Le défi de la fenêtre de contexte

Lorsque le contexte devient incontrôlable, le code de Claude a tendance à échouer de quatre façons récurrentes :

Mode de défaillanceCe qui se passePrévention
Contamination du contexteLes erreurs s'accumulent à mesure que les agents réutilisent le contexte contaminéNouvelles sessions, commande « /clear »
Distraction liée au contexteDépendance excessive à la répétition des comportements antérieursRegroupement stratégique
Confusion de contexteDes outils ou des documents non pertinents induisent l'agent en erreurSystème de compétences
Conflit de contexteDes informations contradictoires créent des conflitsCLAUDE.md comme source unique de vérité

Apprends à repérer ces quatre éléments. Ils constituent le schéma contre lequel tu te bats.

Le cadre des six piliers

L'ingénierie contextuelle repose sur six idées liées entre elles. Voici comment chacune d'entre elles s'intègre dans Claude Code :

1. Agents

Un agent d'AI, c'est un LLMe relié à des outils, à une mémoire et à un raisonnement pour pouvoir atteindre un objectif. Les agents décident de ce qui entre dans le contexte, de ce qui y reste et de ce qui en est retiré.

Claude Code est passé d’un agent unique à un système multi-agents dès que les sous-agents ont été intégrés. L’implication en matière d’ingénierie du contexte est directe :

# Single agent: one context window handles everything
claude "Research, plan, build, test, and deploy the payment system"
 
# Multi-agent: specialized contexts, distributed load
# Central AI delegates to focused subagents
claude "Build the payment system"
# → Research agent gathers requirements
# → Backend agent builds Stripe integration
# → Frontend agent creates checkout UI
# → Each agent has clean, focused context

les configurations multi-agents évitent la confusion contextuelle en donnant à chaque sous-agent un mandat plus précis. Ton AI central devient le directeur technique, confiant le travail spécialisé au bon spécialiste.

2. Augmentation des requêtes

Les requêtes des utilisateurs réels sont souvent imprécises. L'augmentation des requêtes les affine avant que le travail ne commence.

Si ta session Claude Code centrale est configurée en tant que cofondateur ou responsable du développement, l'enrichissement s'inscrit naturellement dans ce cadre :

Your input: "fix the auth bug"

Central AI refinement: → Analyze recent changes to auth module → Identify error patterns in logs → Scope to affected files (src/lib/auth.ts) → Generate targeted fix with test coverage

Subagent receives: Clear, scoped task with context 

Ta phrase approximative passe d'abord par l'AI central. Lorsqu'elle parvient à un sous-agent, c'est une tâche bien définie, et non plus ta simple ligne de texte brute.

3. Récupération

La récupération, c'est la façon dont les informations externes sont intégrées à la fenêtre à la demande. Le compromis, c'est la taille des blocs. Les petits blocs sont précis mais perdent le contexte environnant. Les gros blocs apportent un contexte riche au prix de tokens.

Claude Code ne dispose pas encore de fonctionnalité de récupération native. Il existe des solutions de contournement partielles via des outils de MCPs et de CLI, mais ce n'est pas encore un point fort de la plateforme. Pour l'instant, ton fichier CLAUDE.md et tes Skills constituent la couche de récupération :

# CLAUDE.md - Your retrieval substitute
 
## Architecture (always loaded)
 
- Next.js 15, App Router, TypeScript strict

 
## Patterns (reference when needed)
 
See /docs/patterns/ for component conventions

4. Techniques de prompt

Voici la partie que la plupart des gens négligent. Déverser des informations dans la fenêtre ne garantit pas un résultat solide. Ce qui compte, c'est l'ordre, le timing et le canal.

Les recherches ne cessent de le confirmer : le début et la fin de la fenêtre contextuelle retiennent davantage l'attention que le milieu. C'est pourquoi les Skills fonctionnent si bien :

Conversation start:
├── CLAUDE.md (beginning of context - high attention)
├── Your initial prompt
├── ... conversation history ...
├── Claude's work
└── Skill loads HERE (end of context - high attention)
    └── Fresh, relevant instructions at peak attention

Tant que la compétence n’est pas chargée, Claude fonctionne en mode allégé. Une fois qu’elle se déclenche en cours de session, ses instructions apparaissent au bas de la fenêtre, en plein dans la zone d’attention maximale, exactement au moment où l’expertise est nécessaire. C’est ce qu’on appelle la divulgation progressive, et ça récupère des jetons qu’un CLAUDE.md chargé en début de session aurait autrement gaspillés.

5. Mémoire

C'est la mémoire qui transforme un modèle sans état en quelque chose qui se souvient de ce que vous avez fait ensemble.

La véritable mémoire de Claude Code se révèle :

Qu'est-ce queComment ça marchePersistance
CLAUDE.mdSe charge au démarrage de la session, considéré comme faisant autoritéPermanent
CompétencesSe charge à la demande quand c'est déclenchéPermanent
Fichiers de session.claude/tasks/session-current.md suit la progressionD'une session à l'autre
ConversationFenêtre de contexte actuelleCette session

Associe le suivi de session à des documents évolutifs et tu obtiens une couche de mémoire adaptée à ce dépôt. Claude y écrit au fur et à mesure que les décisions sont prises, et y lit quand tu reviens le lendemain. Au fil des semaines, ton assistant apprend à connaître ta base de code.

6. Outils

Les outils permettent au raisonnement d'atteindre le monde réel. Claude Code est livré avec les fonctionnalités de base : Lire, Écrire, Modifier, Bash et MCP pour les services externes.

Les compétences ont apporté quelque chose de différent. Claude peut exécuter un script sans charger son implémentation dans le contexte. C'est le principe de le MCP -S CLI : Claude suit un protocole, et les détails internes restent invisibles.

Exemple : une compétence de recherche documentaire basée sur le MCP Context7 :

# .claude/skills/documentation-research/SKILL.md
 
---
 
name: documentation-research
description: Fetch library docs using Context7 API
 
---
 
## When to Use
 
User needs current documentation for any library
 
## Workflow
 
1. Resolve library ID via Context7
2. Fetch relevant documentation
3. Apply to current task

 
## Tools Available
 
- mcp**context7**resolve-library-id
- mcp**context7**get-library-docs

Claude accède aux outils de MCP via l'interface de la compétence. Basé sur un protocole, efficace en termes de contexte, aucune lecture du code source n'est requise.

Des exemples concrets qui montrent clairement la différence

La façon la plus simple de comprendre l'ingénierie contextuelle est de comparer la même tâche avec un mauvais contexte et un contexte optimisé.

Exemple 1 : triage de sécurité

Mauvaise version :

claude "check if this auth flow is secure"

Cette invite est trop vague. Claude n'a pas de modèle de menace, pas de limite du système, et aucune idée du code qui compte.

Version optimisée :

claude "Review the password reset flow for account-takeover risk.

Scope: - src/auth/reset.ts
- app/api/reset-password/route.ts
- middleware/session.ts

 Focus: - token generation and expiry
- user enumeration
- rate limiting
- replay risk

 Output: 1. concrete issues
2. exploit path
3. exact fix
4. regression test plan"

Même modèle. Résultat différent. La deuxième version donne à Claude une limite du système, une perspective d'attaque et un contrat de sortie. C'est ça, l'ingénierie de contexte.

Exemple 2 : refactorisation à grande échelle

Mauvaise version :

claude "migrate our forms to the new validation layer"

Version optimisée :

claude "Migrate signup + billing forms from ad-hoc validation to Zod.

Read first: - docs/forms/validation-plan.md
- components/forms/*

 Do not touch: - admin flows
- onboarding wizard

 Definition of done: - shared schema extracted
- client + server validation aligned
- error copy preserved
- tests updated for changed messages"

La différence ne réside pas dans le polissage de la formulation de la requête. C'est une portée contrôlée. Claude sait désormais ce qu'il doit lire, ce qu'il ne doit pas toucher et ce qui est considéré comme terminé.

Exemple 3 : Pipeline de production de contenu

Mauvaise version :

claude "write a post about Claude Code hooks"

Version optimisée :

claude "Write a hooks article for technical readers evaluating Claude Code.

Use: - existing hooks-guide.mdx
- permission-hook-guide.mdx
- session-lifecycle-hooks.mdx

 Must include: - one production workflow
- one failure mode
- one copy-paste config example
- internal links to the three related guides

 Avoid: - generic 'AI changes everything' framing
- repeating definitions already covered in the linked pages"

Maintenant, Claude n'écrit plus dans le vide. Il écrit dans un véritable système de contenu avec des éléments voisins connus, des contraintes de chevauchement et des exigences de qualité.

Quand l'ingénierie contextuelle porte vraiment ses fruits

Les retombées sont maximales lorsque la tâche présente soit un risque élevé, soit une grande ambiguïté :

Type de tâchePourquoi l'ingénierie contextuelle est importante
Évaluations de sécuritéTu as besoin d'un périmètre clair, d'un modèle de menace et de seuils de preuve
Corrections de bugs en productionTrop d'antécédents sans rapport font dériver le modèle vers une cause première erronée
MigrationsLe contrôle des limites est plus important que les données brutes
Workflows d'agents de longue duréeLa détérioration du contexte s'accumule au fil des étapes
SEO / systèmes de contenuLes modèles ont besoin d'un contrôle des chevauchements pour que les pages ne se cannibalisent pas entre elles

Quand la tâche est peu coûteuse, floue et réversible, un contexte approximatif est acceptable. Quand la tâche est coûteuse ou risquée, c'est un contexte approximatif qui crée une fausse confiance.

Mise en œuvre du cadre

Aujourd’hui : vérifie ton CLAUDE.md. Est-il organisé pour faciliter la recherche ? Les modèles qui t’intéressent se trouvent-ils à un endroit où Claude peut les trouver ?

Cette semaine : développe des compétences pour les flux de travail que tu répètes. Chaque compétence est un rempart contre la confusion contextuelle, car l'expertise se charge à la demande.

En continu : surveille les quatre modes de défaillance. Dès que Claude répète d’anciennes erreurs ou ignore ce que tu as dit, la contamination s’est installée. Recommence à zéro.

Conclusion

La fiabilité des résultats n'est pas un problème lié à la taille du modèle. C'est un problème de flux d'informations.

Les six piliers s’imbriquent les uns dans les autres :

  • Les agents répartissent le contexte entre les spécialistes
  • L'enrichissement des requêtes affine les entrées désordonnées
  • La récupération (via CLAUDE.md/Skills) fait ressortir les informations pertinentes
  • Les couches de prompting fournissent des informations de manière stratégique
  • La mémoire conserve l'état d'une session à l'autre
  • Les outils étendent efficacement les capacités

Si tu maîtrises tout ça, Claude Code devient un partenaire de codage à qui tu peux confier n'importe quelle idée et à qui tu peux faire confiance pour la mise en œuvre.

Prochaines étapes :

  • Guide de la fenêtre de contexte de 1 Mo pour les dernières informations sur la disponibilité en version GA et la tarification unifiée
  • Gestion du tampon de contexte pour comprendre la réservation de 33K
  • Gestion du contexte pour l'optimisation des jetons
  • Optimisation de la mémoire pour les stratégies de persistance
  • Guide des compétences pour le chargement d'expertise à la demande
  • Conception de sous-agents pour les architectures multi-agents

Continue in Core

  • La Fenêtre de Contexte 1M dans Claude Code
    Anthropic a activé la fenêtre de contexte 1M tokens pour Opus 4.6 et Sonnet 4.6 dans Claude Code. Sans header beta, sans surcharge, tarification fixe, et moins de compactions.
  • Auto Dream
    Claude Code nettoie ses propres notes de projet entre les sessions. Les entrées obsolètes sont supprimées, les contradictions résolues, les fichiers thématiques réorganisés. Lance /memory.
  • Mémoire automatique dans le code Claude
    La mémoire automatique permet à Claude Code de conserver des notes de projet en cours. Où se trouvent les fichiers, ce qui est écrit, comment /memory le fait basculer, et quand le choisir par rapport à CLAUDE.md.
  • Stratégies d'auto-planning
    Le mode Auto Plan utilise --append-system-prompt pour forcer Claude Code dans une boucle plan-d'abord. Les opérations sur les fichiers sont mises en pause pour approbation avant de toucher quoi que ce soit.
  • Claude Code Autonome
    Une stack unifiée pour des agents qui livrent des fonctionnalités la nuit. Les threads te donnent la structure, les boucles Ralph te donnent l'autonomie, la vérification garde ça honnête.
  • Claude Buddy
    La surprise du 1er avril 2026 d'Anthropic : un système Tamagotchi dans Claude Code. 18 espèces, 5 niveaux de rareté, stats CHAOS et SNARK, easter egg en hexadécimal fuité.

More from Handbook

  • Principes de base de l'agent
    Cinq façons de construire des agents spécialisés dans le code Claude : Sous-agents de tâches, .claude/agents YAML, commandes slash personnalisées, personas CLAUDE.md, et invites de perspective.
  • Patterns d'agents
    Orchestrateur, fan-out, chaîne de validation, routage par spécialiste, raffinement progressif, et watchdog. Six formes d'orchestration pour câbler des sub-agents Claude Code.
  • Meilleures pratiques des équipes d'agents
    Patterns éprouvés pour les équipes d'agents Claude Code. Prompts de création riches en contexte, tâches bien calibrées, propriété des fichiers, mode délégué, et correctifs v2.1.33-v2.1.45.
  • Contrôles des équipes d'agents
    Configure le mode délégué, les modes d'affichage, l'approbation des plans, les limites de fichiers et les règles CLAUDE.md pour que le chef d'équipe Claude Code coordonne au lieu de coder.

Arrêtez de configurer. Commencez à construire.

Templates SaaS avec orchestration IA.

La Fenêtre de Contexte 1M dans Claude Code

Anthropic a activé la fenêtre de contexte 1M tokens pour Opus 4.6 et Sonnet 4.6 dans Claude Code. Sans header beta, sans surcharge, tarification fixe, et moins de compactions.

Gestion du contexte dans le code Claude

Comment gérer les sessions de Claude Code avec un contexte de 1M : quand continuer, quand /rewind, quand /clear, quand /compact, et quand pousser le travail dans les sous-agents.

On this page

Qu'est-ce que l'ingénierie du contexte ?
Le défi de la fenêtre de contexte
Le cadre des six piliers
1. Agents
2. Augmentation des requêtes
3. Récupération
4. Techniques de prompt
5. Mémoire
6. Outils
Des exemples concrets qui montrent clairement la différence
Exemple 1 : triage de sécurité
Exemple 2 : refactorisation à grande échelle
Exemple 3 : Pipeline de production de contenu
Quand l'ingénierie contextuelle porte vraiment ses fruits
Mise en œuvre du cadre
Conclusion

Arrêtez de configurer. Commencez à construire.

Templates SaaS avec orchestration IA.