Kontext Technik
Context Engineering entscheidet, was Claude Code sieht, wann er es sieht und was nicht. Gestufter Informationsfluss, zeitversetztes Laden und sauber abgegrenzte Kontexte.
Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.
SaaS-Builder-Vorlagen mit KI-Orchestrierung.
Problem: Claude Code schwankt ständig zwischen genial und frustrierend. In einer Sitzung meistert er die Aufgabe perfekt. In der nächsten kommt er bei derselben Anfrage völlig vom Thema ab. Man kann nie vorhersagen, welche Version man bekommt.
Schnelle Lösung: Hör auf, alles gleich zu Beginn in die Eingabezeile zu packen. Gib Claude die Informationen stattdessen schrittweise:
# Bad: dump everything upfront
claude "Here's my entire codebase architecture, all conventions,
every pattern we use, plus the task..."
# Good: let Skills load what's needed, when needed
claude "Build the auth module"
# Skills load authentication patterns only when Claude needs themBeim Prompt Engineering geht es darum, eine Frage gut zu formulieren. Beim Context Engineering geht es darum, sicherzustellen, dass Claude im richtigen Moment über die richtigen Fakten verfügt.
Das markiert auch die Grenze zu den benachbarten Seiten. Lies diese Seite, wenn das Designproblem der Informationsfluss ist: Was soll vorab geladen werden, was soll zurückgestellt werden und wie hält man irrelevanten Kontext fern? Wenn du Regeln zur Sitzungswiederherstellung benötigst, lies Context Management. Wenn du eine aufgabenspezifische Methode suchst, um das richtige Bundle zu Beginn der Sitzung vorzuladen, lies Dynamic Starting Context.
Was ist Kontext-Engineering?
Context Engineering beschreibt, wie du den Informationsfluss in das Modell gestaltest. Machst du es richtig, verhält sich Claude Code wie ein Programmierpartner, der deine Absicht versteht. Machst du es falsch, verbringst du die Sitzung damit, dagegen anzukämpfen.
Hier ist die Problemstellung. Ein Kontextfenster ist ein begrenzter Arbeitsbereich, der in Tokens gemessen wird. Anweisungen, abgerufene Dokumente, Tool-Ausgaben und der Konversationsverlauf teilen sich diesen Raum. Erreichst du die Obergrenze, fallen ältere Inhalte ab. Organisierst du es schlecht, verliert Claude den Faden.
Das bedeutet, dass Kontext eine knappe Ressource ist. Wie du ihn strukturierst, entscheidet darüber, ob ein Build die Funktion liefert, die du dir vorgestellt hast, oder ob er nur fast dahin kommt.
Die Herausforderung des Kontextfensters
Wenn der Kontext außer Kontrolle gerät, neigt Claude Code dazu, auf vier wiederkehrende Arten zu versagen:
| Fehlermodus | Was passiert | Prävention |
|---|---|---|
| Kontextvergiftung | Fehler häufen sich, wenn Agenten den kontaminierten Kontext wiederverwenden | Neue Sitzungen, Befehl „/clear“ |
| Kontext-Ablenkung | Übermäßiges Vertrauen auf die Wiederholung früheren Verhaltens | Strategisches Chunking |
| Kontextverwirrung | Irrelevante Tools oder Dokumentationen lenken den Agenten in die falsche Richtung | Fähigkeiten-System |
| Konflikt im Kontext | Widersprüchliche Informationen führen zu Konflikten | CLAUDE.md als einzige Quelle der Wahrheit |
Lerne, die vier zu erkennen. Sie sind das Muster, gegen das du ankämpfst.
Das Sechs-Säulen-Framework
Context Engineering basiert auf sechs miteinander verbundenen Ideen. So lässt sich jede einzelne im Claude Code umsetzen:
1. Agenten
Ein Agent im „AI“ ist ein „LLM“, der mit Tools, Speicher und Schlussfolgerungsfähigkeiten verbunden ist, um ein Ziel zu verfolgen. Agenten entscheiden, was in den Kontext gelangt, was darin verbleibt und was verworfen wird.
Claude Code wechselte von einem Einzelagenten zu einem Multi-Agenten-System, sobald Subagenten eingeführt wurden. Die Implikation für das Context Engineering ist klar:
# Single agent: one context window handles everything
claude "Research, plan, build, test, and deploy the payment system"
# Multi-agent: specialized contexts, distributed load
# Central AI delegates to focused subagents
claude "Build the payment system"
# → Research agent gathers requirements
# → Backend agent builds Stripe integration
# → Frontend agent creates checkout UI
# → Each agent has clean, focused contextMulti-Agent-Konfigurationen verhindern Kontextverwirrung, indem sie jedem Subagenten einen enger gefassten Auftrag geben. Dein zentraler AI wird zum CTO und verteilt spezialisierte Aufgaben an den richtigen Spezialisten.
2. Abfrageerweiterung
Echte Benutzeranfragen sind oft ungenau. Die Abfrageerweiterung präzisiert sie, bevor die Arbeit beginnt.
Wenn deine zentrale Claude-Code-Sitzung als Mitbegründer oder Entwicklungsmanager eingerichtet ist, ergibt sich die Erweiterung ganz von selbst aus diesem Rahmen:
Your input: "fix the auth bug"
Central AI refinement: → Analyze recent changes to auth module → Identify error patterns in logs → Scope to affected files (src/lib/auth.ts) → Generate targeted fix with test coverage
Subagent receives: Clear, scoped task with context Dein grober Satz durchläuft zuerst den zentralen „AI“. Wenn er einen Subagenten erreicht, ist er bereits eine konkret definierte Aufgabe und nicht mehr dein roher Einzeiler.
3. Abruf
Abruf ist die Art und Weise, wie externe Informationen bei Bedarf in das Fenster gezogen werden. Der Kompromiss ist die Chunk-Größe. Kleine Chunks sind präzise, verlieren aber den umgebenden Kontext. Große Chunks bringen reichhaltigen Kontext auf Kosten der Tokens.
Claude Code verfügt derzeit über keine native Abruf-Funktion. Teilweise Workarounds gibt es über die Tools „MCPs“ und „CLI“, aber dies ist noch keine Stärke der Plattform. Vorerst bilden deine CLAUDE.md-Datei und deine Skills die Abruf-Ebene:
# CLAUDE.md - Your retrieval substitute
## Architecture (always loaded)
- Next.js 15, App Router, TypeScript strict
## Patterns (reference when needed)
See /docs/patterns/ for component conventions4. Prompting-Techniken
Hier ist der Teil, den die meisten übersehen. Informationen einfach ins Fenster zu schütten, garantiert noch keine guten Ergebnisse. Was zählt, sind die Reihenfolge, der Zeitpunkt und der Kanal.
Studien kommen immer wieder zu demselben Ergebnis: Der Anfang und das Ende des Kontextfensters erhalten mehr Aufmerksamkeit als die Mitte. Deshalb funktionieren Skills so gut:
Conversation start:
├── CLAUDE.md (beginning of context - high attention)
├── Your initial prompt
├── ... conversation history ...
├── Claude's work
└── Skill loads HERE (end of context - high attention)
└── Fresh, relevant instructions at peak attentionBis das Skill geladen ist, läuft Claude schlank. Sobald es mitten in der Sitzung ausgelöst wird, landen seine Anweisungen ganz unten im Fenster, genau in der Zone mit hoher Aufmerksamkeit, genau dann, wenn das Fachwissen benötigt wird. Das ist progressive Offenlegung, und sie gewinnt Tokens zurück, die ein frontgeladenes CLAUDE.md sonst verbrauchen würde.
5. Gedächtnis
Der Speicher ist das, was ein zustandsloses Modell in etwas verwandelt, das sich daran erinnert, was ihr gemeinsam gemacht habt.
Das echte Gedächtnis von Claude Code kommt zum Vorschein:
| Was | So funktioniert es | Persistenz |
|---|---|---|
| CLAUDE.md | Wird zu Beginn der Sitzung geladen und als maßgeblich behandelt | Permanent |
| Fähigkeiten | Wird bei Auslösung nach Bedarf geladen | Permanent |
| Sitzungsdateien | .claude/tasks/session-current.md verfolgen den Fortschritt | Über Sitzungen hinweg |
| Konversation | Aktuelles Kontextfenster | Diese Sitzung |
Kombiniere die Sitzungsverfolgung mit Living Docs und du erhältst eine auf dieses Repo abgestimmte Gedächtnisebene. Claude schreibt dort hinein, sobald Entscheidungen getroffen werden, und liest daraus, wenn du am nächsten Tag zurückkommst. Im Laufe der Wochen lernt dein Assistent deine Codebasis kennen.
6. Tools
Tools sind der Weg, wie Schlussfolgerungen in die reale Welt gelangen. Claude Code wird mit den Grundlagen ausgeliefert: Lesen, Schreiben, Bearbeiten, Bash und „MCP“ für externe Dienste.
Skills haben etwas Neues hinzugefügt. Claude kann ein ausführbares Skript ausführen, ohne dessen Implementierung in den Kontext zu laden. Das ist die Idee hinter „MCP -S“ (CLI): Claude folgt einem Protokoll, und die Interna bleiben unsichtbar.
Beispiel: Ein Skill zur Dokumentationsrecherche, der auf Context7-MCPs aufbaut:
# .claude/skills/documentation-research/SKILL.md
---
name: documentation-research
description: Fetch library docs using Context7 API
---
## When to Use
User needs current documentation for any library
## Workflow
1. Resolve library ID via Context7
2. Fetch relevant documentation
3. Apply to current task
## Tools Available
- mcp**context7**resolve-library-id
- mcp**context7**get-library-docsClaude greift über die Skill-Schnittstelle auf die MCP-Tools zu. Protokollgesteuert, kontexteffizient, kein Lesen des Quellcodes erforderlich.
Echte Beispiele, die den Unterschied deutlich machen
Der einfachste Weg, Context Engineering zu verstehen, ist, dieselbe Aufgabe mit schlechtem Kontext und optimiertem Kontext zu vergleichen.
Beispiel 1: Sicherheits-Triage
Schlechte Version:
claude "check if this auth flow is secure"Diese Eingabeaufforderung ist zu weit gefasst. Claude hat kein Bedrohungsmodell, keine Systemgrenzen und keine Ahnung, welcher Code relevant ist.
Optimierte Version:
claude "Review the password reset flow for account-takeover risk.
Scope: - src/auth/reset.ts
- app/api/reset-password/route.ts
- middleware/session.ts
Focus: - token generation and expiry
- user enumeration
- rate limiting
- replay risk
Output: 1. concrete issues
2. exploit path
3. exact fix
4. regression test plan"Gleiches Modell. Anderes Ergebnis. Die zweite Version gibt Claude eine Systemgrenze, eine Angriffsperspektive und einen Output-Vertrag. Das ist Context Engineering.
Beispiel 2: Umfangreiche Refaktorisierung
Schlechte Version:
claude "migrate our forms to the new validation layer"Optimierte Version:
claude "Migrate signup + billing forms from ad-hoc validation to Zod.
Read first: - docs/forms/validation-plan.md
- components/forms/*
Do not touch: - admin flows
- onboarding wizard
Definition of done: - shared schema extracted
- client + server validation aligned
- error copy preserved
- tests updated for changed messages"Der Unterschied liegt nicht in der Feinschliff der Prompt-Formulierung. Es ist der kontrollierte Umfang. Claude weiß jetzt, was er lesen soll, was er nicht anfassen darf und was als fertig gilt.
Beispiel 3: Pipeline zur Inhaltserstellung
Schlechte Version:
claude "write a post about Claude Code hooks"Optimierte Version:
claude "Write a hooks article for technical readers evaluating Claude Code.
Use: - existing hooks-guide.mdx
- permission-hook-guide.mdx
- session-lifecycle-hooks.mdx
Must include: - one production workflow
- one failure mode
- one copy-paste config example
- internal links to the three related guides
Avoid: - generic 'AI changes everything' framing
- repeating definitions already covered in the linked pages"Jetzt schreibt Claude nicht mehr ins Leere. Er schreibt in ein echtes Content-System mit bekannten Nachbarn, Überschneidungsbeschränkungen und Qualitätsanforderungen.
Wo sich Context Engineering am meisten auszahlt
Der Nutzen ist am größten, wenn die Aufgabe entweder mit hohem Risiko oder hoher Mehrdeutigkeit verbunden ist:
| Aufgabentyp | Warum Context Engineering wichtig ist |
|---|---|
| Sicherheitsüberprüfungen | Du benötigst einen klaren Umfang, ein Bedrohungsmodell und Schwellenwerte für die Beweisführung |
| Fehlerbehebung in der Produktion | Zu viele irrelevante Vorgeschichten lenken das Modell in die falsche Richtung |
| Migrationen | Grenzkontrolle ist wichtiger als reine Informationen |
| Lang andauernde Agent-Workflows | Der Kontextverfall verstärkt sich über viele Schritte hinweg |
| SEO / Content-Systeme | Modelle brauchen Überlappungskontrolle, damit sich Seiten nicht gegenseitig kannibalisieren |
Wenn die Aufgabe kostengünstig, ungenau und reversibel ist, kann man mit einem schlampigen Kontext leben. Wenn die Aufgabe teuer oder riskant ist, schafft ein schlampiger Kontext nur falsche Sicherheit.
Das Framework implementieren
Heute: Überprüfe deine CLAUDE.md. Ist sie für das Abrufen ausgelegt? Befinden sich die Muster, die dir wichtig sind, an einer Stelle, an der Claude sie finden kann?
Diese Woche: Erstelle Skills für die Workflows, die du wiederholt ausführst. Jeder Skill schützt vor Kontextverwirrung, da Fachwissen bei Bedarf geladen wird.
Laufend: Achte auf die vier Fehlermodi. In dem Moment, in dem Claude alte Fehler wiederholt oder ignoriert, was du gesagt hast, hat die Kontamination eingesetzt. Fang von vorne an.
Das Fazit
Zuverlässige Ergebnisse sind kein Problem größerer Modelle. Es ist ein Problem des Informationsflusses.
Die sechs Säulen ergänzen sich:
- Agenten verteilen den Kontext auf Spezialisten
- Die Abfrageerweiterung verfeinert unübersichtliche Eingaben
- Die Abfrage (über CLAUDE.md/Skills) bringt relevante Informationen ans Licht
- Prompting-Ebenen liefern Informationen strategisch
- Der Speicher behält den Status über mehrere Sitzungen hinweg bei
- Tools erweitern die Funktionen effizient
Wenn du das richtig machst, wird Claude Code zu einem Programmierpartner, dem du jede Idee anvertrauen und die Umsetzung überlassen kannst.
Nächste Schritte:
- Leitfaden zum 1-Mio.-Kontextfenster für die neuesten Informationen zur GA-Verfügbarkeit und einheitlichen Preisgestaltung
- Verwaltung des Kontextpuffers zum Verständnis der 33K-Reservierung
- Kontextverwaltung zur Token-Optimierung
- Speicheroptimierung für Persistenzstrategien
- Skills-Leitfaden zum Laden von Fachwissen auf Abruf
- Sub-Agent-Design für Multi-Agent-Architekturen
Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.
SaaS-Builder-Vorlagen mit KI-Orchestrierung.
1M-Kontext-Fenster in Claude Code
Anthropic hat das 1-Mio.-Token-Kontextfenster für Opus 4.6 und Sonnet 4.6 in Claude Code aktiviert. Kein Beta-Header, kein Aufpreis, feste Preise und weniger Kompaktierungen.
Kontextmanagement im Claude Code
Wie man Claude Code-Sitzungen mit 1M-Kontext verwaltet: wann man weitermacht, wann man zurückspult, wann man aufräumt, wann man komprimiert und wann man die Arbeit an Subagenten weitergibt.