Kontext Technik

Problem: Claude Code schwankt ständig zwischen genial und frustrierend. In einer Sitzung meistert er die Aufgabe perfekt. In der nächsten kommt er bei derselben Anfrage völlig vom Thema ab. Man kann nie vorhersagen, welche Version man bekommt.

Schnelle Lösung: Hör auf, alles gleich zu Beginn in die Eingabezeile zu packen. Gib Claude die Informationen stattdessen schrittweise:

# Bad: dump everything upfront
claude "Here's my entire codebase architecture, all conventions,
every pattern we use, plus the task..."
 
# Good: let Skills load what's needed, when needed
claude "Build the auth module"
# Skills load authentication patterns only when Claude needs them

Beim Prompt Engineering geht es darum, eine Frage gut zu formulieren. Beim Context Engineering geht es darum, sicherzustellen, dass Claude im richtigen Moment über die richtigen Fakten verfügt.

Das markiert auch die Grenze zu den benachbarten Seiten. Lies diese Seite, wenn das Designproblem der Informationsfluss ist: Was soll vorab geladen werden, was soll zurückgestellt werden und wie hält man irrelevanten Kontext fern? Wenn du Regeln zur Sitzungswiederherstellung benötigst, lies Context Management. Wenn du eine aufgabenspezifische Methode suchst, um das richtige Bundle zu Beginn der Sitzung vorzuladen, lies Dynamic Starting Context.

Was ist Kontext-Engineering?

Context Engineering beschreibt, wie du den Informationsfluss in das Modell gestaltest. Machst du es richtig, verhält sich Claude Code wie ein Programmierpartner, der deine Absicht versteht. Machst du es falsch, verbringst du die Sitzung damit, dagegen anzukämpfen.

Hier ist die Problemstellung. Ein Kontextfenster ist ein begrenzter Arbeitsbereich, der in Tokens gemessen wird. Anweisungen, abgerufene Dokumente, Tool-Ausgaben und der Konversationsverlauf teilen sich diesen Raum. Erreichst du die Obergrenze, fallen ältere Inhalte ab. Organisierst du es schlecht, verliert Claude den Faden.

Das bedeutet, dass Kontext eine knappe Ressource ist. Wie du ihn strukturierst, entscheidet darüber, ob ein Build die Funktion liefert, die du dir vorgestellt hast, oder ob er nur fast dahin kommt.

Die Herausforderung des Kontextfensters

Wenn der Kontext außer Kontrolle gerät, neigt Claude Code dazu, auf vier wiederkehrende Arten zu versagen:

Fehlermodus	Was passiert	Prävention
Kontextvergiftung	Fehler häufen sich, wenn Agenten den kontaminierten Kontext wiederverwenden	Neue Sitzungen, Befehl „`/clear`“
Kontext-Ablenkung	Übermäßiges Vertrauen auf die Wiederholung früheren Verhaltens	Strategisches Chunking
Kontextverwirrung	Irrelevante Tools oder Dokumentationen lenken den Agenten in die falsche Richtung	Fähigkeiten-System
Konflikt im Kontext	Widersprüchliche Informationen führen zu Konflikten	CLAUDE.md als einzige Quelle der Wahrheit

Lerne, die vier zu erkennen. Sie sind das Muster, gegen das du ankämpfst.

Das Sechs-Säulen-Framework

Context Engineering basiert auf sechs miteinander verbundenen Ideen. So lässt sich jede einzelne im Claude Code umsetzen:

1. Agenten

Ein Agent im „AI“ ist ein „LLM“, der mit Tools, Speicher und Schlussfolgerungsfähigkeiten verbunden ist, um ein Ziel zu verfolgen. Agenten entscheiden, was in den Kontext gelangt, was darin verbleibt und was verworfen wird.

Claude Code wechselte von einem Einzelagenten zu einem Multi-Agenten-System, sobald Subagenten eingeführt wurden. Die Implikation für das Context Engineering ist klar:

# Single agent: one context window handles everything
claude "Research, plan, build, test, and deploy the payment system"
 
# Multi-agent: specialized contexts, distributed load
# Central AI delegates to focused subagents
claude "Build the payment system"
# → Research agent gathers requirements
# → Backend agent builds Stripe integration
# → Frontend agent creates checkout UI
# → Each agent has clean, focused context

Multi-Agent-Konfigurationen verhindern Kontextverwirrung, indem sie jedem Subagenten einen enger gefassten Auftrag geben. Dein zentraler AI wird zum CTO und verteilt spezialisierte Aufgaben an den richtigen Spezialisten.

2. Abfrageerweiterung

Echte Benutzeranfragen sind oft ungenau. Die Abfrageerweiterung präzisiert sie, bevor die Arbeit beginnt.

Wenn deine zentrale Claude-Code-Sitzung als Mitbegründer oder Entwicklungsmanager eingerichtet ist, ergibt sich die Erweiterung ganz von selbst aus diesem Rahmen:

Your input: "fix the auth bug"

Central AI refinement: → Analyze recent changes to auth module → Identify error patterns in logs → Scope to affected files (src/lib/auth.ts) → Generate targeted fix with test coverage

Subagent receives: Clear, scoped task with context

Dein grober Satz durchläuft zuerst den zentralen „AI“. Wenn er einen Subagenten erreicht, ist er bereits eine konkret definierte Aufgabe und nicht mehr dein roher Einzeiler.

3. Abruf

Abruf ist die Art und Weise, wie externe Informationen bei Bedarf in das Fenster gezogen werden. Der Kompromiss ist die Chunk-Größe. Kleine Chunks sind präzise, verlieren aber den umgebenden Kontext. Große Chunks bringen reichhaltigen Kontext auf Kosten der Tokens.

Claude Code verfügt derzeit über keine native Abruf-Funktion. Teilweise Workarounds gibt es über die Tools „MCPs“ und „CLI“, aber dies ist noch keine Stärke der Plattform. Vorerst bilden deine CLAUDE.md-Datei und deine Skills die Abruf-Ebene:

# CLAUDE.md - Your retrieval substitute
 
## Architecture (always loaded)
 
- Next.js 15, App Router, TypeScript strict

 
## Patterns (reference when needed)
 
See /docs/patterns/ for component conventions

4. Prompting-Techniken

Hier ist der Teil, den die meisten übersehen. Informationen einfach ins Fenster zu schütten, garantiert noch keine guten Ergebnisse. Was zählt, sind die Reihenfolge, der Zeitpunkt und der Kanal.

Studien kommen immer wieder zu demselben Ergebnis: Der Anfang und das Ende des Kontextfensters erhalten mehr Aufmerksamkeit als die Mitte. Deshalb funktionieren Skills so gut:

Conversation start:
├── CLAUDE.md (beginning of context - high attention)
├── Your initial prompt
├── ... conversation history ...
├── Claude's work
└── Skill loads HERE (end of context - high attention)
    └── Fresh, relevant instructions at peak attention

Bis das Skill geladen ist, läuft Claude schlank. Sobald es mitten in der Sitzung ausgelöst wird, landen seine Anweisungen ganz unten im Fenster, genau in der Zone mit hoher Aufmerksamkeit, genau dann, wenn das Fachwissen benötigt wird. Das ist progressive Offenlegung, und sie gewinnt Tokens zurück, die ein frontgeladenes CLAUDE.md sonst verbrauchen würde.

5. Gedächtnis

Der Speicher ist das, was ein zustandsloses Modell in etwas verwandelt, das sich daran erinnert, was ihr gemeinsam gemacht habt.

Das echte Gedächtnis von Claude Code kommt zum Vorschein:

Was	So funktioniert es	Persistenz
CLAUDE.md	Wird zu Beginn der Sitzung geladen und als maßgeblich behandelt	Permanent
Fähigkeiten	Wird bei Auslösung nach Bedarf geladen	Permanent
Sitzungsdateien	`.claude/tasks/session-current.md` verfolgen den Fortschritt	Über Sitzungen hinweg
Konversation	Aktuelles Kontextfenster	Diese Sitzung

Kombiniere die Sitzungsverfolgung mit Living Docs und du erhältst eine auf dieses Repo abgestimmte Gedächtnisebene. Claude schreibt dort hinein, sobald Entscheidungen getroffen werden, und liest daraus, wenn du am nächsten Tag zurückkommst. Im Laufe der Wochen lernt dein Assistent deine Codebasis kennen.

6. Tools

Tools sind der Weg, wie Schlussfolgerungen in die reale Welt gelangen. Claude Code wird mit den Grundlagen ausgeliefert: Lesen, Schreiben, Bearbeiten, Bash und „MCP“ für externe Dienste.

Skills haben etwas Neues hinzugefügt. Claude kann ein ausführbares Skript ausführen, ohne dessen Implementierung in den Kontext zu laden. Das ist die Idee hinter „MCP -S“ (CLI): Claude folgt einem Protokoll, und die Interna bleiben unsichtbar.

Beispiel: Ein Skill zur Dokumentationsrecherche, der auf Context7-MCPs aufbaut:

# .claude/skills/documentation-research/SKILL.md
 
---
 
name: documentation-research
description: Fetch library docs using Context7 API
 
---
 
## When to Use
 
User needs current documentation for any library
 
## Workflow
 
1. Resolve library ID via Context7
2. Fetch relevant documentation
3. Apply to current task

 
## Tools Available
 
- mcp**context7**resolve-library-id
- mcp**context7**get-library-docs

Claude greift über die Skill-Schnittstelle auf die MCP-Tools zu. Protokollgesteuert, kontexteffizient, kein Lesen des Quellcodes erforderlich.

Echte Beispiele, die den Unterschied deutlich machen

Der einfachste Weg, Context Engineering zu verstehen, ist, dieselbe Aufgabe mit schlechtem Kontext und optimiertem Kontext zu vergleichen.

Beispiel 1: Sicherheits-Triage

Schlechte Version:

claude "check if this auth flow is secure"

Diese Eingabeaufforderung ist zu weit gefasst. Claude hat kein Bedrohungsmodell, keine Systemgrenzen und keine Ahnung, welcher Code relevant ist.

Optimierte Version:

claude "Review the password reset flow for account-takeover risk.

Scope: - src/auth/reset.ts
- app/api/reset-password/route.ts
- middleware/session.ts

 Focus: - token generation and expiry
- user enumeration
- rate limiting
- replay risk

 Output: 1. concrete issues
2. exploit path
3. exact fix
4. regression test plan"

Gleiches Modell. Anderes Ergebnis. Die zweite Version gibt Claude eine Systemgrenze, eine Angriffsperspektive und einen Output-Vertrag. Das ist Context Engineering.

Beispiel 2: Umfangreiche Refaktorisierung

Schlechte Version:

claude "migrate our forms to the new validation layer"

Optimierte Version:

claude "Migrate signup + billing forms from ad-hoc validation to Zod.

Read first: - docs/forms/validation-plan.md
- components/forms/*

 Do not touch: - admin flows
- onboarding wizard

 Definition of done: - shared schema extracted
- client + server validation aligned
- error copy preserved
- tests updated for changed messages"

Der Unterschied liegt nicht in der Feinschliff der Prompt-Formulierung. Es ist der kontrollierte Umfang. Claude weiß jetzt, was er lesen soll, was er nicht anfassen darf und was als fertig gilt.

Beispiel 3: Pipeline zur Inhaltserstellung

Schlechte Version:

claude "write a post about Claude Code hooks"

Optimierte Version:

claude "Write a hooks article for technical readers evaluating Claude Code.

Use: - existing hooks-guide.mdx
- permission-hook-guide.mdx
- session-lifecycle-hooks.mdx

 Must include: - one production workflow
- one failure mode
- one copy-paste config example
- internal links to the three related guides

 Avoid: - generic 'AI changes everything' framing
- repeating definitions already covered in the linked pages"

Jetzt schreibt Claude nicht mehr ins Leere. Er schreibt in ein echtes Content-System mit bekannten Nachbarn, Überschneidungsbeschränkungen und Qualitätsanforderungen.

Wo sich Context Engineering am meisten auszahlt

Der Nutzen ist am größten, wenn die Aufgabe entweder mit hohem Risiko oder hoher Mehrdeutigkeit verbunden ist:

Aufgabentyp	Warum Context Engineering wichtig ist
Sicherheitsüberprüfungen	Du benötigst einen klaren Umfang, ein Bedrohungsmodell und Schwellenwerte für die Beweisführung
Fehlerbehebung in der Produktion	Zu viele irrelevante Vorgeschichten lenken das Modell in die falsche Richtung
Migrationen	Grenzkontrolle ist wichtiger als reine Informationen
Lang andauernde Agent-Workflows	Der Kontextverfall verstärkt sich über viele Schritte hinweg
SEO / Content-Systeme	Modelle brauchen Überlappungskontrolle, damit sich Seiten nicht gegenseitig kannibalisieren

Wenn die Aufgabe kostengünstig, ungenau und reversibel ist, kann man mit einem schlampigen Kontext leben. Wenn die Aufgabe teuer oder riskant ist, schafft ein schlampiger Kontext nur falsche Sicherheit.

Das Framework implementieren

Heute: Überprüfe deine CLAUDE.md. Ist sie für das Abrufen ausgelegt? Befinden sich die Muster, die dir wichtig sind, an einer Stelle, an der Claude sie finden kann?

Diese Woche: Erstelle Skills für die Workflows, die du wiederholt ausführst. Jeder Skill schützt vor Kontextverwirrung, da Fachwissen bei Bedarf geladen wird.

Laufend: Achte auf die vier Fehlermodi. In dem Moment, in dem Claude alte Fehler wiederholt oder ignoriert, was du gesagt hast, hat die Kontamination eingesetzt. Fang von vorne an.

Das Fazit

Zuverlässige Ergebnisse sind kein Problem größerer Modelle. Es ist ein Problem des Informationsflusses.

Die sechs Säulen ergänzen sich:

Agenten verteilen den Kontext auf Spezialisten
Die Abfrageerweiterung verfeinert unübersichtliche Eingaben
Die Abfrage (über CLAUDE.md/Skills) bringt relevante Informationen ans Licht
Prompting-Ebenen liefern Informationen strategisch
Der Speicher behält den Status über mehrere Sitzungen hinweg bei
Tools erweitern die Funktionen effizient

Wenn du das richtig machst, wird Claude Code zu einem Programmierpartner, dem du jede Idee anvertrauen und die Umsetzung überlassen kannst.

Nächste Schritte:

Leitfaden zum 1-Mio.-Kontextfenster für die neuesten Informationen zur GA-Verfügbarkeit und einheitlichen Preisgestaltung
Verwaltung des Kontextpuffers zum Verständnis der 33K-Reservierung
Kontextverwaltung zur Token-Optimierung
Speicheroptimierung für Persistenzstrategien
Skills-Leitfaden zum Laden von Fachwissen auf Abruf
Sub-Agent-Design für Multi-Agent-Architekturen

Kontext Technik

On this page