Kontextmanagement im Claude Code
Wie man Claude Code-Sitzungen mit 1M-Kontext verwaltet: wann man weitermacht, wann man zurückspult, wann man aufräumt, wann man komprimiert und wann man die Arbeit an Subagenten weitergibt.
Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.
SaaS-Builder-Vorlagen mit KI-Orchestrierung.
Claude Code hat jetzt ein 1-Million-Zeichen-Kontextfenster. Das ändert eine Menge. An der Grundregel ändert sich nichts: Ein größeres Fenster behebt kein schlechtes Sitzungsmanagement.
Was die Ergebnisse tatsächlich beeinflusst, ist die Entscheidung, die du nach jedem Zug triffst:
- in derselben Sitzung weitermachen
/rewindzu einem besseren Zweig/clearund neu anzufangen/compactund die Zusammenfassung beibehalten- den nächsten Abschnitt in einen Subagenten verschieben
Das ist die eigentliche Kontext-Management-Ebene in Claude Code. Die meisten schlechten Sitzungen werden nicht dadurch verursacht, dass das Modell schwach ist. Sie entstehen dadurch, dass der falsche Kontext zu lange mitgeführt wird.
Die offizielle Anthropic-Anleitung vom 15. April 2026 hat diesen Punkt verdeutlicht: Jeder Zug ist ein Verzweigungspunkt. Diese Seite setzt das in ein praktisches Betriebssystem um.
Schneller Erfolg
Wende diese beiden Regeln sofort an:
- Neue Aufgabe, neue Sitzung. Wenn sich die Arbeit wesentlich geändert hat, führe „
/clear“ aus oder starte eine neue „claude“-Sitzung. - Falscher Weg, zurückspulen statt korrigieren. Wenn Claude den falschen Zweig eingeschlagen hat, nutze „
/rewind“, anstatt „das hat nicht funktioniert, versuch stattdessen dies“ auf den veralteten Kontext zu stapeln.
Wenn du dir nur diese beiden Gewohnheiten aneignest, steigt die durchschnittliche Qualität deiner Sitzungen schnell an.
Kontext, Verdichtung und Kontextverfall
Das Kontextfenster ist alles, was das Modell für seine nächste Antwort sehen kann:
- System-Prompt
- deine Konversationshistorie
- Tool-Aufrufe und -Ausgaben
- in den Kontext geladene Dateien
- geladener Speicher und Anweisungen
Claude Code kann viel mehr speichern als früher. Das bedeutet aber nicht, dass der Kontext frei ist.
Wenn der Kontext wächst, kann die Leistung nachlassen. Anthropic nennt das „Context Rot“: Die Aufmerksamkeit verteilt sich auf mehr Tokens, veraltetes Material bleibt hängen, und ältere, irrelevante Details beginnen, mit der Aufgabe zu konkurrieren, die dir gerade wichtig ist.
Wenn das Fenster zu voll wird, komprimiert Claude Code die Sitzung. Das bedeutet, dass die aktuelle Unterhaltung zu einer kürzeren Beschreibung zusammengefasst wird und die Arbeit auf der Grundlage dieser Zusammenfassung fortgesetzt wird. Nützlich, aber mit Verlusten verbunden.
Der entscheidende Fehler ist, den Kontext wie ein Archiv zu behandeln. Er ist kein Archiv. Er ist aktives Arbeitsgedächtnis.
Jeder Zug ist ein Verzweigungspunkt
Sobald Claude einen Zug beendet hat, stehen dir mehrere gültige Züge zur Verfügung. Der richtige hängt davon ab, ob der aktuelle Kontext noch tragfähig ist.
| Situation | Greife nach | Warum |
|---|---|---|
| Gleiche Aufgabe, aktueller Kontext spielt noch eine Rolle | Weiter | Zahle nicht dafür, einen nützlichen Zustand neu aufzubauen |
| Claude ist den falschen Weg gegangen | /rewind | Behalte nützliche Lesevorgänge, verwerfe den fehlgeschlagenen Zweig |
| Gleiche Aufgabe, aber die Sitzung ist mit veralteten Erkundungen überladen | /compact | Behalte das Wesentliche, lass den Ballast weg |
| Du beginnst eine wirklich neue Aufgabe | /clear oder eine neue Sitzung | Kein Kontextverfall, volle Kontrolle darüber, was übernommen wird |
| Der nächste Schritt wird viele Zwischenergebnisse erzeugen, die du nicht mehr brauchst | Subagent | Behalte das Rauschen in einem untergeordneten Kontext, bringe nur das Ergebnis zurück |
Wenn du dir eine Tabelle von dieser Seite merken willst, dann nimm diese.
Fünf alltägliche Szenarien
Hier kommen die Abstraktionen zum Einsatz. Die meisten realen Sitzungen passen in eines dieser Muster.
1. Die Implementierung einer Funktion wird zur Dokumentation
Du hast gerade die Auth-Middleware fertiggestellt und möchtest nun Migrationshinweise und Dokumentation für genau diese Änderung.
Beste Vorgehensweise: Mach in derselben Sitzung weiter
Warum: Der Code, die Entscheidungen und die Randfälle sind immer noch nützlich. Diesen Zustand neu aufzubauen, würde nur Zeit kosten.
2. Claude hat den falschen Implementierungsweg gewählt
Er hat die richtigen Dateien gelesen, sich dann aber für einen Ansatz entschieden, der nicht zur Codebasis passt.
Beste Vorgehensweise: „/rewind“
Warum: Behalte die nützlichen Erkenntnisse, verwerfe den fehlgeschlagenen Zweig.
3. Eine Aufgabe, zu viele Debugging-Reste
Du arbeitest immer noch an derselben Funktion, aber die Sitzung ist voller Fehlstarts und Logs, die in eine Sackgasse führen.
Beste Vorgehensweise: „/compact“ mit einem Hinweis
Warum: Die Aufgabe ist immer noch dieselbe; die Sitzung muss nur etwas ausgedünnt werden.
4. Du wechselst vom Programmieren zur Roadmap-Planung
Verwandter Bereich, andere Aufgabenform.
Beste Vorgehensweise: „/clear“ oder eine neue Sitzung starten
Warum: Die Überbleibsel der Umsetzung sind jetzt größtenteils nur noch Störfaktoren.
5. Du brauchst eine umfassende Überprüfung, aber nur das Ergebnis zählt
Du möchtest eine Nebenuntersuchung in einem anderen Repo, eine Spezifikationsprüfung oder eine umfassende Suche.
Beste Vorgehensweise: subagent
Warum: Halte das Zwischenrauschen aus dem übergeordneten Thread heraus.
Wann du in derselben Sitzung bleiben solltest
Bleib in derselben Sitzung, wenn:
- es sich immer noch um dieselbe Aufgabe handelt
- die Dateien, die Claude gerade gelesen hat, noch direkt relevant sind
- die aktuelle Argumentationskette noch nützlich ist
- das erneute Einlesen von allem langsamer und aufwendiger wäre als die Fortsetzung
Klassisches Beispiel: Du hast gerade eine Funktion implementiert und möchtest nun, dass Claude die Dokumentation genau für diese Funktion schreibt. Ein Neuanfang wäre möglich, aber Claude müsste den Code, den er bereits im Kontext hat, erneut lesen. Wenn die Aufgabe eng damit zusammenhängt und die aktuelle Sitzung noch übersichtlich genug ist, ist es sinnvoll, fortzufahren.
Die Frage lautet nicht „Ist das damit verbunden?“, sondern „Ist der aktuelle Kontext noch hilfreich?“
Wann man eine neue Sitzung starten sollte
Anthropics Faustregel ist einfach: Wenn du eine neue Aufgabe beginnst, solltest du auch eine neue Sitzung starten.
Fang neu an, wenn:
- du von einer Funktion zu einer anderen gewechselt bist
- die Sitzung viele Debugging- oder Erkundungsaktivitäten enthält
- der vorherige Arbeitszweig abgeschlossen ist
- die nächste Aufgabe andere Dateien, andere Ziele oder andere Einschränkungen erfordert
Das ist selbst bei 1M Kontext wichtig. Das größere Fenster gibt dir mehr Spielraum vor der Komprimierung. Es macht irrelevanten Kontext jedoch nicht harmlos.
Gute Beispiele für einen Wechsel in eine neue Sitzung:
- Die Auth-Refactoring ist abgeschlossen, jetzt geht es an die Abrechnung
- Implementierung abgeschlossen, jetzt Roadmap-Planung
- 40 Minuten mit der Fehlerbehebung verbracht, wechsle jetzt zu einem anderen Problem
Wenn du Kontinuität brauchst, schreibe eine kurze Übergabe in die erste Eingabeaufforderung der neuen Sitzung:
We just finished the auth middleware refactor.
What matters for this new task:
- the session format stayed unchanged
- files that matter now are X and Y
- we ruled out approach Z
New task: write the migration notes and docs.Das ist oft übersichtlicher, als die gesamte alte Sitzung mitzunehmen.
Zurückspulen statt korrigieren
/rewind ist eines der wirkungsvollsten Tools für das Sitzungsmanagement in Claude Code und eines der am wenigsten genutzten.
Wenn Claude eine Reihe von Dateien liest, den falschen Ansatz wählt und du darauf reagierst mit:
That didn't work. Try B instead.behältst du den fehlgeschlagenen Versuch, seine Begründung und deine Korrektur alle im selben Kontext. Manchmal ist das in Ordnung. Oft ist es aber nur Verunreinigung.
Besseres Muster:
- Spule zurück bis zu dem Punkt direkt nach der nützlichen Erkundung
- behalte die wertvollen Dateilesevorgänge
- Lass den fehlgeschlagenen Zweig fallen
- Starte von dort aus neu mit dem, was du gelernt hast
Beispiel:
Don't use approach A. The foo module does not expose that.
Go straight to approach B using the existing adapter in src/lib/foo.ts.Dadurch erhält Claude den nützlichen Kontext, ohne dass der schlechte Zweig darüber gestapelt wird.
Zurückspulen ist am besten, wenn:
- die Erkundung nützlich war
- die versuchte Umsetzung falsch war
- du etwas Konkretes gelernt hast
- du die Nachweise behalten möchtest, aber nicht den Fehlpfad
/compact vs. „/clear“
Diese sind nicht austauschbar.
Verwende „/compact“, wenn:
- es sich immer noch um dieselbe Aufgabe handelt
- die Sitzung überladen ist
- du möchtest, dass Claude die wichtigen Erkenntnisse beibehält
- die Arbeit in derselben Richtung weitergeht
Du kannst die Komprimierung steuern:
/compact focus on the auth refactor, drop the test debuggingDas ist besonders nützlich, da dir der 1-M-Kontext nun mehr Zeit gibt, proaktiv zu komprimieren, bevor das Modell seinen schlechtesten Kontextzustand erreicht.
Verwende „/clear“, wenn:
- es sich um eine neue Aufgabe handelt
- du dem aktuellen Kontext nicht mehr vertraust
- du die volle Kontrolle darüber haben willst, was erhalten bleibt
- du den Übergang lieber selbst schreiben möchtest, anstatt einer unvollständigen Zusammenfassung zu vertrauen
Der Unterschied ist einfach:
/compactbittet Claude zu entscheiden, was wichtig war/clearlässt dich entscheiden, was wichtig war
Was führt zu einem schlechten Compact
Anthropics Erklärung ist hier hilfreich: Schlechte Zusammenfassungen entstehen oft, wenn das Modell nicht vorhersagen kann, in welche Richtung deine Arbeit als Nächstes geht.
Beispiel:
- Du verbringst eine lange Sitzung damit, ein Problem zu beheben
- Autocompact wird ausgelöst
- die Zusammenfassung konzentriert sich auf diesen Debugging-Pfad
- deine nächste Eingabe wechselt zu einem anderen, aber verwandten Problem
- die von dir gewünschten Details wurden weggelassen, weil die Zusammenfassung sie für unwichtig hielt
Deshalb ist manuelles „/compact“ in vielen praktischen Anwendungsfällen besser als passives „autocompact“. Du kannst Claude vor der Zusammenfassung mitteilen, in welche Richtung es weitergehen soll.
Eine nützliche Regel:
- Wenn du die nächste Phase kennst, fasse zusammen**, bevor** Claude sie erraten muss
Schlecht:
- 45 Minuten lang debuggen
- Lass die automatische Verdichtung laufen
- dann plötzlich umschwenken
Besser:
- die Debugging-Phase abschließen
/compact focus on the fix plan and the files that matter nextausführen- mit der Implementierung fortfahren
Die zu vermeidenden Anti-Patterns
Schlechtes Kontextmanagement ist meist nicht dramatisch. Es ist nur eine Reihe kleiner, nachlässiger Entscheidungen.
Achte auf Folgendes:
- Eine einzige Marathon-Sitzung für nicht zusammenhängende Aufgaben nutzen
- Einen fehlerhaften Zweig korrigieren, anstatt ihn zurückzusetzen
- Warten auf Autocompact, obwohl du die nächste Phase bereits kennst
- Lärmende Recherchen in der übergeordneten Sitzung zulassen
- „Verwandt“ als ausreichenden Grund anzusehen, um weiterzumachen
Das sind die Gewohnheiten, die ein starkes Modell inkonsistent erscheinen lassen.
Verwende Subagenten, um Zwischenrauschen fernzuhalten
Subagenten sind nicht nur ein Delegationswerkzeug. Sie sind ein Werkzeug zur Kontextverwaltung.
Der anthropische Gedankentest ist überzeugend:
Brauche ich diesen Zwischenergebnis noch einmal oder nur die Schlussfolgerung?
Wenn die Antwort „nur die Schlussfolgerung“ lautet, ist ein Subagent oft die sauberere Lösung.
Gute Kandidaten für Subagenten:
- eine andere Codebasis lesen und ein Muster zusammenfassen
- eine Implementierung anhand einer Spezifikation überprüfen
- Dokumentation aus deinem Git-Diff erstellen
- eine umfassende Suche durchführen, die den Hauptthread nicht überladen soll
- führen eine gezielte Prüfung durch und berichten darüber
Warum das funktioniert:
- Das Kind erhält ein neues Kontextfenster
- Es kann eine Menge Zwischenergebnisse generieren
- nur die endgültige Zusammenfassung wird an den Elternprozess zurückgesendet
Das ist eine der einfachsten Möglichkeiten, eine Hauptsitzung länger nutzbar zu halten.
Die praktischen Sitzungsregeln
Wenn du ein kompaktes Playbook willst, nutze dieses:
Regel 1: Neue Aufgabe, neue Sitzung
Verwandt ist nicht dasselbe wie gleich.
Regel 2: Falscher Zweig, zurückspulen
Stapele keine Korrekturen auf einen fehlgeschlagenen Pfad, wenn der fehlgeschlagene Pfad selbst nun nur noch Rauschen ist.
Regel 3: Gleiche Aufgabe, aufgeblähter Kontext, mit einem Hinweis komprimieren
Warte nicht auf die automatische Komprimierung, wenn du bereits weißt, was erhalten bleiben soll.
Regel 4: Wenn der nächste Schritt verrauscht ist, benutze einen Subagenten
Behalte den übergeordneten Kontext für Entscheidungen, nicht für die Erschöpfung.
Regel 5: Größerer Kontext bedeutet weniger erzwungene Resets, nicht gar keine Resets
1M-Kontext ist ein echtes Upgrade. Es ist keine Immunität.
Was sich durch den 1-M-Kontext tatsächlich geändert hat
Das 1-Million-Fenster hat die Wirtschaftlichkeit des Sitzungsmanagements in dreierlei Hinsicht verändert:
- weniger erzwungene Komprimierungen
- mehr Platz für längere zusammenhängende Aufgaben
- mehr Zeit, proaktiv zu komprimieren, bevor es chaotisch wird
Es hat nichts an der Notwendigkeit geändert:
- bei neuen Aufgaben von vorne anzufangen
- schlechte Verzweigungen zurückzuverfolgen
- vermeiden, dass sich veraltete Debugging-Arbeiten durch nicht damit zusammenhängende Arbeit ziehen
- störende Arbeit an Subagenten zu delegieren
Das größte Missverständnis nach der Veröffentlichung von 1M Context war: „Ich kann jetzt alles in einer Sitzung behalten.“ Technisch gesehen sind längere Sitzungen möglich. Praktisch gesehen willst du aber immer noch klarere Grenzen als das.
/usage und Was zu beachten ist
Anthropic sagt, der neue Befehl „/usage“ sei durch Kundengespräche über lang laufende Sitzungen und das neue 1-Million-Fenster inspiriert worden. Das trifft das eigentliche Problem: Die meisten Nutzer brauchen nicht nur mehr Kontext, sie brauchen auch einen besseren Überblick darüber, wie sie ihn nutzen.
Bei alltäglichen Entscheidungen solltest du auf drei Dinge achten:
- ob die aktuelle Aufgabe noch dieselbe ist
- ob der aktuelle Kontext noch hilfreich ist
- ob der nächste Schritt detaillierte Zwischenergebnisse erfordert oder nur die Schlussfolgerung
Das ist umsetzbarer, als sich nur auf die reine Anzahl der Token zu versteifen.
Eine bessere Gewohnheitsschleife für den Kontext
Wende diese Abfolge an einem echten Arbeitstag an:
- Beginne eine Sitzung mit einer klaren Aufgabe
- Mach weiter, solange der aktuelle Kontext noch nützlich ist
- spule zurück, wenn ein Zweig schiefgeht
- Fasse bei natürlichen Phasenwechseln zusammen, mit einem Hinweis
- Lösche die Sitzung, wenn sich die Aufgabe ändert
- Erzeuge Unteragenten für störende Nebenaufgaben
Das ist das Betriebsmodell.
Ein 30-Sekunden-Entscheidungstest
Wenn du dir unsicher bist, was als Nächstes zu tun ist, stell dir drei Fragen:
- Ist das immer noch dieselbe Aufgabe?
- Ist der aktuelle Kontext immer noch eher hilfreich als hinderlich?
- Werde ich das Zwischenergebnis des nächsten Schritts später noch brauchen?
Wenn die Antworten lauten:
- Ja / Ja / Ja -> weitermachen
- ja / nein / ja -> komprimieren
- ja / ja / nein -> Unteragent
- nein / nein / vielleicht -> löschen und neu starten
Das reicht normalerweise aus, um die richtige Entscheidung zu treffen, ohne zu viel darüber nachzudenken.
Quellen
Verwandte Seiten
Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.
SaaS-Builder-Vorlagen mit KI-Orchestrierung.