Sub-Agenten-Routing

Problem: Deine Haupt-Claude Code-Sitzung startet den ganzen Tag Sub-Agenten. Sie hat kein eingebautes Gespür dafür, wann sie nebeneinander, wann verkettet oder wann im Hintergrund laufen sollen. Ohne Routing-Regeln in CLAUDE.md wählt sie einfach eine Option. Oft wählt sie falsch.

Schneller Gewinn: Füge diesen Routing-Block in deine CLAUDE.md ein:

## Sub-Agent Routing Rules
 
**Parallel dispatch** (ALL conditions must be met):
 
- 3+ unrelated tasks or independent domains
- No shared state between tasks
- Clear file boundaries with no overlap
 
**Sequential dispatch** (ANY condition triggers):
 
- Tasks have dependencies (B needs output from A)
- Shared files or state (merge conflict risk)
- Unclear scope (need to understand before proceeding)
 
**Background dispatch**:
 
- Research or analysis tasks (not file modifications)
- Results aren't blocking your current work

Dein Haupt-Thread liest den Block und beginnt selbstständig klügere Übergaben zu machen.

Dein Haupt-Thread ist der Router

Hier ist der Teil, den die meisten übersehen. Claude Code ist nicht ein Modell. Es ist ein kleines Team, und dein Hauptchat ist der Lead. Dieser Lead gibt Arbeit an spezialisierte Sub-Agenten weiter. Alles nachgelagerte funktioniert nur so gut, wie du dem Lead beigebracht hast, Jobs zu verteilen.

Drei Ausführungsmodi existieren im Task-Tool. Jeder passt zu einer anderen Art von Arbeit:

Muster	KI nutzt es wenn	Risiko bei falscher Wahl
Parallel	Unabhängige Domänen, kein Dateiüberlappung	Merge-Konflikte, inkonsistenter Zustand
Sequentiell	Abhängigkeiten vorhanden, geteilte Ressourcen	Verschwendete Zeit für serialisierte unabhängige Arbeit
Hintergrund	Recherche während der Nutzer weiterarbeitet	Verlorene Ergebnisse wenn nicht überprüft

Ignoriere die Regeln und dein Lead fällt auf langsame, vorsichtige, eine-nach-der-anderen-Ausführung zurück. Sicher. Auch langsam.

Parallel: Nach Domäne aufteilen

Parallele Ausführung passt zu Arbeit, die separate Bereiche der Codebasis umspannt. Füge die Domain-Map in CLAUDE.md ein, damit der Lead weiß, wo die Grenzen sind:

## Domain Parallel Patterns
 
When implementing features across domains, spawn parallel agents:
 
- **Frontend agent**: React components, UI state, forms
- **Backend agent**: API routes, server actions, business logic
- **Database agent**: Schema, migrations, queries
 
Each agent owns their domain. No file overlap.

Die harte Regel: Parallel funktioniert nur, wenn Agenten verschiedene Dateien berühren. Dein Lead muss diese Domänengrenzen sehen, um Arbeit sauber aufzuteilen.

Sequentiell: Ketten, die voneinander abhängen

Manche Arbeit ergibt nur in einer bestimmten Reihenfolge Sinn. Schritt zwei braucht, was Schritt eins produziert hat. Der Lead muss diese Linie halten.

Kette	Warum sequentiell
Schema -> API -> Frontend	Datenstruktur muss vor Interfaces existieren
Recherche -> Planung -> Implementierung	Verstehen vor Ausführen
Implementierung -> Testing -> Security	Bauen, validieren, dann prüfen

Liste deine häufigen Ketten in CLAUDE.md. So erkennt der Lead sie und hört auf zu versuchen, eine Kette parallel auszuführen.

Hintergrund: Recherche die dich nicht blockiert

Recherche-artige Aufgaben sollten von selbst in den Hintergrund fallen, damit du weiterarbeiten kannst. Drücke Ctrl+B während eines Sub-Agenten-Laufs, oder richte die Regel von Anfang an ein:

## Background Execution Rules
 
Run in background automatically:
 
- Web research and documentation lookups
- Codebase exploration and analysis
- Security audits and performance profiling
- Any task where results aren't immediately needed

Führe /tasks aus, wann immer du sehen willst, was läuft. Ergebnisse tauchen auf, wenn der Agent fertig ist. Der Leitfaden zu asynchronen Workflows hat die Langversion.

Sub-Agenten-Verhalten konfigurieren

Routing ist eine Schicht. Claude Code gibt dir auch direkte Steuerungsmöglichkeiten für das Verhalten von Sub-Agenten.

Das Sub-Agenten-Modell wählen

CLAUDE_CODE_SUBAGENT_MODEL sagt Claude Code, welches Modell für Sub-Agenten gestartet werden soll. Diese einzelne Variable bewegt den Kosten- und Geschwindigkeitsdregler mehr als fast alles andere:

# Use a lighter model for sub-agents to save tokens
export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-5-20250929"

Eine klare Aufteilung: Opus im Haupt-Thread für das schwere Denken, Sonnet auf den Sub-Agenten für fokussierte Folgearbeit. Token-Ausgaben sinken und die Arbeit landet trotzdem, weil jeder Sub-Agenten-Job bereits gut eingegrenzt ist.

Spezialisten in `.claude/agents/` festlegen

Statt jedes Mal neue Task-Aufrufe zu starten, behalte benannte Spezialisten als Markdown-Dateien mit YAML-Frontmatter in .claude/agents/. Claudes Orchestrator findet sie selbstständig.

.claude/agents/ enthält Projekt-Agenten, die mit dem Repo leben und an dein Team ausgeliefert werden. ~/.claude/agents/ enthält User-Agenten, die dir bei jedem Projekt folgen.

Agenten hier erben deine CLAUDE.md, sodass sie deine Konventionen, Coding-Regeln und Projektbesonderheiten bereits kennen.

Agenten mit Berechtigungsregeln sperren

Task(AgentName)-Regeln in deiner Berechtigungsdatei entscheiden, welche Sub-Agenten überhaupt ausgeführt werden dürfen:

{
  "permissions": {
    "deny": ["Task(Explore)", "Task(Plan)"]
  }
}

Das --disallowedTools-Flag macht dasselbe beim Start:

claude --disallowedTools "Task(Explore)"

Nützlich, um Token-Ausgaben zu begrenzen, oder um autonome Erkundung aus einem Produktions-Repo auszusperren.

Schlechte Aufrufe sind der eigentliche Fehler

Die meisten Sub-Agenten-Probleme liegen nicht in der Ausführung. Es ist der Aufruf, der das ausgelöst hat. Der Lead schickt einen Sub-Agenten mit vagen Anweisungen, fehlendem Kontext und ohne klare Ziellinie los. Der Sub-Agent macht, was er mit dem kann, was er bekommen hat.

Schlechter Aufruf: "Authentifizierung reparieren"

Guter Aufruf: "Fix OAuth redirect loop where successful login redirects to /login instead of /dashboard. Reference the auth middleware in src/lib/auth.ts."

Der Unterschied ist Kontext. Sub-Agenten laufen in ihrem eigenen kurzlebigen Fenster. Sie können mitten im Lauf nicht zurückkommen und fragen, was du meintest. Dein Lead braucht harte Regeln, um beim ersten Mal vollständige Aufrufe zu schreiben.

Hier hören viele CLAUDE.md-Dateien auf. Routing wird behandelt. Aufrufqualität nicht. Ein solides Setup deckt beides ab: jede Delegation trägt vollständigen Kontext, klare Anweisungen, verlinkte Dateien und eine konkrete Definition von "fertig".

Häufige Orchestrierungsfehler

Zu viel parallelisieren: Zehn parallele Agenten für ein kleines Feature verbrennt Token und fügt Koordinationsarbeit hinzu. Kleine, verwandte Aufgaben in einem Agenten gruppieren.

Zu wenig parallelisieren: Vier unabhängige Durchläufe, die nacheinander laufen, obwohl sie gleichzeitig hätten laufen können. Nach Domain-Unabhängigkeit suchen.

Vage Aufrufe: "Implementiere das Feature" ohne Umfang, Dateien oder erwartete Ausgabe.

Wo es weitergeht

Diese Routing-Regeln allein werden schärfen, wie dein Lead Arbeit verteilt. Darauf gibt es noch mehr profi-Orchestrierung:

Konstitutionelle Aufrufanforderungen, die jede Delegation zwingen, die vier Kernbestandteile zu tragen
Agenten-Routing-Tabellen, die Aufgabentypen auf Spezialisten-Agenten abbilden
Kontext-Übergabeprotokolle, die Zustand durch eine sequentielle Kette tragen
Sitzungsbasierte Koordination für die Verfolgung von Mehrschritt-Arbeit

Fang mit den Routing-Regeln an. Füge sie heute in CLAUDE.md ein. Der Lead wird morgen bessere Entscheidungen treffen. Für tiefere Muster lies mehr über Aufgabenverteilung und Agent Fundamentals.

Sub-Agenten-Routing

On this page