Sub-Agenten-Routing
Ein CLAUDE.md-Routing-Block, der deinem Claude Code-Haupt-Thread beibringt, wann Sub-Agenten parallel, sequentiell oder im Hintergrund gestartet werden sollen. Kopieren und einfügen.
Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.
SaaS-Builder-Vorlagen mit KI-Orchestrierung.
Problem: Deine Haupt-Claude Code-Sitzung startet den ganzen Tag Sub-Agenten. Sie hat kein eingebautes Gespür dafür, wann sie nebeneinander, wann verkettet oder wann im Hintergrund laufen sollen. Ohne Routing-Regeln in CLAUDE.md wählt sie einfach eine Option. Oft wählt sie falsch.
Schneller Gewinn: Füge diesen Routing-Block in deine CLAUDE.md ein:
## Sub-Agent Routing Rules
**Parallel dispatch** (ALL conditions must be met):
- 3+ unrelated tasks or independent domains
- No shared state between tasks
- Clear file boundaries with no overlap
**Sequential dispatch** (ANY condition triggers):
- Tasks have dependencies (B needs output from A)
- Shared files or state (merge conflict risk)
- Unclear scope (need to understand before proceeding)
**Background dispatch**:
- Research or analysis tasks (not file modifications)
- Results aren't blocking your current workDein Haupt-Thread liest den Block und beginnt selbstständig klügere Übergaben zu machen.
Dein Haupt-Thread ist der Router
Hier ist der Teil, den die meisten übersehen. Claude Code ist nicht ein Modell. Es ist ein kleines Team, und dein Hauptchat ist der Lead. Dieser Lead gibt Arbeit an spezialisierte Sub-Agenten weiter. Alles nachgelagerte funktioniert nur so gut, wie du dem Lead beigebracht hast, Jobs zu verteilen.
Drei Ausführungsmodi existieren im Task-Tool. Jeder passt zu einer anderen Art von Arbeit:
| Muster | KI nutzt es wenn | Risiko bei falscher Wahl |
|---|---|---|
| Parallel | Unabhängige Domänen, kein Dateiüberlappung | Merge-Konflikte, inkonsistenter Zustand |
| Sequentiell | Abhängigkeiten vorhanden, geteilte Ressourcen | Verschwendete Zeit für serialisierte unabhängige Arbeit |
| Hintergrund | Recherche während der Nutzer weiterarbeitet | Verlorene Ergebnisse wenn nicht überprüft |
Ignoriere die Regeln und dein Lead fällt auf langsame, vorsichtige, eine-nach-der-anderen-Ausführung zurück. Sicher. Auch langsam.
Parallel: Nach Domäne aufteilen
Parallele Ausführung passt zu Arbeit, die separate Bereiche der Codebasis umspannt. Füge die Domain-Map in CLAUDE.md ein, damit der Lead weiß, wo die Grenzen sind:
## Domain Parallel Patterns
When implementing features across domains, spawn parallel agents:
- **Frontend agent**: React components, UI state, forms
- **Backend agent**: API routes, server actions, business logic
- **Database agent**: Schema, migrations, queries
Each agent owns their domain. No file overlap.Die harte Regel: Parallel funktioniert nur, wenn Agenten verschiedene Dateien berühren. Dein Lead muss diese Domänengrenzen sehen, um Arbeit sauber aufzuteilen.
Sequentiell: Ketten, die voneinander abhängen
Manche Arbeit ergibt nur in einer bestimmten Reihenfolge Sinn. Schritt zwei braucht, was Schritt eins produziert hat. Der Lead muss diese Linie halten.
| Kette | Warum sequentiell |
|---|---|
| Schema -> API -> Frontend | Datenstruktur muss vor Interfaces existieren |
| Recherche -> Planung -> Implementierung | Verstehen vor Ausführen |
| Implementierung -> Testing -> Security | Bauen, validieren, dann prüfen |
Liste deine häufigen Ketten in CLAUDE.md. So erkennt der Lead sie und hört auf zu versuchen, eine Kette parallel auszuführen.
Hintergrund: Recherche die dich nicht blockiert
Recherche-artige Aufgaben sollten von selbst in den Hintergrund fallen, damit du weiterarbeiten kannst. Drücke Ctrl+B während eines Sub-Agenten-Laufs, oder richte die Regel von Anfang an ein:
## Background Execution Rules
Run in background automatically:
- Web research and documentation lookups
- Codebase exploration and analysis
- Security audits and performance profiling
- Any task where results aren't immediately neededFühre /tasks aus, wann immer du sehen willst, was läuft. Ergebnisse tauchen auf, wenn der Agent fertig ist. Der Leitfaden zu asynchronen Workflows hat die Langversion.
Sub-Agenten-Verhalten konfigurieren
Routing ist eine Schicht. Claude Code gibt dir auch direkte Steuerungsmöglichkeiten für das Verhalten von Sub-Agenten.
Das Sub-Agenten-Modell wählen
CLAUDE_CODE_SUBAGENT_MODEL sagt Claude Code, welches Modell für Sub-Agenten gestartet werden soll. Diese einzelne Variable bewegt den Kosten- und Geschwindigkeitsdregler mehr als fast alles andere:
# Use a lighter model for sub-agents to save tokens
export CLAUDE_CODE_SUBAGENT_MODEL="claude-sonnet-4-5-20250929"Eine klare Aufteilung: Opus im Haupt-Thread für das schwere Denken, Sonnet auf den Sub-Agenten für fokussierte Folgearbeit. Token-Ausgaben sinken und die Arbeit landet trotzdem, weil jeder Sub-Agenten-Job bereits gut eingegrenzt ist.
Spezialisten in .claude/agents/ festlegen
Statt jedes Mal neue Task-Aufrufe zu starten, behalte benannte Spezialisten als Markdown-Dateien mit YAML-Frontmatter in .claude/agents/. Claudes Orchestrator findet sie selbstständig.
.claude/agents/ enthält Projekt-Agenten, die mit dem Repo leben und an dein Team ausgeliefert werden. ~/.claude/agents/ enthält User-Agenten, die dir bei jedem Projekt folgen.
Agenten hier erben deine CLAUDE.md, sodass sie deine Konventionen, Coding-Regeln und Projektbesonderheiten bereits kennen.
Agenten mit Berechtigungsregeln sperren
Task(AgentName)-Regeln in deiner Berechtigungsdatei entscheiden, welche Sub-Agenten überhaupt ausgeführt werden dürfen:
{
"permissions": {
"deny": ["Task(Explore)", "Task(Plan)"]
}
}Das --disallowedTools-Flag macht dasselbe beim Start:
claude --disallowedTools "Task(Explore)"
Nützlich, um Token-Ausgaben zu begrenzen, oder um autonome Erkundung aus einem Produktions-Repo auszusperren.
Schlechte Aufrufe sind der eigentliche Fehler
Die meisten Sub-Agenten-Probleme liegen nicht in der Ausführung. Es ist der Aufruf, der das ausgelöst hat. Der Lead schickt einen Sub-Agenten mit vagen Anweisungen, fehlendem Kontext und ohne klare Ziellinie los. Der Sub-Agent macht, was er mit dem kann, was er bekommen hat.
Schlechter Aufruf: "Authentifizierung reparieren"
Guter Aufruf: "Fix OAuth redirect loop where successful login redirects to /login instead of /dashboard. Reference the auth middleware in src/lib/auth.ts."
Der Unterschied ist Kontext. Sub-Agenten laufen in ihrem eigenen kurzlebigen Fenster. Sie können mitten im Lauf nicht zurückkommen und fragen, was du meintest. Dein Lead braucht harte Regeln, um beim ersten Mal vollständige Aufrufe zu schreiben.
Hier hören viele CLAUDE.md-Dateien auf. Routing wird behandelt. Aufrufqualität nicht. Ein solides Setup deckt beides ab: jede Delegation trägt vollständigen Kontext, klare Anweisungen, verlinkte Dateien und eine konkrete Definition von "fertig".
Häufige Orchestrierungsfehler
Zu viel parallelisieren: Zehn parallele Agenten für ein kleines Feature verbrennt Token und fügt Koordinationsarbeit hinzu. Kleine, verwandte Aufgaben in einem Agenten gruppieren.
Zu wenig parallelisieren: Vier unabhängige Durchläufe, die nacheinander laufen, obwohl sie gleichzeitig hätten laufen können. Nach Domain-Unabhängigkeit suchen.
Vage Aufrufe: "Implementiere das Feature" ohne Umfang, Dateien oder erwartete Ausgabe.
Wo es weitergeht
Diese Routing-Regeln allein werden schärfen, wie dein Lead Arbeit verteilt. Darauf gibt es noch mehr profi-Orchestrierung:
- Konstitutionelle Aufrufanforderungen, die jede Delegation zwingen, die vier Kernbestandteile zu tragen
- Agenten-Routing-Tabellen, die Aufgabentypen auf Spezialisten-Agenten abbilden
- Kontext-Übergabeprotokolle, die Zustand durch eine sequentielle Kette tragen
- Sitzungsbasierte Koordination für die Verfolgung von Mehrschritt-Arbeit
Fang mit den Routing-Regeln an. Füge sie heute in CLAUDE.md ein. Der Lead wird morgen bessere Entscheidungen treffen. Für tiefere Muster lies mehr über Aufgabenverteilung und Agent Fundamentals.
Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.
SaaS-Builder-Vorlagen mit KI-Orchestrierung.