Claude Code Modelle
Das richtige Claude Code Modell wählen: Sonnet, Opus, Haiku, sonnet[1m] oder opusplan. Aufgabenbasiertes Wechseln senkt die Modellkosten um 60-80% ohne Qualitätsverlust.
Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.
SaaS-Builder-Vorlagen mit KI-Orchestrierung.
Problem: Viele Entwickler nehmen Opus für jede Aufgabe und verbrennen ihr Budget, oder bleiben bei Haiku wo es nicht mithalten kann. Modelle nach dem tatsächlichen Bedarf zu wechseln kann 60-80% deiner Nutzungskosten einsparen.
Schneller Gewinn: Mach Sonnet jetzt zu deinem Standard-Modell:
claude --model sonnet
Du sparst rund 80% an Kosten und behältst starke Performance bei etwa 90% der täglichen Entwicklungsarbeit.
Modell-Aliasse
Claude Code liefert Aliasse mit, damit du keine Versionsnummern auswendig lernen musst. Das sind die Shortcuts, die du täglich nutzt:
| Alias | Verhalten |
|---|---|
default | Empfohlenes Modell für deinen Account-Typ. Max-Nutzer bekommen automatischen Fallback von Opus zu Sonnet bei Limits |
sonnet | Neuestes Sonnet-Modell (aktuell Sonnet 4.5) für tägliche Coding-Aufgaben |
opus | Opus-Modell (aktuell Opus 4.6) für komplexes Reasoning |
haiku | Schnelles und effizientes Haiku-Modell für einfache Aufgaben |
sonnet[1m] | Sonnet mit 1-Million-Token-Kontextfenster für lange Sessions (Console/API-Nutzer) |
opusplan | Nutzt Opus im Plan-Modus, wechselt dann automatisch zu Sonnet für die Ausführung |
Der default-Alias richtet sich nach deinem Account-Typ. Bei bestimmten Max-Accounts fällt Claude Code automatisch von Opus auf Sonnet bei einem Nutzungs-Schwellenwert zurück, damit du ohne Unterbrechung weiterarbeiten kannst.
Console- und API-Nutzer bekommen sonnet[1m], das ein 1-Million-Token-Kontextfenster öffnet. Lange Sessions, die sonst das Komprimierungslimit erreichen würden, passen bequem hinein. Extended-Context-Modelle werden zu anderen Tarifen abgerechnet, also behalte das im Hinterkopf.
Console- und API-Nutzer können das [1m]-Suffix auch an einen vollständigen Modellnamen anhängen:
/model anthropic.claude-sonnet-4-5-20250929-v1:0[1m]
Die clevere Modell-Strategie
Die teuerste Gewohnheit ist, ein Modell für alles zu nutzen. Claude Code gibt dir mehrere, jedes auf eine andere Art von Arbeit zugeschnitten. Wechsel zwischen ihnen und du kannst die Nutzungskosten um 80% senken, während die Ergebnisse besser werden.
Sonnet: Dein Alltags-Modell
Am besten für: 90% der Entwicklungsarbeit
# Start Claude Code with Sonnet (usually the default)
claude --model sonnetPerfekt für:
- Feature-Implementierung und Bug-Fixes
- Code-Reviews und Refactoring
- API-Integration und Datenbankarbeit
- Tests und Dokumentation schreiben
Warum Sonnet gewinnt: 90% der Opus-Fähigkeit bei doppelter Geschwindigkeit, trifft selten Nutzungslimits, ideal für Pair-Programming-Workflows.
Opus: Der Schwerlast-Arbeiter
Wann du wechselst: Nur für komplexe Architekturentscheidungen
# Start with Opus for deep analysis sessions
claude --model opusNutze Opus für:
- Großflächiges Refactoring über mehrere Systeme
- Komplexes Debugging mit verworrenen Abhängigkeiten
- Architekturentscheidungen, die tiefes Reasoning erfordern
- Erweiterte Sicherheitsreviews
Kostenrealität: 5x teurer als Sonnet, aber gerechtfertigt für Aufgaben, die maximale Reasoning-Leistung brauchen.
Haiku: Das Schnell-Modell
Wann du zurückstufst: Einfache, repetitive Aufgaben
# Fast and cheap for basic operations
claude --model haikuPerfekt für:
- Einfache Datei-Reads und Formatierung
- Grundlegende Syntax-Validierung
- Schnelle Status-Checks
- Text-Transformationen
Warnung: Nutz Haiku nicht für echte Entwicklung. Es kämpft bei komplexer Logik und Mehrfachdatei-Projekten.
Opusplan: Das Beste aus beiden Welten
Wann du es nutzt: Komplexe Aufgaben, bei denen du Opus-Reasoning willst, aber nicht alles zu Opus-Preisen
# Hybrid mode: Opus plans, Sonnet executes
claude --model opusplanSo funktioniert es:
- Im Plan-Modus: Nutzt Opus für komplexes Reasoning und Architekturentscheidungen
- Im Ausführungs-Modus: Wechselt automatisch zu Sonnet für Code-Generierung und Implementierung
Die Planungsphase läuft auf Opus für das tiefe Reasoning, dann fällt die Ausführung auf Sonnet für Geschwindigkeit und Kosten beim Code-Schreiben. Opus-Qualität landet dort, wo sie wichtig ist (am Anfang), und der Rest der Session bleibt günstig.
Refactoring-Sessions, Feature-Planung und jeder Workflow, der sich auf den Plan-Modus stützt, passen gut zu opusplan. Da Opus-Preise nur während der Planung anfallen, dient es gleichzeitig als Kostenoptimierungs-Taktik.
Taktisches Modell-Switching
Fang mit Sonnet an. Eskaliere, wenn die Aufgabe es wirklich verlangt.
Während Entwicklungs-Sessions
# Start your session with Sonnet
claude --model sonnet
# Mid-session: switch to Opus for complex refactoring
/model opus
# Back to Sonnet for regular work
/model sonnet
# Drop to Haiku for simple tasks
/model haikuKostenoptimierungs-Muster
- Standard: Sonnet für alle normale Entwicklung
- Hybrid:
opusplanfür Sessions, die Planung und Implementierung mischen - Eskalieren: Zu vollem Opus nur wechseln, wenn Sonnet bei Ausführungsaufgaben nicht mehr mitkommt
- Delegieren: Haiku für einfache Dateioperationen nutzen
- Überwachen: Nutzung tracken, um die Modellauswahl zu optimieren
So läuft deine Rechnung um 60-80% gegenüber einem reinen Opus-Workflow runter.
Modellauswahl nach Aufgabentyp
Code-Analyse-Geschwindigkeits-Ranking
- Haiku: Sofort, aber oberflächlich
- Sonnet: Schnell mit ausgezeichneter Tiefe
- Opus: Langsamer, aber tiefste Analyse
Reasoning-Qualitäts-Ranking
- Opus: Überlegen bei komplexen Mehrschritt-Problemen
- Sonnet: Ausgezeichnet für die meisten Entwicklungsszenarien
- Haiku: Nur grundlegendes Reasoning
Kosten-Effizienz-Ranking
- Haiku: Günstigstes pro Aufgabe (begrenzte Fähigkeit)
- Sonnet: Beste Performance pro Dollar
- Opus: Premium-Preis für Premium-Fähigkeit
Modellkonfiguration
Es gibt mehrere Stellen, an denen du dein Modell setzen kannst, und die Prioritätskette ist strikt. Eine höher priorisierte Einstellung schlägt immer eine niedrigere:
- Während der Session:
/model <alias|name>wechselt Modelle mitten in der Session (höchste Priorität) - Beim Start:
claude --model <alias|name>setzt das Modell für diese Session - Umgebungsvariable:
ANTHROPIC_MODEL=<alias|name>bleibt über Sessions hinweg bestehen - Settings-Datei: Das
model-Feld in settings.json für dauerhafte Konfiguration (niedrigste Priorität)
Um ein Modell dauerhaft zu fixieren, füg ein model-Feld zu deiner Settings-Datei hinzu:
// ~/.claude/settings.json
{
"permissions": {},
"model": "sonnet"
}Damit musst du nicht mehr jedes Mal --model übergeben, wenn du Claude Code startest.
Steuern, worauf Aliasse zeigen
Einen Alias auf eine bestimmte Version oder auf ein Bedrock- oder Vertex-Deployment zu zeigen geht über Umgebungsvariablen:
| Umgebungsvariable | Steuert |
|---|---|
ANTHROPIC_DEFAULT_OPUS_MODEL | Modell für opus und für opusplan im Plan-Modus |
ANTHROPIC_DEFAULT_SONNET_MODEL | Modell für sonnet und für opusplan bei der Ausführung |
ANTHROPIC_DEFAULT_HAIKU_MODEL | Modell für haiku und Hintergrundfunktionen |
CLAUDE_CODE_SUBAGENT_MODEL | Modell für Sub-Agenten (überschreibt das Standard-Sub-Agenten-Modell) |
Hinweis: ANTHROPIC_SMALL_FAST_MODEL ist veraltet. ANTHROPIC_DEFAULT_HAIKU_MODEL ersetzt es.
Bedrock-, Foundry- und Vertex-Nutzer nutzen diese am meisten, da diese Plattformen Inference-Profile-ARNs, Deployment-Namen oder Versions-Namen statt der Standard-Anthropic-Modell-IDs erwarten.
Dein aktuelles Modell prüfen
Zwei Wege, um zu sehen, auf welchem Modell eine Session läuft:
- Führ
/statusaus, um dein aktuelles Modell und Account-Informationen anzuzeigen - Konfiguriere eine StatusLine, um das Modell dauerhaft in deinem Terminal anzuzeigen
Prompt-Caching-Konfiguration
Prompt-Caching ist in Claude Code standardmäßig aktiviert und hilft bei Performance und Kosten. Wenn du es ausschalten musst, zum Debuggen, Benchmarken oder für ein bestimmtes API-Setup, steuern diese Umgebungsvariablen es:
| Umgebungsvariable | Effekt |
|---|---|
DISABLE_PROMPT_CACHING | Deaktiviert Caching für alle Modelle (überschreibt pro-Modell) |
DISABLE_PROMPT_CACHING_HAIKU | Deaktiviert Caching nur für Haiku-Modelle |
DISABLE_PROMPT_CACHING_SONNET | Deaktiviert Caching nur für Sonnet-Modelle |
DISABLE_PROMPT_CACHING_OPUS | Deaktiviert Caching nur für Opus-Modelle |
Setz eine davon auf 1, um Caching auszuschalten. Das globale DISABLE_PROMPT_CACHING hat Vorrang vor den pro-Modell-Flags. Caching zu deaktivieren erhöht Kosten und Latenz, also tu es nur wenn es einen guten Grund gibt.
Häufige Fehler bei der Modellauswahl
Fehler 1: Opus für alles nutzen
- Problem: 5x höhere Kosten bei langsameren Antworten
- Lösung: Standardmäßig Sonnet, gezielt eskalieren
Fehler 2: Zu lange bei Haiku bleiben
- Problem: Schlechte Code-Qualität, übersehene Probleme
- Lösung: Für echte Entwicklung zu Sonnet wechseln
Fehler 3: Modelle nicht mitten in der Session wechseln
- Problem: Falsches Modell für die aktuelle Aufgabe
- Lösung:
/model opusoder/model sonnetfür sofortigen Wechsel nutzen
Kurzreferenz
| Aufgabentyp | Empfohlenes Modell | Warum |
|---|---|---|
| Tägliches Coding | Sonnet | Beste Balance aus Geschwindigkeit und Fähigkeit |
| Planen + Implementieren | opusplan | Opus-Reasoning für Pläne, Sonnet für Code |
| Komplexe Architektur | Opus | Maximale Reasoning-Tiefe |
| Einfache Dateioperationen | Haiku | Schnell und günstig |
| Lange Sessions | sonnet[1m] | 1M-Token-Fenster vermeidet Komprimierung |
| Debugging | Mit Sonnet starten, bei Bedarf zu Opus eskalieren | Progressive Eskalation |
Für Einsteiger: Mit Sonnet anfangen, um Workflows zu lernen.
Für tägliche Entwicklung: Sonnet als Standard mit Opus für komplexes Debugging.
Für Budget-Optimierung: Strategisches Wechseln je nach Aufgabenkomplexität.
Zum Lernen: Schau in unseren Konfigurations-Guide zum Einrichten von Modell-Defaults.
Wähl das richtige Modell pro Aufgabe und du schreibst Code schneller und gibst weniger aus. Sonnets ausgewogene Leistung erledigt den Großteil der Arbeit. Opus ist für die Teile, die seine Tiefe wirklich brauchen.
Nächster Schritt: Richte deine optimale Modellkonfiguration mit unserem Performance-Optimierungs-Guide ein und lern dann fortgeschrittene Kontext-Management-Techniken.
Für detaillierte Specs zu jedem Claude-Modell, das Anthropic veröffentlicht hat, schau in die vollständige Modell-Chronologie.
Verwandte Guides:
- Deep Thinking Techniques: Wann Extended Thinking mit Opus einsetzen
- Efficiency Patterns: Frameworks für konsistente Ausgaben aufbauen
- Usage Optimization: Kosten tracken und senken
Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.
SaaS-Builder-Vorlagen mit KI-Orchestrierung.