Claude Code Modelle

Problem: Viele Entwickler nehmen Opus für jede Aufgabe und verbrennen ihr Budget, oder bleiben bei Haiku wo es nicht mithalten kann. Modelle nach dem tatsächlichen Bedarf zu wechseln kann 60-80% deiner Nutzungskosten einsparen.

Schneller Gewinn: Mach Sonnet jetzt zu deinem Standard-Modell:

claude --model sonnet

Du sparst rund 80% an Kosten und behältst starke Performance bei etwa 90% der täglichen Entwicklungsarbeit.

Modell-Aliasse

Claude Code liefert Aliasse mit, damit du keine Versionsnummern auswendig lernen musst. Das sind die Shortcuts, die du täglich nutzt:

Alias	Verhalten
`default`	Empfohlenes Modell für deinen Account-Typ. Max-Nutzer bekommen automatischen Fallback von Opus zu Sonnet bei Limits
`sonnet`	Neuestes Sonnet-Modell (aktuell Sonnet 4.5) für tägliche Coding-Aufgaben
`opus`	Opus-Modell (aktuell Opus 4.6) für komplexes Reasoning
`haiku`	Schnelles und effizientes Haiku-Modell für einfache Aufgaben
`sonnet[1m]`	Sonnet mit 1-Million-Token-Kontextfenster für lange Sessions (Console/API-Nutzer)
`opusplan`	Nutzt Opus im Plan-Modus, wechselt dann automatisch zu Sonnet für die Ausführung

Der default-Alias richtet sich nach deinem Account-Typ. Bei bestimmten Max-Accounts fällt Claude Code automatisch von Opus auf Sonnet bei einem Nutzungs-Schwellenwert zurück, damit du ohne Unterbrechung weiterarbeiten kannst.

Console- und API-Nutzer bekommen sonnet[1m], das ein 1-Million-Token-Kontextfenster öffnet. Lange Sessions, die sonst das Komprimierungslimit erreichen würden, passen bequem hinein. Extended-Context-Modelle werden zu anderen Tarifen abgerechnet, also behalte das im Hinterkopf.

Console- und API-Nutzer können das [1m]-Suffix auch an einen vollständigen Modellnamen anhängen:

/model anthropic.claude-sonnet-4-5-20250929-v1:0[1m]

Die clevere Modell-Strategie

Die teuerste Gewohnheit ist, ein Modell für alles zu nutzen. Claude Code gibt dir mehrere, jedes auf eine andere Art von Arbeit zugeschnitten. Wechsel zwischen ihnen und du kannst die Nutzungskosten um 80% senken, während die Ergebnisse besser werden.

Sonnet: Dein Alltags-Modell

Am besten für: 90% der Entwicklungsarbeit

# Start Claude Code with Sonnet (usually the default)
claude --model sonnet

Perfekt für:

Feature-Implementierung und Bug-Fixes
Code-Reviews und Refactoring
API-Integration und Datenbankarbeit
Tests und Dokumentation schreiben

Warum Sonnet gewinnt: 90% der Opus-Fähigkeit bei doppelter Geschwindigkeit, trifft selten Nutzungslimits, ideal für Pair-Programming-Workflows.

Opus: Der Schwerlast-Arbeiter

Wann du wechselst: Nur für komplexe Architekturentscheidungen

# Start with Opus for deep analysis sessions
claude --model opus

Nutze Opus für:

Großflächiges Refactoring über mehrere Systeme
Komplexes Debugging mit verworrenen Abhängigkeiten
Architekturentscheidungen, die tiefes Reasoning erfordern
Erweiterte Sicherheitsreviews

Kostenrealität: 5x teurer als Sonnet, aber gerechtfertigt für Aufgaben, die maximale Reasoning-Leistung brauchen.

Haiku: Das Schnell-Modell

Wann du zurückstufst: Einfache, repetitive Aufgaben

# Fast and cheap for basic operations
claude --model haiku

Perfekt für:

Einfache Datei-Reads und Formatierung
Grundlegende Syntax-Validierung
Schnelle Status-Checks
Text-Transformationen

Warnung: Nutz Haiku nicht für echte Entwicklung. Es kämpft bei komplexer Logik und Mehrfachdatei-Projekten.

Opusplan: Das Beste aus beiden Welten

Wann du es nutzt: Komplexe Aufgaben, bei denen du Opus-Reasoning willst, aber nicht alles zu Opus-Preisen

# Hybrid mode: Opus plans, Sonnet executes
claude --model opusplan

So funktioniert es:

Im Plan-Modus: Nutzt Opus für komplexes Reasoning und Architekturentscheidungen
Im Ausführungs-Modus: Wechselt automatisch zu Sonnet für Code-Generierung und Implementierung

Die Planungsphase läuft auf Opus für das tiefe Reasoning, dann fällt die Ausführung auf Sonnet für Geschwindigkeit und Kosten beim Code-Schreiben. Opus-Qualität landet dort, wo sie wichtig ist (am Anfang), und der Rest der Session bleibt günstig.

Refactoring-Sessions, Feature-Planung und jeder Workflow, der sich auf den Plan-Modus stützt, passen gut zu opusplan. Da Opus-Preise nur während der Planung anfallen, dient es gleichzeitig als Kostenoptimierungs-Taktik.

Taktisches Modell-Switching

Fang mit Sonnet an. Eskaliere, wenn die Aufgabe es wirklich verlangt.

Während Entwicklungs-Sessions

# Start your session with Sonnet
claude --model sonnet

# Mid-session: switch to Opus for complex refactoring
/model opus

# Back to Sonnet for regular work
/model sonnet

# Drop to Haiku for simple tasks
/model haiku

Kostenoptimierungs-Muster

Standard: Sonnet für alle normale Entwicklung
Hybrid: opusplan für Sessions, die Planung und Implementierung mischen
Eskalieren: Zu vollem Opus nur wechseln, wenn Sonnet bei Ausführungsaufgaben nicht mehr mitkommt
Delegieren: Haiku für einfache Dateioperationen nutzen
Überwachen: Nutzung tracken, um die Modellauswahl zu optimieren

So läuft deine Rechnung um 60-80% gegenüber einem reinen Opus-Workflow runter.

Modellauswahl nach Aufgabentyp

Code-Analyse-Geschwindigkeits-Ranking

Haiku: Sofort, aber oberflächlich
Sonnet: Schnell mit ausgezeichneter Tiefe
Opus: Langsamer, aber tiefste Analyse

Reasoning-Qualitäts-Ranking

Opus: Überlegen bei komplexen Mehrschritt-Problemen
Sonnet: Ausgezeichnet für die meisten Entwicklungsszenarien
Haiku: Nur grundlegendes Reasoning

Kosten-Effizienz-Ranking

Haiku: Günstigstes pro Aufgabe (begrenzte Fähigkeit)
Sonnet: Beste Performance pro Dollar
Opus: Premium-Preis für Premium-Fähigkeit

Modellkonfiguration

Es gibt mehrere Stellen, an denen du dein Modell setzen kannst, und die Prioritätskette ist strikt. Eine höher priorisierte Einstellung schlägt immer eine niedrigere:

Während der Session: /model <alias|name> wechselt Modelle mitten in der Session (höchste Priorität)
Beim Start: claude --model <alias|name> setzt das Modell für diese Session
Umgebungsvariable: ANTHROPIC_MODEL=<alias|name> bleibt über Sessions hinweg bestehen
Settings-Datei: Das model-Feld in settings.json für dauerhafte Konfiguration (niedrigste Priorität)

Um ein Modell dauerhaft zu fixieren, füg ein model-Feld zu deiner Settings-Datei hinzu:

// ~/.claude/settings.json
{
  "permissions": {},
  "model": "sonnet"
}

Damit musst du nicht mehr jedes Mal --model übergeben, wenn du Claude Code startest.

Steuern, worauf Aliasse zeigen

Einen Alias auf eine bestimmte Version oder auf ein Bedrock- oder Vertex-Deployment zu zeigen geht über Umgebungsvariablen:

Umgebungsvariable	Steuert
`ANTHROPIC_DEFAULT_OPUS_MODEL`	Modell für `opus` und für `opusplan` im Plan-Modus
`ANTHROPIC_DEFAULT_SONNET_MODEL`	Modell für `sonnet` und für `opusplan` bei der Ausführung
`ANTHROPIC_DEFAULT_HAIKU_MODEL`	Modell für `haiku` und Hintergrundfunktionen
`CLAUDE_CODE_SUBAGENT_MODEL`	Modell für Sub-Agenten (überschreibt das Standard-Sub-Agenten-Modell)

Hinweis: ANTHROPIC_SMALL_FAST_MODEL ist veraltet. ANTHROPIC_DEFAULT_HAIKU_MODEL ersetzt es.

Bedrock-, Foundry- und Vertex-Nutzer nutzen diese am meisten, da diese Plattformen Inference-Profile-ARNs, Deployment-Namen oder Versions-Namen statt der Standard-Anthropic-Modell-IDs erwarten.

Dein aktuelles Modell prüfen

Zwei Wege, um zu sehen, auf welchem Modell eine Session läuft:

Führ /status aus, um dein aktuelles Modell und Account-Informationen anzuzeigen
Konfiguriere eine StatusLine, um das Modell dauerhaft in deinem Terminal anzuzeigen

Prompt-Caching-Konfiguration

Prompt-Caching ist in Claude Code standardmäßig aktiviert und hilft bei Performance und Kosten. Wenn du es ausschalten musst, zum Debuggen, Benchmarken oder für ein bestimmtes API-Setup, steuern diese Umgebungsvariablen es:

Umgebungsvariable	Effekt
`DISABLE_PROMPT_CACHING`	Deaktiviert Caching für alle Modelle (überschreibt pro-Modell)
`DISABLE_PROMPT_CACHING_HAIKU`	Deaktiviert Caching nur für Haiku-Modelle
`DISABLE_PROMPT_CACHING_SONNET`	Deaktiviert Caching nur für Sonnet-Modelle
`DISABLE_PROMPT_CACHING_OPUS`	Deaktiviert Caching nur für Opus-Modelle

Setz eine davon auf 1, um Caching auszuschalten. Das globale DISABLE_PROMPT_CACHING hat Vorrang vor den pro-Modell-Flags. Caching zu deaktivieren erhöht Kosten und Latenz, also tu es nur wenn es einen guten Grund gibt.

Häufige Fehler bei der Modellauswahl

Fehler 1: Opus für alles nutzen

Problem: 5x höhere Kosten bei langsameren Antworten
Lösung: Standardmäßig Sonnet, gezielt eskalieren

Fehler 2: Zu lange bei Haiku bleiben

Problem: Schlechte Code-Qualität, übersehene Probleme
Lösung: Für echte Entwicklung zu Sonnet wechseln

Fehler 3: Modelle nicht mitten in der Session wechseln

Problem: Falsches Modell für die aktuelle Aufgabe
Lösung: /model opus oder /model sonnet für sofortigen Wechsel nutzen

Kurzreferenz

Aufgabentyp	Empfohlenes Modell	Warum
Tägliches Coding	Sonnet	Beste Balance aus Geschwindigkeit und Fähigkeit
Planen + Implementieren	opusplan	Opus-Reasoning für Pläne, Sonnet für Code
Komplexe Architektur	Opus	Maximale Reasoning-Tiefe
Einfache Dateioperationen	Haiku	Schnell und günstig
Lange Sessions	sonnet[1m]	1M-Token-Fenster vermeidet Komprimierung
Debugging	Mit Sonnet starten, bei Bedarf zu Opus eskalieren	Progressive Eskalation

Für Einsteiger: Mit Sonnet anfangen, um Workflows zu lernen.

Für tägliche Entwicklung: Sonnet als Standard mit Opus für komplexes Debugging.

Für Budget-Optimierung: Strategisches Wechseln je nach Aufgabenkomplexität.

Zum Lernen: Schau in unseren Konfigurations-Guide zum Einrichten von Modell-Defaults.

Wähl das richtige Modell pro Aufgabe und du schreibst Code schneller und gibst weniger aus. Sonnets ausgewogene Leistung erledigt den Großteil der Arbeit. Opus ist für die Teile, die seine Tiefe wirklich brauchen.

Nächster Schritt: Richte deine optimale Modellkonfiguration mit unserem Performance-Optimierungs-Guide ein und lern dann fortgeschrittene Kontext-Management-Techniken.

Für detaillierte Specs zu jedem Claude-Modell, das Anthropic veröffentlicht hat, schau in die vollständige Modell-Chronologie.

Verwandte Guides:

Deep Thinking Techniques: Wann Extended Thinking mit Opus einsetzen
Efficiency Patterns: Frameworks für konsistente Ausgaben aufbauen
Usage Optimization: Kosten tracken und senken

Claude Code Modelle

On this page