Build This Now
Build This Now
Claude Code ModelleClaude Opus 4.5 in Claude CodeClaude Opus 4.7Claude Opus 4.7 AnwendungsfälleClaude Opus 4.6Claude Sonnet 4.6Claude Opus 4.5Claude Sonnet 4.5Claude Haiku 4.5Claude Opus 4.1Claude 4Claude 3.7 SonnetClaude 3.5 Sonnet v2 und Claude 3.5 HaikuClaude 3.5 SonnetClaude 3Alle Claude-Modelle
speedy_devvkoen_salo
Blog/Model Picker/Claude Opus 4.5 in Claude Code

Claude Opus 4.5 in Claude Code

Setze Claude Opus 4.5 mit zwei Befehlen als Standard in Claude Code. 76% weniger Output-Tokens als Sonnet 4.5, 50% weniger Tool-Calls, $5/$25, gleiches 200K-Fenster.

Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.

SaaS-Builder-Vorlagen mit KI-Orchestrierung.

Published Mar 4, 2026Model Picker hub

Deine Claude Code-Rechnung besteht größtenteils aus Output-Tokens. Opus 4.5 senkt diese Rechnung um 67% und schreibt dabei saubereren Code. Hier zeige ich dir, wie du es aktivierst und was sich danach ändert.

Quick Win: Opus 4.5 als Standard-Modell setzen und eine Session öffnen:

claude config set model claude-opus-4-5-20251101
claude

Du läufst jetzt mit dem token-effizientesten Coding-Modell, das verfügbar ist.

Token-Effizienz

Das ist kein Marketing-Text. GitHub berichtet, Opus 4.5 "übertrifft interne Coding-Benchmarks und halbiert dabei den Token-Verbrauch." Replit sagt, es "schlägt Sonnet 4.5 und den Wettbewerb in unseren internen Benchmarks und löst dieselben Probleme mit weniger Tokens."

So sieht das im Alltag aus:

MetricImprovement
Output tokens vs Sonnet 4.576% reduction
Tool calls per task50% fewer
Long-running tasksUp to 65% reduction
With Tool Search enabled85% reduction

Weniger Tokens bedeutet schnellere Antworten, niedrigere Kosten und mehr Spielraum, bevor du das Kontext-Limit erreichst.

Für Sub-Agent-Delegation gebaut

Opus 4.5 schreibt bessere Prompts für Sub-Agents als jedes andere Claude-Modell. Anthropic hat es gezielt für Delegation trainiert.

Das zahlt sich aus, wenn du parallele Agents für Tests, Code-Generierung oder Aufgabenverteilung betreibst. Der Lead-Agent gibt Arbeit sauberer weiter:

# Example: Running parallel browser tests
claude "Run 4 parallel test agents against staging -
test login flow, checkout, search, and user settings"

Das Modell übernimmt die Koordination. Jeder Sub-Agent bekommt klare, spezifische Anweisungen. Ergebnisse kommen ohne das Chaos früherer Modelle zurück.

Der Effort-Parameter

Neue API-Kontrolle, um Geschwindigkeit gegen Gründlichkeit abzuwägen. Pro Call einstellbar, ohne das Modell zu wechseln:

const response = await anthropic.messages.create({
  model: "claude-opus-4-5-20251101",
  max_tokens: 8192,
  thinking: {
    type: "enabled",
    budget_tokens: 10000, // Low: 1024, Medium: 5000, High: 10000+
  },
  messages: [{ role: "user", content: prompt }],
});

Low Effort für schnelle Fragen. High Effort für große Refactors. Du bestimmst das Thinking-Budget pro Call.

Auto-Compaction für lange Sessions

Du triffst 95% deines 200K-Kontextfensters? Claude komprimiert ältere Nachrichten automatisch und behält dabei deine gesamte Chat-Historie. Alex Albert nennt das "effektiv unendlichen Kontext."

Manuelle Kontrolle ist verfügbar, wenn du sie willst:

/compact

Best Practice: An logischen Meilensteinen komprimieren, statt auf den automatischen Auslöser zu warten. So behältst du in den wichtigen Teilen mehr Detail.

Wenn Dinge schiefgehen

Fehler: "model not found". Aktualisiere deine Claude Code-Installation:

npm update -g @anthropic-ai/claude-code

Fehler: "rate limit exceeded". Opus 4.5 hat eigene Limits, getrennt von Sonnet. Prüf dein Plan-Tier oder füge eine kurze Verzögerung zwischen Anfragen ein.

Fehler: "context too long". Führe /compact manuell aus oder teile die Aufgabe in kleinere Stücke. Für tiefere Muster schau dir die Memory-Optimierung an.

Was das für deinen Workflow bedeutet

Opus 4.5 ist nicht einfach ein Version-Bump. Es ist eine andere Art zu arbeiten:

  • Mehr delegieren. Übergib komplexe Koordination, der du früheren Modellen nicht anvertrauen würdest.
  • Längere Sessions laufen lassen. Token-Effizienz bedeutet mehr Arbeit, bevor Compaction einsetzt.
  • Weniger zahlen. Ein 67% Kostenrückgang bei gleicher oder besserer Qualität.

Das Modell erreicht 80.9% auf SWE-bench Verified (ein neues Hoch) und führt in 7 von 8 Programmiersprachen. Dein Code funktioniert beim ersten Versuch, nicht beim fünften.

Verwandte Seiten

  • Model Selection für die Frage, wann Opus vs. Sonnet einzusetzen ist
  • Sub-Agent Design Patterns um das Beste aus Delegation herauszuholen
  • Efficiency Patterns für Produktions-Workflows

Update: Claude Opus 4.6 ist jetzt mit 1M-Token-Kontext und nativen Agent-Teams verfügbar. Sieh die vollständige Modell-Timeline für alle Claude-Modelle.

More in Model Picker

  • Alle Claude-Modelle
    Alle Claude-Modelle auf einer Seite: Claude 3, 3.5, 3.7, 4, Opus 4.1 bis 4.6, Sonnet 4.5 und 4.6, Haiku 4.5. Specs, Preise, Benchmarks und wann du welches nutzt.
  • Claude 3.5 Sonnet v2 und Claude 3.5 Haiku
    Claude 3.5 Sonnet v2 und 3.5 Haiku erschienen im Oktober 2024 mit Computer Use Beta, Cursor-Steuerung, verbessertem Coding und Tool-Use, und dem günstigeren Haiku für $0.80/$4.
  • Claude 3.5 Sonnet
    Claude 3.5 Sonnet erschien im Juni 2024 für $3/$15 und übertraf Claude 3 Opus bei MMLU, GPQA, HumanEval zu einem Fünftel der Kosten. Specs, Benchmarks und Coding-Fortschritte.
  • Claude 3.7 Sonnet
    Claude 3.7 Sonnet erschien im Februar 2025 mit hybridem Reasoning und erweitertem Denken. 64K Output, Thinking-Budget-Kontrolle, SWE-bench-Coding-Fortschritte bei $3/$15.
  • Claude 3
    Claude 3 erschien im März 2024 mit Opus, Sonnet und Haiku-Stufen, Vision-Input und 200K-Kontextfenstern. Specs, Benchmark-Scores, Preise und das Drei-Stufen-Template.
  • Claude 4
    Claude 4 erschien im Mai 2025 mit Sonnet 4 und Opus 4 und machte Claude Code zum Mainstream. 200K Kontext, 16K Output, agentische Zuverlässigkeit, Extended Thinking integriert.

Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.

SaaS-Builder-Vorlagen mit KI-Orchestrierung.

On this page

Token-Effizienz
Für Sub-Agent-Delegation gebaut
Der Effort-Parameter
Auto-Compaction für lange Sessions
Wenn Dinge schiefgehen
Was das für deinen Workflow bedeutet
Verwandte Seiten

Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.

SaaS-Builder-Vorlagen mit KI-Orchestrierung.