Claude 3.5 Sonnet

Claude 3.5 Sonnet ist das Release, bei dem Entwickler aufgehört haben, standardmäßig zum größten Modell zu greifen. Anthropic veröffentlichte es am 20. Juni 2024, und von Tag eins an drehte sich die Preis-Rechnung um. Ein Mid-Tier-Modell mit $3-Input erzielte bei den meisten öffentlichen Evals Ergebnisse auf oder über dem Flaggschiff mit $15-Input. Größer bedeutete nicht mehr automatisch besser.

Wichtige Specs

Spec	Details
API ID	`claude-3-5-sonnet-20240620`
Kontextfenster	200K Tokens
Input-Preis	$3 / 1M Tokens
Output-Preis	$15 / 1M Tokens
Veröffentlichungsdatum	20. Juni 2024
Max. Output-Tokens	8.192

Was Claude 3.5 Sonnet brachte

Top-Intelligenz zum Mid-Tier-Preis. Reasoning auf Graduierungsniveau, Wissen auf Bachelor-Niveau, Code-Generierung. Über GPQA, MMLU und HumanEval hielt dieses Release seinen eigenen Vergleich mit Claude 3 Opus oder übertraf es sogar. Und das bei $3 Input und $15 Output pro Million Tokens, neben dem $15/$75-Tier, das das Flaggschiff verlangte. Kein Modell hatte diese beiden Dinge vorher kombiniert.

Coding-Stärke. Das ist die Version, die Claude zu einem echten Werkzeug fürs Code-Schreiben machte. Der Headline-Code-Score kletterte vom 55% des Flaggschiffs auf 64% hier. Viele Entwickler, die noch GPT-4 für ihren Code nutzten, wechselten in diesem Zeitraum. Reasoning plus Output-Qualität machten das zur ersten Wahl für Software-Engineering-Arbeit.

Geschwindigkeit. Die Antwortrate lag bei etwa dem 2-fachen dessen, was das Flaggschiff lieferte. Bei einer interaktiven Coding-Session, einer Chat-UI oder überall, wo Latenz der Engpass ist, merkte man es beim ersten Request.

Der "Sonnet reicht"-Moment. Lange Zeit war die Faustregel simpel. Schwieriger das Problem, größer das Modell. Dieses Release brach diesen Reflex. Teams, die Opus-Preise zahlten, merkten, dass Sonnet sie zur gleichen Antwort (oder einer besseren) für ein Fünftel der Kosten brachte. Von da an begann die Modellauswahl mit Sonnet, nicht oben im Menü.

Direktvergleich mit Claude 3 Opus

Benchmark	Claude 3 Opus	Claude 3.5 Sonnet
MMLU	86,8%	88,7%
GPQA	50,4%	59,4%
HumanEval	55%	64%
GSM8K	95,0%	96,4%

Jede Zeile spricht für das günstigere Modell. Die Tabelle machte ihr eigenes Argument.

Das fehlende Claude 3.5 Opus

Beim Claude 3.5 Sonnet-Launch nannte Anthropic auch ein Claude 3.5 Opus auf der Roadmap. Es kam nie. Claude 4 absorbierte die gesamte 3.5-Familie, bevor ein größeres 3.5 nötig geworden wäre. Da Sonnet die Zahlen lieferte, die es tat, drängte der Markt nie hart auf ein Top-Tier-3.5.

Aktueller Status

Modell	Status
Claude 3.5 Sonnet (v1)	Abgelöst durch v2 (Oktober 2024)

Ein v2 übernahm im Oktober 2024. Es brachte frische Verbesserungen auf v1 auf und führte Computer Use ein, eine Premiere für jedes Frontier-Modell.