Claude 3.5 Sonnet
Claude 3.5 Sonnet erschien im Juni 2024 für $3/$15 und übertraf Claude 3 Opus bei MMLU, GPQA, HumanEval zu einem Fünftel der Kosten. Specs, Benchmarks und Coding-Fortschritte.
Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.
SaaS-Builder-Vorlagen mit KI-Orchestrierung.
Claude 3.5 Sonnet ist das Release, bei dem Entwickler aufgehört haben, standardmäßig zum größten Modell zu greifen. Anthropic veröffentlichte es am 20. Juni 2024, und von Tag eins an drehte sich die Preis-Rechnung um. Ein Mid-Tier-Modell mit $3-Input erzielte bei den meisten öffentlichen Evals Ergebnisse auf oder über dem Flaggschiff mit $15-Input. Größer bedeutete nicht mehr automatisch besser.
Wichtige Specs
| Spec | Details |
|---|---|
| API ID | claude-3-5-sonnet-20240620 |
| Kontextfenster | 200K Tokens |
| Input-Preis | $3 / 1M Tokens |
| Output-Preis | $15 / 1M Tokens |
| Veröffentlichungsdatum | 20. Juni 2024 |
| Max. Output-Tokens | 8.192 |
Was Claude 3.5 Sonnet brachte
Top-Intelligenz zum Mid-Tier-Preis. Reasoning auf Graduierungsniveau, Wissen auf Bachelor-Niveau, Code-Generierung. Über GPQA, MMLU und HumanEval hielt dieses Release seinen eigenen Vergleich mit Claude 3 Opus oder übertraf es sogar. Und das bei $3 Input und $15 Output pro Million Tokens, neben dem $15/$75-Tier, das das Flaggschiff verlangte. Kein Modell hatte diese beiden Dinge vorher kombiniert.
Coding-Stärke. Das ist die Version, die Claude zu einem echten Werkzeug fürs Code-Schreiben machte. Der Headline-Code-Score kletterte vom 55% des Flaggschiffs auf 64% hier. Viele Entwickler, die noch GPT-4 für ihren Code nutzten, wechselten in diesem Zeitraum. Reasoning plus Output-Qualität machten das zur ersten Wahl für Software-Engineering-Arbeit.
Geschwindigkeit. Die Antwortrate lag bei etwa dem 2-fachen dessen, was das Flaggschiff lieferte. Bei einer interaktiven Coding-Session, einer Chat-UI oder überall, wo Latenz der Engpass ist, merkte man es beim ersten Request.
Der "Sonnet reicht"-Moment. Lange Zeit war die Faustregel simpel. Schwieriger das Problem, größer das Modell. Dieses Release brach diesen Reflex. Teams, die Opus-Preise zahlten, merkten, dass Sonnet sie zur gleichen Antwort (oder einer besseren) für ein Fünftel der Kosten brachte. Von da an begann die Modellauswahl mit Sonnet, nicht oben im Menü.
Direktvergleich mit Claude 3 Opus
| Benchmark | Claude 3 Opus | Claude 3.5 Sonnet |
|---|---|---|
| MMLU | 86,8% | 88,7% |
| GPQA | 50,4% | 59,4% |
| HumanEval | 55% | 64% |
| GSM8K | 95,0% | 96,4% |
Jede Zeile spricht für das günstigere Modell. Die Tabelle machte ihr eigenes Argument.
Das fehlende Claude 3.5 Opus
Beim Claude 3.5 Sonnet-Launch nannte Anthropic auch ein Claude 3.5 Opus auf der Roadmap. Es kam nie. Claude 4 absorbierte die gesamte 3.5-Familie, bevor ein größeres 3.5 nötig geworden wäre. Da Sonnet die Zahlen lieferte, die es tat, drängte der Markt nie hart auf ein Top-Tier-3.5.
Aktueller Status
| Modell | Status |
|---|---|
| Claude 3.5 Sonnet (v1) | Abgelöst durch v2 (Oktober 2024) |
Ein v2 übernahm im Oktober 2024. Es brachte frische Verbesserungen auf v1 auf und führte Computer Use ein, eine Premiere für jedes Frontier-Modell.
Verwandte Seiten
- Alle Claude-Modelle für die vollständige Versions-Timeline
- Claude 3, die vorherige Generation
- Claude 3.5 Sonnet v2, das Upgrade vom Oktober 2024, das Computer Use hinzufügte
Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.
SaaS-Builder-Vorlagen mit KI-Orchestrierung.