Claude Fable 5 Pricing & Kostenkontrolle

Claude Fable 5 kostet $10 pro Million Input-Tokens und $50 pro Million Output-Tokens. Das ist exakt das Doppelte von Opus 4.8 ($5/$25) und weniger als die Hälfte des Preises von Mythos Preview (~$30/$150), dem eingeschränkten Modell, von dem es abstammt.

Eine repräsentative Aufgabe mit 100K rein / 20K raus kostet $2.00 auf Fable 5 gegenüber $1.00 auf Opus 4.8. Der Aufkleber sagt 2x, aber deine tatsächliche Rechnung hängt von fünf Hebeln ab, die du kontrollierst: Reasoning-Effort, Task-Budgets, Prompt-Caching, die Batch-API und welchen Traffic du überhaupt an Fable routest.

Fable 5 ist das erste öffentlich verfügbare Modell der Mythos-Klasse, eine Stufe über Opus. Der Preis spiegelt die Stufe wider, und er kommt zu einem Zeitpunkt, an dem Unternehmen zunehmend kritisch gegenüber KI-Kosten sind. TechCrunch merkte an, der Tarif von $10/$50 "könnte allein schon als Abschreckung für den breiten Einsatz dienen". Dieser Post ist die Rechnung und das Playbook, um das im Griff zu behalten.

Die Preisliste

Jede Zeile von Fable 5s Preisen ist präzise das Doppelte von Opus 4.8.

Token-Typ	Claude Fable 5	Claude Opus 4.8
Input	$10 / 1M	$5 / 1M
Output	$50 / 1M	$25 / 1M
Batch-API Input	$5 / 1M	$2.50 / 1M
Batch-API Output	$25 / 1M	$12.50 / 1M
5-Min-Cache-Write	$12.50 / 1M	$6.25 / 1M
1-Stunden-Cache-Write	$20 / 1M	$10 / 1M
Cache-Hits & Refreshes	$1 / 1M	$0.50 / 1M

Ein Gedanke, den man im Kopf behalten sollte: Fable 5s Standard von $10/$50 ist derselbe Tarif pro Token wie der Fast Mode von Opus 4.8. Du zahlst Opus-Fast-Mode-Preise für ein Modell, das eine ganze Stufe höher sitzt. Ob das ein guter Deal ist, hängt komplett von der Aufgabe ab – und genau darauf läuft der Rest hier hinaus.

Was eine Aufgabe wirklich kostet

Fang mit dem Basisfall an, damit der Aufkleber konkret wird. Nimm einen Call mit 100K rein / 20K raus.

Auf Fable 5:

input:  100,000 tokens × $10/1M = $1.00
output:  20,000 tokens × $50/1M = $1.00
total                           = $2.00

Auf Opus 4.8:

input:  100,000 tokens × $5/1M  = $0.50
output:  20,000 tokens × $25/1M = $0.50
total                           = $1.00

Exakt 2x bei identischem Token-Verbrauch. Ein kleinerer Coding-Call mit 50K rein / 10K raus kostet $1.00 auf Fable gegenüber $0.50 auf Opus. Das Verhältnis ändert sich auf der Preisliste nie. Was sich ändert, ist alles drumherum.

Der Fall, der wehtut, ist langer Kontext. Ein Prompt mit fast 1M Tokens bei $10 pro Million Input ist grob eine Input-Rechnung von $9, bevor Fable ein einziges nützliches Token schreibt:

input:  900,000 tokens × $10/1M =  $9.00
output:   5,000 tokens × $50/1M =  $0.25
total                           =  $9.25 per call

Fahr das ungecacht über einen Workflow und die Rechnung summiert sich schnell. Das ist der erste Hebel.

Hebel 1: Caching, der 10x-Rabatt auf wiederholten Kontext

Cache-Hits auf Fable 5 kosten $1 pro Million Tokens, gegenüber $10 pro Million für frischen Input. Das ist eine Reduktion um den Faktor 10 auf jeden Kontext, den du wiederverwendest.

Nimm den $9.25-Long-Context-Call von oben und nimm an, dass die 900K an Kontext ein Cache-Hit sind:

cached input:  900,000 tokens × $1/1M  =  $0.90
output:          5,000 tokens × $50/1M =  $0.25
total                                  =  $1.15 per call

Von $9.25 auf $1.15. Wenn dein Agent dasselbe große Repo, Spec oder Dokumenten-Set über viele Calls liest, ist Caching der mit Abstand größte Kostenhebel, den du hast. Der Cache-Write kostet einmalig einen Aufschlag ($12.50/1M für die 5-Minuten-Stufe, $20/1M für die 1-Stunden-Stufe), danach ist jeder Hit billig.

Hebel 2: Effort, der weiche Regler

Effort ist, in Anthropics Worten, "die primäre Kontrolle für den Trade-off zwischen Intelligenz, Latenz und Kosten auf Claude Fable 5". Er legt fest, wie viele Thinking-Tokens das Modell ausgibt, und Thinking-Tokens werden als Output mit $50 pro Million abgerechnet.

Die Stufen sind low, medium, high (der Default) und xhigh. Die Empfehlung ist, high für die meisten Aufgaben zu nutzen, xhigh für die fähigkeitskritischste Arbeit und medium oder low für Routinejobs. Die zentrale Erkenntnis für die Kosten: Niedrigere Effort-Einstellungen auf Fable 5 "schneiden immer noch gut ab und übertreffen oft die xhigh-Performance früherer Modelle".

Lies das zweimal. Fable 5 bei mittlerem Effort schlägt oft Opus 4.8 bei dessen höchstem Effort. Anthropics FrontierCode-Ergebnis bestätigt das, wo Fable selbst bei mittlerem Effort an der Spitze der Frontier-Modelle liegt. Der Kostenhebel ist also häufig nicht "wechsle zu einem günstigeren Modell". Er ist "dreh Fables Effort runter".

Stell dir eine harte Aufgabe vor, die bei xhigh grob 40K Thinking-Tokens und bei medium 12K verbrennt (illustrativ; Anthropic veröffentlicht keine exakten Zahlen pro Effort-Stufe). Bei $50 pro Million sind das etwa $2.00 an Thinking gegenüber $0.60 beim selben Job. Anthropics eigener Rat ist direkt: "Reduziere den Effort, wenn eine Aufgabe abschließt, aber länger dauert als nötig." Beachte, dass adaptives Thinking immer an ist – du kannst die Tiefe verkleinern, aber Thinking nicht abschalten.

Hebel 3: Task-Budgets, die harte Grenze

Effort ist ein Regler. Task-Budgets sind eine Wand.

Die Task-Budgets-Beta (Header task-budgets-2026-03-13, Minimum 20.000 Tokens) lässt dich die Gesamtzahl der Tokens deckeln, die eine agentische Schleife verbrauchen kann. Wo Effort die Ausgaben im Schnitt nach unten drückt, garantiert ein Task-Budget, dass ein einzelner autonomer Lauf eine von dir gesetzte Obergrenze nicht sprengen kann.

Das zählt auf Fable 5 mehr als auf jedem früheren Modell, weil seine Turns von Natur aus lang laufen. Einzelne harte Requests können bei höherem Effort minutenlang laufen, und autonome Läufe können sich über Stunden ziehen. Ein Nutzer am Launch-Tag berichtete, Fable 5 "frisst meinen Max-20x-Plan mit ~2 % pro Minute". Ein Task-Budget ist, wie du sicherstellst, dass eine außer Kontrolle geratene Schleife bei einer Zahl stoppt, die du gewählt hast, statt bei einer, die das Modell gewählt hat.

Hebel 4: Batch-API, halber Preis für Offline-Arbeit

Alles, was nicht in Echtzeit passieren muss, sollte durch die Batch-API laufen. Sie halbiert den Tarif: $5/$25 statt $10/$50. Für nächtliche Evals, Massen-Dokumentenverarbeitung und Offline-Pipelines sind das pauschal 50 % weniger auf dem teuersten Teil deiner Rechnung.

Hebel 5: Routing, nur der harte Schwanz geht an Fable

Der größte Hebel ist auch der simpelste. Der meiste Traffic braucht kein Modell der Mythos-Klasse. Route Routinearbeit standardmäßig an Opus 4.8 oder Sonnet 4.6 und schick nur den harten, Long-Horizon-, fehleranfälligen Schwanz an Fable 5.

Im Enterprise-Maßstab sind die Einsätze real. Bei reinem Routine-Output haben Billing-Analysten 5 Milliarden Output-Tokens im Jahr modelliert – grob $250.000 auf Fable 5 gegenüber $125.000 auf Opus 4.8. Für Klassifizierung, Zusammenfassung und RAG-Retrieval bringt dieser Aufpreis nichts, weil Opus die Qualitätshürde bereits nimmt. Befördere eine Aufgabe nur dann zu Fable, wenn ein günstigeres Modell nachweislich scheitert, mitten in der Aufgabe den Plan verliert oder durch Retries mehr Tokens insgesamt verbrennt.

Die Fallback-Preis-Eigenheit

Das ist der Teil von Fable 5s Preisen, der nirgendwo sonst eine Entsprechung hat, und es lohnt sich, ihn genau zu verstehen.

Fable 5 fährt Safety-Klassifizierer für Cybersecurity, Biologie und Chemie sowie Distillation. Wenn einer anschlägt, wird der Request stattdessen von Opus 4.8 bearbeitet, und dir werden Opus-Tarife berechnet. Anthropic sagt, das wird in unter 5 % der Sessions ausgelöst. Zwei Abrechnungsfälle folgen, direkt aus der AWS-Launch-Dokumentation:

Ein ganzer Request wird an Opus 4.8 geroutet. Wenn der Klassifizierer gleich am Anfang anschlägt, kommt die gesamte Antwort von Opus 4.8 und wird komplett zu Opus-Preisen abgerechnet ($5/$25). Dir werden gar keine Fable-Tarife berechnet.

Ein Request wird mitten im Gespräch blockiert. Wenn die Blockade unterwegs passiert, werden die anfänglichen Tokens (von Fable vor der Blockade verarbeitet) zu Fable-Tarifen abgerechnet ($10/$50), und die folgenden Tokens (die Opus-Antwort) zu Opus-Tarifen ($5/$25). Ein einzelner Request, aufgeteilt auf zwei Preislisten.

In der Praxis heißt das, dass Bio-, Chem- oder sicherheitsnahe Workloads einen stillen, teilweisen Rabatt bekommen, wann immer der Klassifizierer sie umroutet. Für diese Domänen liegt der Fallback-Tarif höher als der 5-%-Durchschnitt, weil die Klassifizierer bewusst breit angelegt sind. Es ist unvorhersehbar – was ein eigener Grund ist, diesen Traffic bewusst an Opus zu routen, statt es auf der Rechnung zu entdecken.

Eine Implementierungsnotiz: Ablehnungen können als erfolgreiches HTTP 200 mit stop_reason: "refusal" ankommen. Produktionscode muss den Stop-Reason prüfen, statt anzunehmen, jedes 200 sei eine abgerechnete Fable-Antwort, und API-Kunden konfigurieren den Fallback auf Opus 4.8 explizit server- oder clientseitig. Es ist nicht automatisch wie in den Claude-Apps.

Wann der 2x-Aufkleber lügt

Die Preisliste sagt das Doppelte. Bei der richtigen Aufgabe landen deine effektiven Kosten unter dem günstigeren Modell.

Ein Frontier-Physiklabor berichtete, Fable 5 sei sein stärkstes Modell gewesen, "und das mit einem Drittel der Reasoning-Tokens", und es erreichte in 36 Stunden fast das, wo GPT-5.5 nach vier Tagen landete. Die Rechnung ist gnadenlos zu Fables Gunsten: ein Drittel der Tokens bei doppeltem Preis pro Token sind zwei Drittel der effektiven Kosten. Bei dieser Klasse langer, bedachter Arbeit ist Fable 5 günstiger, nicht teurer.

Dasselbe Muster taucht anderswo auf. Eine Spreadsheet-Suite stellte fest, dass Fable 5 Opus 4.8 auf jeder Effort-Stufe mit weniger Turns schlägt und 25 bis 30 % schneller abschließt. Base44 sagte, Apps, die "vor einem Jahr hundert Prompts brauchten, gelingen jetzt in einem Schuss". Rakuten: "das Extra-Nachdenken rechnet sich." Und Stripe fuhr an einem Tag eine Migration auf einer 50-Millionen-Zeilen-Ruby-Codebase, die auf über zwei Monate Teamarbeit geschätzt wurde – wobei die Token-Rechnung neben dem Gehalt, das sie ersetzt, trivial ist.

Anthropics Dianne Penn formulierte es für CNBC so: Kunden wollen höhere Genauigkeit und mehr Nutzen pro Dollar, frühe Kunden "stellten eine Verbesserung der Ausgaben pro Aufgabe fest", und "man bekommt einfach einen höheren ROI, wenn man intelligentere Modelle hat". Die Zahl, die du optimieren willst, ist Kosten pro abgeschlossener Aufgabe, nicht Kosten pro Token.

Hebel 6: Das kostenlose Zeitfenster vor dem 22. Juni

Es gibt einen zeitlich begrenzten Hebel, der sich schnell schließt. Fable 5s Abo-Rollout ist gestaffelt:

Vom 9. Juni bis zum 22. Juni ist Fable 5 ohne Aufpreis in den Plänen Pro, Max, Team und Sitzplatz-basiertem Enterprise enthalten.
Am 23. Juni verlässt Fable 5 diese Pläne. Es danach zu nutzen erfordert Usage-Credits. Anthropic sagt, es könnte das Zeitfenster verlängern, wenn die Kapazität es erlaubt.
Irgendwann strebt Anthropic an, Fable 5 als Standardbestandteil der Abo-Pläne zurückzubringen, ohne festes Datum.

Auf der API und den verbrauchsbasierten Enterprise-Plänen wird Fable 5 ab Tag eins voll mit $10/$50 abgerechnet. Aber wenn du auf einem Abo bist, ist das Zeitfenster bis zum 22. Juni eine kostenlose Evaluierungsphase. Nutze es, um deine echten Aufgaben auf Fable 5 laufen zu lassen, die Ausgaben pro abgeschlossener Aufgabe gegen Opus 4.8 zu messen und zu entscheiden, ob es sich nach dem 23. einen Platz auf Usage-Credits verdient. Danach wird gelegentliche Nutzung credit-gemessen, also ist die Zeit zum Benchmarken jetzt.

Das Kostenkontroll-Playbook

Setz die Hebel zusammen und die Strategie ist kurz:

Route nach Aufgabe. Route Routine-Traffic standardmäßig an Opus 4.8 oder Sonnet 4.6; reserviere Fable 5 für den harten Long-Horizon-Schwanz.
Dreh den Effort runter, bevor du das Modell wechselst. Mittlerer Effort auf Fable schlägt oft Opus bei dessen höchstem Effort, zu einem Bruchteil der Thinking-Token-Ausgaben.
Cache aggressiv. Cache-Hits sind $1/1M gegenüber $10/1M frisch – ein 10x-Hebel auf wiederholten Kontext.
Deckle Schleifen mit Task-Budgets. Der Beta-Header deckelt einen agentischen Lauf (Minimum 20.000 Tokens), sodass er nicht ausreißen kann.
Batch Offline-Arbeit. Halber Preis bei $5/$25 für alles, was keine Echtzeit braucht.
Benchmark im kostenlosen Zeitfenster. Evaluier an echten Aufgaben vor dem 22. Juni, solange es auf Abo-Plänen kostenlos ist.

Das Fazit

Fable 5s Preise sind einfach zu nennen und leicht falsch zu lesen. Der Aufkleber ist exakt 2x Opus 4.8, aber der Aufkleber ist die falsche Zahl. Effort, Task-Budgets, Caching, Batch, Routing und Fables eigene Token-Effizienz biegen die echte Rechnung alle zurecht – manchmal unter das günstigere Modell bei harten Aufgaben und deutlich darüber bei Routine.

Verwende deine Aufmerksamkeit auf die Hebel, nicht auf die Preisliste. Route die leichte Arbeit an günstigere Modelle, schick nur den harten Schwanz an Fable, tune den Effort und deckle Budgets, und nutze das kostenlose Zeitfenster, um deine eigenen Ausgaben pro Aufgabe zu lernen, bevor am 23. Juni die Uhr zu ticken beginnt.

Häufig gestellte Fragen

Wie viel kostet Claude Fable 5?

Claude Fable 5 kostet $10 pro Million Input-Tokens und $50 pro Million Output-Tokens – exakt das Doppelte von Opus 4.8 ($5/$25). Eine Aufgabe mit 100K rein / 20K raus läuft auf $2.00 auf Fable 5 gegenüber $1.00 auf Opus 4.8. Die Batch-API halbiert den Tarif auf $5/$25, und Cache-Hits senken den Input auf $1 pro Million.

Warum ist Claude Fable 5 doppelt so teuer wie Opus 4.8?

Fable 5 ist das erste öffentlich verfügbare Modell der Mythos-Klasse, eine Fähigkeitsstufe über der Opus-Klasse, und der Preis spiegelt diese Stufe wider. Es ist immer noch weniger als die Hälfte des Preises von Mythos Preview (~$30/$150), dem eingeschränkten Modell, von dem es abstammt. Anthropic argumentiert, der höhere ROI pro abgeschlossener Aufgabe könne den Aufschlag pro Token bei harter Arbeit ausgleichen.

Wie funktioniert das Fallback-Pricing von Claude Fable 5?

Wenn Fable 5s Safety-Klassifizierer einen Request an Opus 4.8 routen, zahlst du Opus-Tarife, nicht Fable-Tarife. Wenn ein Request mitten im Gespräch blockiert wird, werden die anfänglichen Tokens zu Fable-Tarifen abgerechnet und die folgenden Tokens zu Opus-Tarifen. Dieser Fallback wird bei typischen Workloads in unter 5 % der Sessions ausgelöst.

Wie kontrolliere ich die Kosten bei Claude Fable 5?

Nutze fünf Hebel: senke den Reasoning-Effort (medium schlägt oft Opus bei höchstem Effort), deckle agentische Schleifen mit Task-Budgets (Minimum 20.000 Tokens), cache wiederholten Kontext (Cache-Hits sind $1/1M gegenüber $10/1M), nutze die Batch-API für Offline-Arbeit (halber Preis) und route nur harte Aufgaben an Fable, während Routinearbeit auf Opus 4.8 oder Sonnet 4.6 bleibt.

Ist Claude Fable 5 gerade kostenlos?

Auf den Abo-Plänen Pro, Max, Team und Sitzplatz-basiertem Enterprise ist Fable 5 vom 9. Juni bis 22. Juni 2026 ohne Aufpreis enthalten. Am 23. Juni verlässt es diese Pläne und braucht Usage-Credits. Auf der API und den verbrauchsbasierten Enterprise-Plänen wird es ab Tag eins mit $10/$50 abgerechnet.

Kann Token-Effizienz Claude Fable 5 günstiger machen als Opus 4.8?

Bei der richtigen Aufgabe ja. Ein Physiklabor berichtete, Fable 5 nutze ein Drittel der Reasoning-Tokens eines konkurrierenden Modells, was bei doppeltem Preis pro Token auf zwei Drittel der effektiven Kosten hinausläuft. Weniger Turns und höhere Erfolgsquoten beim ersten Versuch senken die Ausgaben pro abgeschlossener Aufgabe, auch wenn die Preisliste das Doppelte ist.