Claude Fable 5 の料金とコスト管理

Claude Fable 5 は入力100万トークンあたり$10、出力100万トークンあたり$50です。これはちょうど Opus 4.8($5/$25)の2倍で、その元となった制限付きモデル Mythos Preview(約$30/$150)の半分未満です。

代表的な「入力100K・出力20K」のタスクは、Fable 5 では$2.00、Opus 4.8 では$1.00です。表示価格は2倍ですが、実際の請求額はあなたがコントロールできる5つのレバーで決まります。推論 effort、タスク予算、プロンプトキャッシュ、バッチ API、そしてそもそもどのトラフィックを Fable に回すか、です。

Fable 5 は初めて一般公開された Mythos クラスのモデルで、Opus の一段上のティアです。価格はそのティアを反映しています。しかも、企業が AI のコストにますます厳しくなっている時期に登場しました。TechCrunch は$10/$50という料金について「これだけでも広範な利用の抑止力になりかねない」と指摘しました。この記事は、そのコストを管理下に置くための計算式と戦略です。

料金表

Fable 5 の料金は、どの行も Opus 4.8 のきっかり2倍です。

トークン種別	Claude Fable 5	Claude Opus 4.8
入力	$10 / 1M	$5 / 1M
出力	$50 / 1M	$25 / 1M
バッチ API 入力	$5 / 1M	$2.50 / 1M
バッチ API 出力	$25 / 1M	$12.50 / 1M
5分キャッシュ書き込み	$12.50 / 1M	$6.25 / 1M
1時間キャッシュ書き込み	$20 / 1M	$10 / 1M
キャッシュヒット・更新	$1 / 1M	$0.50 / 1M

覚えておきたい捉え方がひとつあります。Fable 5 の標準料金$10/$50は、Opus 4.8 の fast mode と同じトークン単価です。つまり、まる一段上のティアにあるモデルに、Opus の fast mode と同じ価格を払っているわけです。それがお得かどうかは、完全にタスク次第です。残りの内容はすべて、その点に行き着きます。

タスク1回の実際のコスト

表示価格を具体的にするために、まず基本ケースから始めましょう。「入力100K・出力20K」の呼び出しを取り上げます。

Fable 5 では:

input:  100,000 tokens × $10/1M = $1.00
output:  20,000 tokens × $50/1M = $1.00
total                           = $2.00

Opus 4.8 では:

input:  100,000 tokens × $5/1M  = $0.50
output:  20,000 tokens × $25/1M = $0.50
total                           = $1.00

同じトークン使用量でちょうど2倍です。もっと小さい「入力50K・出力10K」のコーディング呼び出しなら、Fable で$1.00、Opus で$0.50。料金表の比率は決して変わりません。変わるのは、その周りのすべてです。

痛いのはロングコンテキストのケースです。100万トークン近いプロンプトを入力100万あたり$10で処理すると、Fable が有用なトークンを1つも書く前から、入力だけでおよそ$9の請求になります。

input:  900,000 tokens × $10/1M =  $9.00
output:   5,000 tokens × $50/1M =  $0.25
total                           =  $9.25 per call

これをキャッシュなしでワークフロー全体に走らせると、請求額はあっという間に積み上がります。そこで最初のレバーが登場します。

レバー1:キャッシュ、繰り返すコンテキストへの10倍割引

Fable 5 のキャッシュヒットは100万トークンあたり$1で、新規入力の100万あたり$10に対して10分の1です。再利用するコンテキストなら、どれでも10倍の削減になります。

先ほどの$9.25のロングコンテキスト呼び出しで、900Kのコンテキストがキャッシュヒットだと仮定してみましょう:

cached input:  900,000 tokens × $1/1M  =  $0.90
output:          5,000 tokens × $50/1M =  $0.25
total                                  =  $1.15 per call

$9.25から$1.15へ。エージェントが多数の呼び出しにわたって同じ大きなリポジトリ、仕様書、ドキュメント群を読むなら、キャッシュは持ちうる中で最大のコストレバーです。キャッシュ書き込みは一度だけ割増($12.50/1Mの5分ティア、$20/1Mの1時間ティア)ですが、その後のヒットはすべて安価です。

レバー2:effort、ソフトなダイヤル

Anthropic の言葉を借りれば、effort は「Claude Fable 5 における知能、レイテンシ、コストのトレードオフの主要なコントロール」です。モデルが何個の思考トークンを使うかを設定するもので、思考トークンは出力として100万あたり$50で課金されます。

レベルは low、medium、high(デフォルト)、xhigh の4段階です。ガイダンスでは、ほとんどのタスクには high、最も能力が問われる仕事には xhigh、ルーチンな仕事には medium か low を使うよう推奨されています。コスト面でのカギとなる洞察はこれです。Fable 5 の低い effort 設定は「それでも十分よく機能し、しばしば以前のモデルの xhigh のパフォーマンスを上回る」。

二度読んでください。Fable 5 の medium effort は、しばしば Opus 4.8 の最高 effort を上回ります。Anthropic の FrontierCode の結果もそれを裏づけており、Fable は medium effort でもフロンティアモデルをリードしています。つまりコストレバーは「安いモデルに切り替える」であることが多いのではなく、しばしば「Fable の effort を下げる」なのです。

xhigh で約40Kの思考トークンを、medium で12Kを使う難しいタスクを思い浮かべてください(例示。Anthropic は effort 別の正確なトークン数を公表していません)。100万あたり$50なら、同じ仕事で思考が約$2.00か$0.60かの差です。Anthropic 自身のアドバイスは率直です。「タスクが完了するものの必要以上に時間がかかる場合は、effort を下げよ」。なお、適応的な思考は常にオンなので、深さを縮めることはできても、思考をオフにすることはできません。

レバー3:タスク予算、ハードな上限

effort はダイヤルです。タスク予算は壁です。

タスク予算のベータ(ヘッダー task-budgets-2026-03-13、最小20,000トークン)を使うと、エージェントのループが消費できる合計トークンに上限を設けられます。effort が平均的に消費を抑えるのに対し、タスク予算は、1回の自律的な実行があなたの設定した上限を突破できないことを保証します。

これはどの以前のモデルよりも Fable 5 で重要です。設計上、ターンが長く走るからです。個々の難しいリクエストは高い effort で数分間走ることがあり、自律的な実行は何時間にも及びます。あるローンチ当日のユーザーは、Fable 5 が「私の Max 20x プランを毎分約2%のペースで食っている」と報告しました。タスク予算は、暴走するループがモデルの選んだ数字ではなく、あなたの選んだ数字で確実に止まるようにする手段です。

レバー4:バッチ API、オフライン作業を半額で

リアルタイムである必要のないものは、すべてバッチ API を通すべきです。料金が半額になります。$10/$50ではなく$5/$25です。夜間の評価、大量のドキュメント処理、オフラインのパイプラインなら、請求の最も高価な部分が一律50%オフになります。

レバー5:ルーティング、難しい一握りだけを Fable へ

最大のレバーは、最もシンプルでもあります。ほとんどのトラフィックに Mythos クラスのモデルは要りません。ルーチンワークはデフォルトで Opus 4.8 か Sonnet 4.6 に回し、難しくて長期的で失敗しやすい一握りだけを Fable 5 に送るのです。

エンタープライズ規模では、賭け金は本物です。純粋なルーチン出力について、課金アナリストは年間50億出力トークンを、Fable 5 ではおよそ$250,000、Opus 4.8 では$125,000とモデル化しています。分類、要約、RAG の検索にとって、この差額は何も買いません。Opus がすでに品質のハードルをクリアしているからです。タスクを Fable に昇格させるのは、安いモデルが明らかに失敗するとき、タスクの途中でプランを見失うとき、あるいはリトライで合計トークンをかえって多く消費するときだけにしましょう。

フォールバック料金の癖

ここは Fable 5 の料金の中で、他のどこにも対応物のない部分なので、正確に理解しておく価値があります。

Fable 5 はサイバーセキュリティ、生物学・化学、蒸留に関する安全分類器を走らせます。どれかが作動すると、リクエストは代わりに Opus 4.8 が処理し、Opus 料金で課金されます。Anthropic によれば、これが発火するのはセッションの5%未満です。AWS のローンチドキュメントから、課金のケースが2つ続きます。

リクエスト全体が Opus 4.8 へルーティングされる場合。 分類器が冒頭で作動すると、応答全体が Opus 4.8 から出力され、すべて Opus 料金($5/$25)で課金されます。Fable 料金はまったくかかりません。

会話の途中でブロックされる場合。 ブロックが途中で起きると、最初のトークン(ブロック前に Fable が処理した分)は Fable 料金($10/$50)で、その後のトークン(Opus の応答)は Opus 料金($5/$25)で課金されます。1回のリクエストが、2つの料金表に分かれます。

実際のところ、これは生物・化学・セキュリティ寄りのワークロードが、分類器が再ルーティングするたびに静かな部分割引を受けることを意味します。これらの領域では、分類器が意図的に広めに設定されているため、フォールバック率は5%の平均より高くなります。予測しづらいので、それ自体が、そのトラフィックを請求書で発見するのではなく、最初から意図的に Opus へルーティングすべき理由になります。

実装上の注意がひとつ。拒否は stop_reason: "refusal" を伴う成功した HTTP 200 として届くことがあります。プロダクションのコードは、あらゆる 200 を課金済みの Fable の回答と決めつけるのではなく、stop reason をチェックしなければなりません。API 顧客は、Opus 4.8 へのフォールバックをサーバー側またはクライアント側で明示的に設定します。Claude のアプリのように自動ではありません。

2倍という表示価格が嘘になるとき

料金表は2倍だと言います。ですが適切なタスクでは、実効コストが安いモデルを下回ることがあります。

あるフロンティア物理研究所は、Fable 5 が「推論トークンを3分の1しか使わずに」最も強いモデルだったと報告し、36時間で GPT-5.5 が4日後にたどり着いた地点にほぼ到達しました。計算は容赦なく Fable に有利です。トークンが3分の1で単価が2倍なら、実効コストは3分の2です。この種の長く慎重な仕事では、Fable 5 は高いどころか安くつきます。

同じパターンは他でも見られます。あるスプレッドシート一式では、Fable 5 があらゆる effort レベルでより少ないターンで Opus 4.8 を上回り、25〜30%速く完了しました。Base44 は「1年前は100回のプロンプトが必要だったアプリを、今はワンショットで作る」と述べました。Rakuten は「追加の思考はそのコストに見合う」と。そして Stripe は、チームの2か月以上の工数と見積もられた移行を、5,000万行の Ruby コードベースで1日でこなしました。ここではトークン代など、置き換えた人件費の前では取るに足りません。

Anthropic の Dianne Penn は CNBC に対してこう位置づけました。顧客はより高い精度と1ドルあたりの便益を求めており、アーリー顧客は「タスクあたりの支出の改善に気づいた」、そして「より知的なモデルを持つことで、単純により高い ROI が得られる」。最適化すべき数字はトークンあたりのコストではなく、完了したタスクあたりのコストなのです。

レバー6:6月22日までの無料期間

すぐに閉じる、期間限定のレバーがあります。Fable 5 のサブスクリプション展開は段階的です。

6月9日から6月22日まで、Fable 5 は Pro、Max、Team、シート単位の Enterprise プランに追加料金なしで含まれます。
6月23日には、Fable 5 はこれらのプランから外れます。それ以降の利用には使用クレジットが必要です。Anthropic は容量が許せば期間を延長するかもしれないと述べています。
最終的に Anthropic は、Fable 5 をサブスクリプションプランの標準の一部として復活させることを目指していますが、確定した日付はありません。

API と従量課金の Enterprise プランでは、Fable 5 は初日から$10/$50でフルに従量課金されます。ですがサブスクリプションなら、6月22日までの窓は無料の評価期間です。これを使って自分の実際のタスクを Fable 5 で走らせ、完了したタスクあたりの支出を Opus 4.8 と比べて測り、23日以降に使用クレジットを払う価値があるかを判断しましょう。それ以降はカジュアルな利用もクレジット従量制になるので、ベンチマークを取るなら今がそのときです。

コスト管理の戦略

レバーを組み合わせると、戦略は短くまとまります。

タスクでルーティングする。 ルーチンのトラフィックはデフォルトで Opus 4.8 か Sonnet 4.6 へ。Fable 5 は難しく長期的な一握りに取っておく。
モデルを切り替える前に effort を下げる。 Fable の medium effort はしばしば Opus の最高 effort を上回り、思考トークンの消費はわずかで済む。
積極的にキャッシュする。 キャッシュヒットは$1/1M、新規入力は$10/1M。繰り返すコンテキストへの10倍のレバー。
タスク予算でループに上限を。 ベータヘッダーがエージェントの実行に上限(最小20,000トークン)を設け、暴走を防ぐ。
オフライン作業はバッチで。 リアルタイムを要しないものはすべて$5/$25の半額。
無料期間中にベンチマークする。 サブスクリプションプランで無料のうちに、6月22日までに実際のタスクで評価する。

Claude Fable 5 の料金とコスト管理

料金表

タスク1回の実際のコスト

レバー1:キャッシュ、繰り返すコンテキストへの10倍割引

レバー2:effort、ソフトなダイヤル

レバー3:タスク予算、ハードな上限

レバー4:バッチ API、オフライン作業を半額で

レバー5:ルーティング、難しい一握りだけを Fable へ

フォールバック料金の癖

2倍という表示価格が嘘になるとき

レバー6:6月22日までの無料期間

コスト管理の戦略

結論

よくある質問

Claude Fable 5 の料金はいくらですか?

Claude Fable 5 はなぜ Opus 4.8 の2倍の価格なのですか?

Claude Fable 5 のフォールバック料金はどう機能しますか?

Claude Fable 5 のコストはどう管理すればいいですか?

Claude Fable 5 は今、無料ですか?

トークン効率で Claude Fable 5 を Opus 4.8 より安くできますか?

出典

関連ページ

On this page