Build This Now
Build This Now
Modelos do Claude CodeClaude Fable 5: o Guia RápidoClaude Fable 5 vs Opus 4.8Casos de Uso do Claude Fable 5Preços e Controlo de Custos do Claude Fable 5Guia da API do Claude Fable 5Claude Fable 5 no Claude CodeOs Safeguards do Claude Fable 5 explicadosOpus 4.8 CheatsheetDeepSeek V4: Pricing, Context, and MigrationRegressão de Qualidade do Claude Code: O Que Realmente AconteceuClaude Opus 4.7 vs GPT-5.5Claude Opus 4.7 vs Outros Modelos de IAClaude Mythos: O Modelo que Pensa em CiclosClaude Opus 4.5 no Claude CodeClaude Opus 4.7Claude Opus 4.7 vs 4.6Casos de Uso do Claude Opus 4.7Claude Opus 4.6Claude Sonnet 4.6Claude Opus 4.5Claude Sonnet 4.5Claude Haiku 4.5Claude Opus 4.1Claude 4Claude 3.7 SonnetClaude 3.5 Sonnet v2 e Claude 3.5 HaikuClaude 3.5 SonnetClaude 3Todos os Modelos ClaudeBest AI Model for Coding in 2026 (Tested & Ranked)
speedy_devvkoen_salo
Blog/Model Picker/Claude Fable 5 Pricing & Cost Control

Preços e Controlo de Custos do Claude Fable 5

O Claude Fable 5 custa $10 por milhão de tokens de entrada e $50 por milhão de tokens de saída, exatamente o dobro do Opus 4.8. Aqui ficam as contas, a particularidade do preço de fallback e as cinco alavancas que mantêm a conta baixa: esforço, orçamentos de tarefa, caching, batch e routing.

Pare de configurar. Comece a construir.

Templates SaaS com orquestração de IA.

Published Jun 10, 202612 min readModel Picker hub

O Claude Fable 5 custa $10 por milhão de tokens de entrada e $50 por milhão de tokens de saída. Isso é exatamente o dobro do Opus 4.8 ($5/$25), e menos de metade do preço do Mythos Preview (~$30/$150), o modelo restrito de que descende.

Uma tarefa representativa de 100K de entrada / 20K de saída custa $2,00 no Fable 5 contra $1,00 no Opus 4.8. A etiqueta diz 2x, mas a tua conta real depende de cinco alavancas que controlas: o esforço de raciocínio, os orçamentos de tarefa, o prompt caching, a batch API e que tráfego é que sequer encaminhas para o Fable.

O Fable 5 é o primeiro modelo de classe Mythos disponível ao público, um patamar acima do Opus. O preço reflete o patamar, e chega num momento em que as empresas estão cada vez mais críticas dos custos de IA. A TechCrunch notou que o valor de $10/$50 "por si só pode servir de dissuasor para uma utilização generalizada". Este post é a matemática e o manual de jogo para o manter sob controlo.

A Tabela de Preços

Cada linha do preço do Fable 5 é precisamente o dobro do Opus 4.8.

Tipo de tokenClaude Fable 5Claude Opus 4.8
Entrada$10 / 1M$5 / 1M
Saída$50 / 1M$25 / 1M
Entrada Batch API$5 / 1M$2,50 / 1M
Saída Batch API$25 / 1M$12,50 / 1M
Escrita de cache 5 min$12,50 / 1M$6,25 / 1M
Escrita de cache 1 hora$20 / 1M$10 / 1M
Acertos e refrescos de cache$1 / 1M$0,50 / 1M

Vale a pena guardar um enquadramento: o valor padrão de $10/$50 do Fable 5 é a mesma taxa por token que o fast mode do Opus 4.8. Estás a pagar preços de fast mode do Opus por um modelo que está um patamar inteiro acima. Se isso é um bom negócio depende inteiramente da tarefa, que é a que tudo o resto se resume.

Quanto Custa Mesmo uma Tarefa

Começa pelo caso base para a etiqueta ficar concreta. Pega numa chamada de 100K de entrada / 20K de saída.

No Fable 5:

input:  100,000 tokens × $10/1M = $1.00
output:  20,000 tokens × $50/1M = $1.00
total                           = $2.00

No Opus 4.8:

input:  100,000 tokens × $5/1M  = $0.50
output:  20,000 tokens × $25/1M = $0.50
total                           = $1.00

Exatamente 2x com utilização de tokens idêntica. Uma chamada de programação mais pequena de 50K de entrada / 10K de saída custa $1,00 no Fable contra $0,50 no Opus. O rácio nunca muda na tabela de preços. O que muda é tudo à volta dela.

O caso que dói é o contexto longo. Um prompt de quase 1M de tokens a $10 por milhão de entrada é uma conta de entrada de cerca de $9 antes de o Fable escrever um único token útil:

input:  900,000 tokens × $10/1M =  $9.00
output:   5,000 tokens × $50/1M =  $0.25
total                           =  $9.25 per call

Corre isso sem cache ao longo de um workflow e a conta acumula depressa. Que é a primeira alavanca.

Alavanca 1: Caching, o Desconto de 10x em Contexto Repetido

Os acertos de cache no Fable 5 custam $1 por milhão de tokens, contra $10 por milhão de entrada fresca. Isso é uma redução de 10x em qualquer contexto que reutilizes.

Pega na chamada de contexto longo de $9,25 acima e assume que os 900K de contexto são um acerto de cache:

cached input:  900,000 tokens × $1/1M  =  $0.90
output:          5,000 tokens × $50/1M =  $0.25
total                                  =  $1.15 per call

De $9,25 para $1,15. Se o teu agente lê o mesmo repo grande, spec ou conjunto de documentos ao longo de muitas chamadas, o caching é a maior alavanca de custo que tens. A escrita de cache custa um prémio uma vez ($12,50/1M para o nível de 5 minutos, $20/1M para o nível de 1 hora), e depois cada acerto fica barato.

Alavanca 2: Esforço, o Botão Suave

O esforço é, nas palavras da Anthropic, "o controlo principal para o compromisso entre inteligência, latência e custo no Claude Fable 5". Define quantos tokens de raciocínio o modelo gasta, e os tokens de raciocínio são faturados como saída a $50 por milhão.

Os níveis são low, medium, high (o padrão) e xhigh. A orientação é usar high para a maioria das tarefas, xhigh para o trabalho mais sensível à capacidade, e medium ou low para tarefas de rotina. A chave para o custo: os níveis de esforço mais baixos no Fable 5 "continuam a ter bom desempenho e ultrapassam muitas vezes o desempenho de xhigh em modelos anteriores".

Lê isso duas vezes. O Fable 5 em esforço medium bate muitas vezes o Opus 4.8 no seu esforço máximo. O resultado do FrontierCode da Anthropic confirma-o: o Fable lidera os modelos de fronteira mesmo em esforço medium. Por isso a alavanca de custo muitas vezes não é "mudar para um modelo mais barato". É "baixar o esforço do Fable".

Imagina uma tarefa difícil que queima cerca de 40K tokens de raciocínio em xhigh e 12K em medium (ilustrativo; a Anthropic não publica as contagens exatas por esforço). A $50 por milhão, isso são cerca de $2,00 de raciocínio contra $0,60 no mesmo trabalho. O próprio conselho da Anthropic é direto: "Reduz o esforço se uma tarefa fica concluída mas demora mais do que o necessário." Nota que o raciocínio adaptativo está sempre ligado, por isso podes encolher a profundidade mas não podes desligar o raciocínio.

Alavanca 3: Orçamentos de Tarefa, o Limite Rígido

O esforço é um botão. Os orçamentos de tarefa são uma parede.

O beta de orçamentos de tarefa (header task-budgets-2026-03-13, mínimo de 20.000 tokens) deixa-te limitar o total de tokens que um loop agêntico pode consumir. Onde o esforço empurra o gasto para baixo em média, um orçamento de tarefa garante que uma única execução autónoma não pode ultrapassar um teto que tu definiste.

Isto importa mais no Fable 5 do que em qualquer modelo anterior, porque os seus turnos são longos por design. Pedidos difíceis individuais podem correr durante minutos em esforço mais alto, e execuções autónomas podem prolongar-se por horas. Um utilizador no dia do lançamento relatou que o Fable 5 estava "a comer o meu plano Max 20x a ~2% por minuto". Um orçamento de tarefa é como garantes que um loop descontrolado pára num número que tu escolheste em vez de um número que o modelo escolheu.

Alavanca 4: Batch API, Metade do Preço para Trabalho Offline

Tudo o que não precisa de acontecer em tempo real deve passar pela batch API. Corta a taxa para metade: $5/$25 em vez de $10/$50. Para avaliações durante a noite, processamento de documentos em massa e pipelines offline, isso é uns 50% de desconto fixo na parte mais cara da tua conta.

Alavanca 5: Routing, Só a Cauda Difícil Vai para o Fable

A maior alavanca é também a mais simples. A maior parte do tráfego não precisa de um modelo de classe Mythos. Define por defeito o trabalho de rotina para o Opus 4.8 ou o Sonnet 4.6 e envia só a cauda difícil, de longo horizonte e propensa a falhas para o Fable 5.

À escala empresarial, o que está em jogo é real. Em saída puramente de rotina, analistas de faturação modelaram 5 mil milhões de tokens de saída por ano em cerca de $250.000 no Fable 5 contra $125.000 no Opus 4.8. Para classificação, sumarização e recuperação RAG, esse diferencial não compra nada, porque o Opus já passa a fasquia da qualidade. Promove uma tarefa para o Fable só quando um modelo mais barato falha de forma demonstrável, perde o fio a meio da tarefa ou queima mais tokens no total através de tentativas.

A Particularidade do Preço de Fallback

Esta é a parte do preço do Fable 5 que não tem equivalente em mais lado nenhum, e vale a pena perceber exatamente.

O Fable 5 corre classificadores de segurança para cibersegurança, biologia e química, e destilação. Quando um dispara, o pedido é tratado pelo Opus 4.8 e és faturado a preços de Opus. A Anthropic diz que isto dispara em menos de 5% das sessões. Seguem-se dois casos de faturação, tirados diretamente da documentação de lançamento da AWS:

Um pedido inteiro encaminhado para o Opus 4.8. Se o classificador disparar logo no início, a resposta inteira vem do Opus 4.8 e fatura totalmente a preços de Opus ($5/$25). Não és cobrado a taxas de Fable, de todo.

Um pedido bloqueado a meio da conversa. Se o bloqueio acontecer a meio, os tokens iniciais (processados pelo Fable antes do bloqueio) faturam a taxas de Fable ($10/$50), e os tokens seguintes (a resposta do Opus) faturam a taxas de Opus ($5/$25). Um único pedido, dividido por duas tabelas de preços.

Na prática, isto significa que cargas de trabalho ligadas a bio, química ou segurança recebem um desconto discreto e parcial sempre que o classificador as reencaminha. Para esses domínios a taxa de fallback é mais alta do que a média de 5%, porque os classificadores são deliberadamente abrangentes. É imprevisível, o que é mais uma razão para encaminhar esse tráfego para o Opus por opção em vez de o descobrires na fatura.

Uma nota de implementação: as recusas podem chegar como um HTTP 200 bem-sucedido com stop_reason: "refusal". O código de produção tem de verificar o motivo de paragem em vez de assumir que cada 200 é uma resposta de Fable faturada, e os clientes da API configuram o fallback para o Opus 4.8 explicitamente, do lado do servidor ou do cliente. Não é automático como é nas apps Claude.

Quando a Etiqueta de 2x Mente

A tabela de preços diz o dobro. Na tarefa certa, o teu custo efetivo fica abaixo do modelo mais barato.

Um laboratório de física de fronteira relatou que o Fable 5 foi o seu modelo mais forte "usando um terço dos tokens de raciocínio", chegando em 36 horas quase ao ponto a que o GPT-5.5 chegou ao fim de quatro dias. A matemática é implacável a favor do Fable: um terço dos tokens ao dobro do preço por token são dois terços do custo efetivo. Nessa classe de trabalho longo e deliberado, o Fable 5 é mais barato, não mais caro.

O mesmo padrão aparece noutros sítios. Uma suite de folhas de cálculo descobriu que o Fable 5 bate o Opus 4.8 em todos os níveis de esforço com menos turnos, terminando 25 a 30% mais depressa. A Base44 disse que apps que "há um ano levavam uma centena de prompts, agora saem num só". A Rakuten: "o raciocínio extra paga-se a si mesmo." E o Stripe correu uma migração numa base de código de 50 milhões de linhas de Ruby num dia, estimada em mais de dois meses de esforço de equipa, onde a conta de tokens é trivial face ao salário que substitui.

A Dianne Penn, da Anthropic, enquadrou-o para a CNBC: os clientes querem mais precisão e benefício por dólar, os clientes iniciais "notaram uma melhoria no gasto por tarefa", e "obténs simplesmente um ROI mais alto por teres modelos mais inteligentes". O número a otimizar é o custo por tarefa concluída, não o custo por token.

Alavanca 6: A Janela Gratuita Antes de 22 de Junho

Há uma alavanca com prazo que fecha depressa. O lançamento por subscrição do Fable 5 é faseado:

  • De 9 de junho até 22 de junho, o Fable 5 está incluído nos planos Pro, Max, Team e Enterprise por lugar sem custo extra.
  • A 23 de junho, o Fable 5 sai desses planos. Usá-lo depois disso exige créditos de utilização. A Anthropic diz que pode prolongar a janela se a capacidade permitir.
  • Eventualmente, a Anthropic pretende restaurar o Fable 5 como parte padrão dos planos de subscrição, sem data comprometida.

Nos planos de API e Enterprise baseados em consumo, o Fable 5 é totalmente medido a $10/$50 desde o primeiro dia. Mas se estás numa subscrição, a janela até 22 de junho é um período de avaliação gratuito. Usa-a para correr as tuas tarefas reais no Fable 5, medir o gasto por tarefa concluída face ao Opus 4.8 e decidir se vale o lugar em créditos de utilização depois do dia 23. Depois disso, o uso casual passa a ser medido por créditos, por isso a altura de fazer o benchmark é agora.

O Manual de Controlo de Custos

Junta as alavancas e a estratégia é curta:

  1. Encaminha por tarefa. Define por defeito o tráfego de rotina para o Opus 4.8 ou o Sonnet 4.6; reserva o Fable 5 para a cauda difícil de longo horizonte.
  2. Baixa o esforço antes de mudar de modelo. O esforço medium no Fable bate muitas vezes o Opus no seu esforço máximo, a uma fração do gasto em tokens de raciocínio.
  3. Faz cache de forma agressiva. Os acertos de cache são $1/1M contra $10/1M fresco, uma alavanca de 10x em contexto repetido.
  4. Limita loops com orçamentos de tarefa. O header beta limita uma execução agêntica (mínimo de 20.000 tokens) para que não se descontrole.
  5. Faz batch do trabalho offline. Metade do preço a $5/$25 para tudo o que não precisa de tempo real.
  6. Faz benchmark na janela gratuita. Avalia em tarefas reais antes de 22 de junho, enquanto é grátis nos planos de subscrição.

O Veredicto

O preço do Fable 5 é simples de enunciar e fácil de ler mal. A etiqueta é exatamente 2x do Opus 4.8, mas a etiqueta é o número errado. O esforço, os orçamentos de tarefa, o caching, o batch, o routing e a própria eficiência de tokens do Fable dobram todos a conta real, às vezes abaixo do modelo mais barato em tarefas difíceis e bem acima dele em tarefas de rotina.

Gasta a tua atenção nas alavancas, não na tabela de preços. Encaminha o trabalho fácil para modelos mais baratos, envia só a cauda difícil para o Fable, afina o esforço e limita os orçamentos, e usa a janela gratuita para aprenderes o teu próprio gasto-por-tarefa antes de o contador arrancar a 23 de junho.

Perguntas Frequentes

Quanto custa o Claude Fable 5?

O Claude Fable 5 custa $10 por milhão de tokens de entrada e $50 por milhão de tokens de saída, exatamente o dobro do Opus 4.8 ($5/$25). Uma tarefa de 100K de entrada / 20K de saída fica a $2,00 no Fable 5 contra $1,00 no Opus 4.8. A batch API corta a taxa para metade, $5/$25, e os acertos de cache baixam a entrada para $1 por milhão.

Porque é que o Claude Fable 5 custa o dobro do Opus 4.8?

O Fable 5 é o primeiro modelo de classe Mythos disponível ao público, um patamar de capacidade acima da classe Opus, e o preço reflete esse patamar. Ainda é menos de metade do preço do Mythos Preview (~$30/$150), o modelo restrito de que descende. A Anthropic argumenta que o ROI mais alto por tarefa concluída pode compensar o prémio por token em trabalho difícil.

Como funciona o preço de fallback do Claude Fable 5?

Quando os classificadores de segurança do Fable 5 encaminham um pedido para o Opus 4.8, pagas taxas de Opus, não de Fable. Se um pedido for bloqueado a meio da conversa, os tokens iniciais faturam a taxas de Fable e os tokens seguintes faturam a taxas de Opus. Este fallback dispara em menos de 5% das sessões em cargas de trabalho típicas.

Como controlo os custos no Claude Fable 5?

Usa cinco alavancas: baixa o esforço de raciocínio (medium bate muitas vezes o Opus no esforço máximo), limita loops agênticos com orçamentos de tarefa (mínimo de 20.000 tokens), faz cache de contexto repetido (os acertos de cache são $1/1M contra $10/1M), usa a batch API para trabalho offline (metade do preço) e encaminha só as tarefas difíceis para o Fable mantendo o trabalho de rotina no Opus 4.8 ou no Sonnet 4.6.

O Claude Fable 5 é grátis neste momento?

Nos planos de subscrição Pro, Max, Team e Enterprise por lugar, o Fable 5 está incluído sem custo extra de 9 de junho a 22 de junho de 2026. A 23 de junho sai desses planos e passa a exigir créditos de utilização. Nos planos de API e Enterprise baseados em consumo, é medido a $10/$50 desde o primeiro dia.

A eficiência de tokens pode tornar o Claude Fable 5 mais barato que o Opus 4.8?

Na tarefa certa, sim. Um laboratório de física relatou que o Fable 5 usou um terço dos tokens de raciocínio de um modelo rival, o que ao dobro do preço por token dá dois terços do custo efetivo. Menos turnos e maiores taxas de sucesso à primeira reduzem o gasto por tarefa concluída, mesmo que a tabela de preços seja o dobro.

Fontes

  • Claude Fable 5 and Claude Mythos 5
  • Claude Fable 5 on AWS (AWS News Blog)
  • Anthropic's Claude Fable 5 is a version of Mythos the public can access today (TechCrunch)
  • Anthropic releases Mythos-like AI model to the public (CNBC)
  • Prompting Claude Fable 5 (API docs)
  • Claude Fable 5 and Mythos 5 pricing and benchmarks (Finout)
  • Claude Fable 5 vs Opus 4.8 (TrueFoundry)

Páginas Relacionadas

  • Claude Fable 5 vs Opus 4.8
  • Cheatsheet do Opus 4.8
  • Claude Opus 4.7 vs 4.6
  • Modelos do Claude Code

More in Model Picker

  • Claude Mythos: O Modelo que Pensa em Ciclos
    Suspeita-se que o Claude Mythos use arquitetura de profundidade recorrente: uma camada partilhada em loop N vezes, com halting ACT para que perguntas difíceis recebam mais passagens e as fáceis parem cedo.
  • Claude Opus 4.7 vs Outros Modelos de IA
    Claude Opus 4.7, GPT-5.4, Kimi K2.6, Gemini 3.1 Pro, DeepSeek V3.2: benchmarks, janelas de contexto, fiabilidade em agentes e custos, para escolheres o modelo certo para cada trabalho.
  • DeepSeek V4: Pricing, Context, and Migration
    DeepSeek V4 ships two models: V4-Flash at $0.28/M output and V4-Pro at $3.48/M. Both carry a genuine 1M context window and drop into any Anthropic-compatible SDK with one line changed.
  • Todos os Modelos Claude
    Todos os modelos Claude numa só página: Claude 3, 3.5, 3.7, 4, Opus 4.1 a 4.6, Sonnet 4.5 e 4.6, Haiku 4.5. Especificações, preços, benchmarks e quando usar cada um.
  • Best AI Model for Coding in 2026 (Tested & Ranked)
    The best AI model for coding in 2026, ranked by use case and budget: Claude Opus 4.8 for hardest agentic work, GPT-5.5 for terminal agents, DeepSeek V4 for value, with cited benchmarks.
  • Claude 3.5 Sonnet v2 e Claude 3.5 Haiku
    Claude 3.5 Sonnet v2 e 3.5 Haiku lançados em outubro de 2024 com Computer Use beta, controlo de cursor, programação e uso de ferramentas melhorados, e Haiku mais barato a $0.80/$4.

Pare de configurar. Comece a construir.

Templates SaaS com orquestração de IA.

Casos de Uso do Claude Fable 5

O que as pessoas fizeram mesmo com o Claude Fable 5 no acesso antecipado: uma migração do Stripe num dia, o Hex a passar os 90% em análise de dados, web apps reconstruídas a partir de screenshots e um agente de programação que entrega uma semana de trabalho numa tarde. Implementações reais, com nomes e números.

Guia da API do Claude Fable 5

Como chamar o Claude Fable 5 a partir da API: o ID do modelo, as armadilhas dos 400 (incluindo a nova do thinking desativado), afinação do esforço, orçamentos de tarefa, caching e a cilada da retenção de dados no Bedrock.

On this page

A Tabela de Preços
Quanto Custa Mesmo uma Tarefa
Alavanca 1: Caching, o Desconto de 10x em Contexto Repetido
Alavanca 2: Esforço, o Botão Suave
Alavanca 3: Orçamentos de Tarefa, o Limite Rígido
Alavanca 4: Batch API, Metade do Preço para Trabalho Offline
Alavanca 5: Routing, Só a Cauda Difícil Vai para o Fable
A Particularidade do Preço de Fallback
Quando a Etiqueta de 2x Mente
Alavanca 6: A Janela Gratuita Antes de 22 de Junho
O Manual de Controlo de Custos
O Veredicto
Perguntas Frequentes
Quanto custa o Claude Fable 5?
Porque é que o Claude Fable 5 custa o dobro do Opus 4.8?
Como funciona o preço de fallback do Claude Fable 5?
Como controlo os custos no Claude Fable 5?
O Claude Fable 5 é grátis neste momento?
A eficiência de tokens pode tornar o Claude Fable 5 mais barato que o Opus 4.8?
Fontes
Páginas Relacionadas

Pare de configurar. Comece a construir.

Templates SaaS com orquestração de IA.