Preços e Consumo de Tokens no Claude Code
Corta os custos do Claude Code em 40-70% com o ccusage para tracking, /model para mudar de modelo, /compact e /clear, modo de planeamento e o plano que encaixa no teu workload.
Pare de configurar. Comece a construir.
Templates SaaS com orquestração de IA.
Problema: A tua fatura do Claude Code continua a subir, continuas a bater em limites de utilização e não sabes bem qual o plano que se encaixa no teu fluxo de trabalho. A escolha certa de modelo e um pouco de tracking pode cortar os custos em 40-70%.
Ganho Rápido: Instala o ccusage e vê exatamente onde estão a ir os teus tokens:
npm install -g @ryoppippi/ccusage
ccusage dailyIsso mostra o consumo de tokens de hoje e uma análise de custos imediatamente.
Preços do Claude Code
Claude Code precisa de pelo menos uma subscrição Pro ($20/mês). O plano gratuito não tem acesso ao terminal.
Claude Pro ($20/mês). 5x os limites gratuitos, acesso ao Sonnet, cerca de 45 mensagens por janela de 5 horas. Ideal para aprender e projetos pessoais.
Claude Max 5x ($100/mês). 5x os limites do Pro (~225 mensagens por 5h), acesso generoso ao Opus. Ideal para programadores a tempo inteiro.
Claude Max 20x ($200/mês). 20x os limites do Pro (~900 mensagens por 5h), acesso total ao Opus. Ideal para uso diário intenso e engenharia complexa.
API pay-per-use. Sonnet: $3/$15 por milhão de tokens de entrada/saída. Opus: $15/$75 por milhão de tokens. Ideal para trabalho de alto volume previsível.
Comandos Que Cortam Custos
Mudar de modelo com /model
Muda conforme a complexidade da tarefa:
/model sonnet # Default para 80% das tarefas
/model opus # Só para decisões arquiteturais complexasRegra: começa cada sessão no Sonnet. Só muda para Opus quando precisas de análise profunda ou uma grande refatoração.
Controlo do contexto
/compact # Comprime a conversa quando o contexto fica longo
/clear # Começa do zero para tarefas não relacionadasConversas longas gastam mais tokens em cada nova mensagem. Executa /compact quando Claude começa a perder o fio, e /clear quando mudas para um tipo diferente de trabalho.
Modo de planeamento (Shift+Tab)
Pressiona Shift+Tab duas vezes no terminal para entrar no modo de planeamento antes de uma operação cara. Planear primeiro poupa dinheiro em retrabalho. Claude esboça a abordagem antes de escrever código, para apanhares problemas cedo.
Acompanha o Teu Uso
Monitoriza os gastos com os relatórios do ccusage:
ccusage daily # Resumo diário (por defeito)
ccusage monthly # Agregação mensal
ccusage blocks --live # Janelas de faturação de 5h em tempo real
ccusage daily --breakdown # Análise de custo por modeloFiltra por intervalo de datas quando estás a investigar um pico:
ccusage daily --since 20250101 --until 20250131
Padrões de Poupança
Prompts específicos batem os vagos. Compara:
# Caro (desperdiça tokens em esclarecimentos)
claude "make this better"
# Eficiente (resultados imediatos)
claude "optimize readability in src/auth.js - extract constants, add error handling"Agrupa tarefas relacionadas para aproveitar bem o contexto:
claude "update error handling in auth.js, user.js, and api.js"
Atenção a hábitos caros:
- Sessões longas de debugging. Divide-as em pedidos menores e focados.
- Explicações repetidas. Guarda-as no CLAUDE.md.
- Revisões completas do codebase. Aponta para ficheiros específicos.
Variáveis de Ambiente para Controlar Custos
Mudar de modelo é uma alavanca. Algumas variáveis de ambiente dão-te controlo direto sobre o gasto de tokens.
Cortar chamadas não essenciais
# Suprime chamadas de modelo em background que não são críticas para a tua tarefa
export DISABLE_NON_ESSENTIAL_MODEL_CALLS=1Isto desativa chamadas de modelo para funcionalidades não críticas como sugestões e dicas. O teu fluxo principal fica intacto, mas o uso de tokens em background cai.
Desativar avisos de custo
# Suprime mensagens de aviso de custo no CLI
export DISABLE_COST_WARNINGS=1Útil quando já tens um orçamento definido e não queres interrupções. Não recomendado até teres uma base de referência do ccusage.
Controlo de prompt caching
Claude Code usa prompt caching por defeito para reduzir custo e latência. Se precisares de desativar para debugging ou benchmarking:
# Desativa prompt caching globalmente
export DISABLE_PROMPT_CACHING=1
# Ou desativa por modelo
export DISABLE_PROMPT_CACHING_HAIKU=1
export DISABLE_PROMPT_CACHING_SONNET=1
export DISABLE_PROMPT_CACHING_OPUS=1A configuração global sobrepõe-se às configurações por modelo. Mantém o caching ativo em produção, corta muito os custos em contexto repetido.
A estratégia opusplan
Se queres raciocínio ao nível do Opus sem as faturas do Opus, o alias de modelo opusplan faz um híbrido:
claude --model opusplan
Com opusplan, Claude corre Opus durante o modo de planeamento para chamadas de raciocínio e arquitetura, depois muda para Sonnet para a geração de código e implementação. Tens qualidade Opus onde interessa (planeamento) sem pagar tarifas Opus por cada linha de código.
Esta é uma das movimentações de custo mais eficazes se usas o modo de planeamento regularmente.
Quando As Coisas Correm Mal
A aproximar-se do limite? Muda de modelo e comprime:
/model sonnet
/compactAtingiste um rate limit? Espera pelo reset horário, agrupa pedidos em vez de os disparar rapidamente, ou sobe um nível de plano.
Páginas Relacionadas
- Instala o ccusage e executa
ccusage daily --breakdown - Gestão de contexto para menos desperdício de tokens
- Seleção de modelo para o teu fluxo de trabalho
- Dicas de troubleshooting para evitar debugging caro
Acompanha semanalmente e ajusta com base nos dados. A maioria dos programadores corta custos em 40-70% com estas mudanças.
Pare de configurar. Comece a construir.
Templates SaaS com orquestração de IA.