Modelos do Claude Code

Problema: Muitos desenvolvedores usam Opus em tudo e queimam o orçamento, ou ficam no Haiku onde ele não consegue acompanhar. Trocar de modelo conforme o que a tarefa realmente exige pode reduzir de 60 a 80% dos seus custos de uso.

Ganho Rápido: Faça do Sonnet seu modelo padrão agora mesmo:

claude --model sonnet

Você economiza cerca de 80% no custo e mantém boa performance em aproximadamente 90% do trabalho de desenvolvimento diário.

Aliases de Modelos

Claude Code vem com aliases para você não precisar memorizar números de versão. Esses são os atalhos que você usa todo dia:

Alias	Comportamento
`default`	Modelo recomendado para o seu tipo de conta. Usuários Max têm fallback automático de Opus para Sonnet nos limites
`sonnet`	Modelo Sonnet mais recente (atualmente Sonnet 4.5) para tarefas diárias de codificação
`opus`	Modelo Opus (atualmente Opus 4.6) para raciocínio complexo
`haiku`	Modelo Haiku rápido e eficiente para tarefas simples
`sonnet[1m]`	Sonnet com janela de contexto de 1 milhão de tokens para sessões longas (usuários Console/API)
`opusplan`	Usa Opus no modo de planejamento, depois muda automaticamente para Sonnet na execução

O alias default acompanha o seu tipo de conta. Em certas contas Max, o Claude Code faz fallback automático de Opus para Sonnet ao atingir um limite de uso, para você continuar trabalhando sem precisar mudar nenhuma flag.

Usuários de Console e API têm acesso ao sonnet[1m], que abre uma janela de contexto de 1 milhão de tokens. Sessões longas que normalmente ultrapassariam o limite de compactação ficam confortáveis dentro dela. Modelos com contexto estendido têm tarifas diferentes, então tenha isso em mente.

Usuários de Console e API também podem adicionar o sufixo [1m] a um nome completo de modelo:

/model anthropic.claude-sonnet-4-5-20250929-v1:0[1m]

A Estratégia Inteligente de Modelos

O hábito mais caro é rodar um único modelo para tudo. Claude Code oferece vários, cada um otimizado para um tipo diferente de trabalho. Alterne entre eles e você pode cortar os custos de uso em 80% enquanto os resultados melhoram.

Sonnet: Seu Modelo do Dia a Dia

Melhor para: 90% do trabalho de desenvolvimento

# Start Claude Code with Sonnet (usually the default)
claude --model sonnet

Perfeito para:

Implementação de funcionalidades e correção de bugs
Revisão de código e refatoração
Integração de APIs e trabalho com banco de dados
Escrita de testes e documentação

Por que o Sonnet vence: 90% da capacidade do Opus com 2x mais velocidade, raramente atinge limites de uso, ideal para fluxo de trabalho de programação em par.

Opus: O Peso Pesado

Quando fazer upgrade: Apenas para decisões arquiteturais complexas

# Start with Opus for deep analysis sessions
claude --model opus

Use Opus para:

Refatoração em grande escala em múltiplos sistemas
Depuração complexa com dependências intrincadas
Decisões de arquitetura que exigem raciocínio profundo
Revisões avançadas de segurança

Realidade de custo: 5x mais caro que o Sonnet, mas justificado para tarefas que exigem o máximo de raciocínio.

Haiku: O Velocista

Quando fazer downgrade: Tarefas simples e repetitivas

# Fast and cheap for basic operations
claude --model haiku

Perfeito para:

Leituras simples de arquivos e formatação
Validação básica de sintaxe
Verificações rápidas de status
Transformações de texto

Aviso: Não use Haiku para desenvolvimento real. Ele tem dificuldades com lógica complexa e projetos com múltiplos arquivos.

Opusplan: O Melhor dos Dois Mundos

Quando usar: Tarefas complexas onde você quer o raciocínio do Opus sem pagar Opus para tudo

# Hybrid mode: Opus plans, Sonnet executes
claude --model opusplan

Como funciona:

No modo de planejamento: Usa Opus para raciocínio complexo e decisões de arquitetura
No modo de execução: Muda automaticamente para Sonnet na geração de código e implementação

A fase de planejamento roda no Opus para o raciocínio profundo, depois a execução cai para o Sonnet pela velocidade e custo na parte de escrita de código. A qualidade do Opus aparece onde importa (no início), e o resto da sessão fica barato.

Sessões de refatoração, planejamento de funcionalidades e qualquer fluxo de trabalho que depende muito do modo de planejamento são um bom encaixe para opusplan. Como o preço do Opus só se aplica durante o planejamento, funciona também como tática de otimização de custos.

Troca Tática de Modelos

Comece com Sonnet. Escale quando a tarefa realmente exigir.

Durante Sessões de Desenvolvimento

# Start your session with Sonnet
claude --model sonnet

# Mid-session: switch to Opus for complex refactoring
/model opus

# Back to Sonnet for regular work
/model sonnet

# Drop to Haiku for simple tasks
/model haiku

Padrão de Otimização de Custos

Padrão: Sonnet para todo desenvolvimento comum
Híbrido: Use opusplan para sessões que misturam planejamento e implementação
Escale: Mude para Opus completo apenas quando o Sonnet tiver dificuldades nas tarefas de execução
Delegue: Use Haiku para operações simples de arquivo
Monitore: Acompanhe o uso para otimizar a seleção de modelos

Rodando assim, sua conta cai de 60 a 80% em comparação a um fluxo de trabalho de Opus puro.

Seleção de Modelo por Tipo de Tarefa

Rankings de Velocidade de Análise de Código

Haiku: Análise instantânea mas superficial
Sonnet: Rápido com excelente profundidade
Opus: Mais lento mas com análise mais profunda

Rankings de Qualidade de Raciocínio

Opus: Superior para problemas complexos com múltiplas etapas
Sonnet: Excelente para a maioria dos cenários de desenvolvimento
Haiku: Raciocínio básico apenas

Rankings de Eficiência de Custo

Haiku: Mais barato por tarefa (capacidade limitada)
Sonnet: Melhor desempenho por dólar
Opus: Preço premium para capacidade premium

Configuração de Modelos

Há vários lugares para definir seu modelo, e a cadeia de prioridade é rígida. Uma configuração de maior prioridade sempre supera uma de menor prioridade:

Durante a sessão - /model <alias|nome> troca de modelo no meio da sessão (maior prioridade)
Na inicialização - claude --model <alias|nome> define o modelo para aquela sessão
Variável de ambiente - ANTHROPIC_MODEL=<alias|nome> persiste entre sessões
Arquivo de configurações - O campo model no settings.json para configuração permanente (menor prioridade)

Para fixar um modelo permanentemente, adicione um campo model ao seu arquivo de configurações:

// ~/.claude/settings.json
{
  "permissions": {},
  "model": "sonnet"
}

Com isso configurado, você para de passar --model toda vez que iniciar o Claude Code.

Controlando Para Onde os Aliases Apontam

Apontar um alias para uma versão específica, ou para uma implantação Bedrock ou Vertex, é feito através de variáveis de ambiente:

Variável de Ambiente	Controla
`ANTHROPIC_DEFAULT_OPUS_MODEL`	Modelo usado para `opus`, e para `opusplan` durante o modo de planejamento
`ANTHROPIC_DEFAULT_SONNET_MODEL`	Modelo usado para `sonnet`, e para `opusplan` durante a execução
`ANTHROPIC_DEFAULT_HAIKU_MODEL`	Modelo usado para `haiku` e funcionalidades em segundo plano
`CLAUDE_CODE_SUBAGENT_MODEL`	Modelo usado para sub-agentes (substitui o modelo padrão de sub-agentes)

Note que ANTHROPIC_SMALL_FAST_MODEL está obsoleto. ANTHROPIC_DEFAULT_HAIKU_MODEL o substitui.

Usuários de Bedrock, Foundry e Vertex usam bastante essas variáveis, já que essas plataformas precisam de ARNs de perfil de inferência, nomes de implantação ou nomes de versão em vez dos IDs de modelo padrão da Anthropic.

Verificando Seu Modelo Atual

Duas formas de ver em qual modelo uma sessão está:

Execute /status para exibir seu modelo atual e informações da conta
Configure uma StatusLine para mostrar o modelo de forma persistente no seu terminal

Configuração de Cache de Prompts

O cache de prompts está ativado por padrão no Claude Code e ajuda tanto no desempenho quanto no custo. Se você precisar desativá-lo, para depuração, benchmarking ou uma configuração específica de API, essas variáveis de ambiente controlam isso:

Variável de Ambiente	Efeito
`DISABLE_PROMPT_CACHING`	Desativa o cache para todos os modelos (substitui por modelo)
`DISABLE_PROMPT_CACHING_HAIKU`	Desativa o cache apenas para modelos Haiku
`DISABLE_PROMPT_CACHING_SONNET`	Desativa o cache apenas para modelos Sonnet
`DISABLE_PROMPT_CACHING_OPUS`	Desativa o cache apenas para modelos Opus

Defina qualquer uma delas como 1 para desativar o cache. O DISABLE_PROMPT_CACHING global tem precedência sobre as flags por modelo. Desativar o cache aumenta custo e latência, então só faça isso quando houver um motivo específico.

Erros Comuns na Seleção de Modelos

Erro 1: Usar Opus para tudo

Problema: Custos 5x maiores com respostas mais lentas
Solução: Padronize no Sonnet, escale seletivamente

Erro 2: Ficar no Haiku por muito tempo

Problema: Qualidade de código ruim, problemas ignorados
Solução: Mude para Sonnet para qualquer desenvolvimento real

Erro 3: Não trocar de modelo no meio da sessão

Problema: Usando o modelo errado para a tarefa atual
Solução: Use /model opus ou /model sonnet para mudar na hora

Referência Rápida

Tipo de Tarefa	Modelo Recomendado	Por quê
Codificação diária	Sonnet	Melhor equilíbrio entre velocidade e capacidade
Planejar + implementar	opusplan	Raciocínio Opus para planos, Sonnet para código
Arquitetura complexa	Opus	Máxima profundidade de raciocínio
Operações simples de arquivo	Haiku	Rápido e barato
Sessões longas	sonnet[1m]	Janela de 1M tokens evita compactação
Depuração	Comece com Sonnet, escale para Opus se travar	Escalada progressiva

Para iniciantes: Comece com Sonnet para aprender os fluxos de trabalho.

Para desenvolvimento diário: Sonnet como padrão com Opus para depuração complexa.

Para otimização de orçamento: Troca estratégica baseada na complexidade da tarefa.

Para aprender: Consulte nosso guia de configuração para definir os padrões de modelo.

Escolha o modelo certo por tarefa e você escreve código mais rápido gastando menos. O poder equilibrado do Sonnet cuida da maior parte do trabalho. Opus é para as partes que genuinamente precisam da sua profundidade.

Próxima Ação: Configure sua configuração de modelo ideal com nosso guia de otimização de desempenho e depois aprenda técnicas avançadas de gerenciamento de contexto.

Para especificações detalhadas de todos os modelos Claude que a Anthropic lançou, veja a linha do tempo completa de modelos.

Guias Relacionados:

Técnicas de Pensamento Profundo - Quando usar pensamento estendido com Opus
Padrões de Eficiência - Construa frameworks para saídas consistentes
Otimização de Uso - Acompanhe e reduza seus custos

Modelos do Claude Code

On this page