Modelos do Claude Code
Escolha o modelo Claude Code certo: Sonnet, Opus, Haiku, sonnet[1m] ou opusplan. Trocar de modelo por tarefa reduz os custos em 60-80% sem sacrificar a qualidade.
Pare de configurar. Comece a construir.
Templates SaaS com orquestração de IA.
Problema: Muitos desenvolvedores usam Opus em tudo e queimam o orçamento, ou ficam no Haiku onde ele não consegue acompanhar. Trocar de modelo conforme o que a tarefa realmente exige pode reduzir de 60 a 80% dos seus custos de uso.
Ganho Rápido: Faça do Sonnet seu modelo padrão agora mesmo:
claude --model sonnet
Você economiza cerca de 80% no custo e mantém boa performance em aproximadamente 90% do trabalho de desenvolvimento diário.
Aliases de Modelos
Claude Code vem com aliases para você não precisar memorizar números de versão. Esses são os atalhos que você usa todo dia:
| Alias | Comportamento |
|---|---|
default | Modelo recomendado para o seu tipo de conta. Usuários Max têm fallback automático de Opus para Sonnet nos limites |
sonnet | Modelo Sonnet mais recente (atualmente Sonnet 4.5) para tarefas diárias de codificação |
opus | Modelo Opus (atualmente Opus 4.6) para raciocínio complexo |
haiku | Modelo Haiku rápido e eficiente para tarefas simples |
sonnet[1m] | Sonnet com janela de contexto de 1 milhão de tokens para sessões longas (usuários Console/API) |
opusplan | Usa Opus no modo de planejamento, depois muda automaticamente para Sonnet na execução |
O alias default acompanha o seu tipo de conta. Em certas contas Max, o Claude Code faz fallback automático de Opus para Sonnet ao atingir um limite de uso, para você continuar trabalhando sem precisar mudar nenhuma flag.
Usuários de Console e API têm acesso ao sonnet[1m], que abre uma janela de contexto de 1 milhão de tokens. Sessões longas que normalmente ultrapassariam o limite de compactação ficam confortáveis dentro dela. Modelos com contexto estendido têm tarifas diferentes, então tenha isso em mente.
Usuários de Console e API também podem adicionar o sufixo [1m] a um nome completo de modelo:
/model anthropic.claude-sonnet-4-5-20250929-v1:0[1m]
A Estratégia Inteligente de Modelos
O hábito mais caro é rodar um único modelo para tudo. Claude Code oferece vários, cada um otimizado para um tipo diferente de trabalho. Alterne entre eles e você pode cortar os custos de uso em 80% enquanto os resultados melhoram.
Sonnet: Seu Modelo do Dia a Dia
Melhor para: 90% do trabalho de desenvolvimento
# Start Claude Code with Sonnet (usually the default)
claude --model sonnetPerfeito para:
- Implementação de funcionalidades e correção de bugs
- Revisão de código e refatoração
- Integração de APIs e trabalho com banco de dados
- Escrita de testes e documentação
Por que o Sonnet vence: 90% da capacidade do Opus com 2x mais velocidade, raramente atinge limites de uso, ideal para fluxo de trabalho de programação em par.
Opus: O Peso Pesado
Quando fazer upgrade: Apenas para decisões arquiteturais complexas
# Start with Opus for deep analysis sessions
claude --model opusUse Opus para:
- Refatoração em grande escala em múltiplos sistemas
- Depuração complexa com dependências intrincadas
- Decisões de arquitetura que exigem raciocínio profundo
- Revisões avançadas de segurança
Realidade de custo: 5x mais caro que o Sonnet, mas justificado para tarefas que exigem o máximo de raciocínio.
Haiku: O Velocista
Quando fazer downgrade: Tarefas simples e repetitivas
# Fast and cheap for basic operations
claude --model haikuPerfeito para:
- Leituras simples de arquivos e formatação
- Validação básica de sintaxe
- Verificações rápidas de status
- Transformações de texto
Aviso: Não use Haiku para desenvolvimento real. Ele tem dificuldades com lógica complexa e projetos com múltiplos arquivos.
Opusplan: O Melhor dos Dois Mundos
Quando usar: Tarefas complexas onde você quer o raciocínio do Opus sem pagar Opus para tudo
# Hybrid mode: Opus plans, Sonnet executes
claude --model opusplanComo funciona:
- No modo de planejamento: Usa Opus para raciocínio complexo e decisões de arquitetura
- No modo de execução: Muda automaticamente para Sonnet na geração de código e implementação
A fase de planejamento roda no Opus para o raciocínio profundo, depois a execução cai para o Sonnet pela velocidade e custo na parte de escrita de código. A qualidade do Opus aparece onde importa (no início), e o resto da sessão fica barato.
Sessões de refatoração, planejamento de funcionalidades e qualquer fluxo de trabalho que depende muito do modo de planejamento são um bom encaixe para opusplan. Como o preço do Opus só se aplica durante o planejamento, funciona também como tática de otimização de custos.
Troca Tática de Modelos
Comece com Sonnet. Escale quando a tarefa realmente exigir.
Durante Sessões de Desenvolvimento
# Start your session with Sonnet
claude --model sonnet
# Mid-session: switch to Opus for complex refactoring
/model opus
# Back to Sonnet for regular work
/model sonnet
# Drop to Haiku for simple tasks
/model haikuPadrão de Otimização de Custos
- Padrão: Sonnet para todo desenvolvimento comum
- Híbrido: Use
opusplanpara sessões que misturam planejamento e implementação - Escale: Mude para Opus completo apenas quando o Sonnet tiver dificuldades nas tarefas de execução
- Delegue: Use Haiku para operações simples de arquivo
- Monitore: Acompanhe o uso para otimizar a seleção de modelos
Rodando assim, sua conta cai de 60 a 80% em comparação a um fluxo de trabalho de Opus puro.
Seleção de Modelo por Tipo de Tarefa
Rankings de Velocidade de Análise de Código
- Haiku: Análise instantânea mas superficial
- Sonnet: Rápido com excelente profundidade
- Opus: Mais lento mas com análise mais profunda
Rankings de Qualidade de Raciocínio
- Opus: Superior para problemas complexos com múltiplas etapas
- Sonnet: Excelente para a maioria dos cenários de desenvolvimento
- Haiku: Raciocínio básico apenas
Rankings de Eficiência de Custo
- Haiku: Mais barato por tarefa (capacidade limitada)
- Sonnet: Melhor desempenho por dólar
- Opus: Preço premium para capacidade premium
Configuração de Modelos
Há vários lugares para definir seu modelo, e a cadeia de prioridade é rígida. Uma configuração de maior prioridade sempre supera uma de menor prioridade:
- Durante a sessão -
/model <alias|nome>troca de modelo no meio da sessão (maior prioridade) - Na inicialização -
claude --model <alias|nome>define o modelo para aquela sessão - Variável de ambiente -
ANTHROPIC_MODEL=<alias|nome>persiste entre sessões - Arquivo de configurações - O campo
modelno settings.json para configuração permanente (menor prioridade)
Para fixar um modelo permanentemente, adicione um campo model ao seu arquivo de configurações:
// ~/.claude/settings.json
{
"permissions": {},
"model": "sonnet"
}Com isso configurado, você para de passar --model toda vez que iniciar o Claude Code.
Controlando Para Onde os Aliases Apontam
Apontar um alias para uma versão específica, ou para uma implantação Bedrock ou Vertex, é feito através de variáveis de ambiente:
| Variável de Ambiente | Controla |
|---|---|
ANTHROPIC_DEFAULT_OPUS_MODEL | Modelo usado para opus, e para opusplan durante o modo de planejamento |
ANTHROPIC_DEFAULT_SONNET_MODEL | Modelo usado para sonnet, e para opusplan durante a execução |
ANTHROPIC_DEFAULT_HAIKU_MODEL | Modelo usado para haiku e funcionalidades em segundo plano |
CLAUDE_CODE_SUBAGENT_MODEL | Modelo usado para sub-agentes (substitui o modelo padrão de sub-agentes) |
Note que ANTHROPIC_SMALL_FAST_MODEL está obsoleto. ANTHROPIC_DEFAULT_HAIKU_MODEL o substitui.
Usuários de Bedrock, Foundry e Vertex usam bastante essas variáveis, já que essas plataformas precisam de ARNs de perfil de inferência, nomes de implantação ou nomes de versão em vez dos IDs de modelo padrão da Anthropic.
Verificando Seu Modelo Atual
Duas formas de ver em qual modelo uma sessão está:
- Execute
/statuspara exibir seu modelo atual e informações da conta - Configure uma StatusLine para mostrar o modelo de forma persistente no seu terminal
Configuração de Cache de Prompts
O cache de prompts está ativado por padrão no Claude Code e ajuda tanto no desempenho quanto no custo. Se você precisar desativá-lo, para depuração, benchmarking ou uma configuração específica de API, essas variáveis de ambiente controlam isso:
| Variável de Ambiente | Efeito |
|---|---|
DISABLE_PROMPT_CACHING | Desativa o cache para todos os modelos (substitui por modelo) |
DISABLE_PROMPT_CACHING_HAIKU | Desativa o cache apenas para modelos Haiku |
DISABLE_PROMPT_CACHING_SONNET | Desativa o cache apenas para modelos Sonnet |
DISABLE_PROMPT_CACHING_OPUS | Desativa o cache apenas para modelos Opus |
Defina qualquer uma delas como 1 para desativar o cache. O DISABLE_PROMPT_CACHING global tem precedência sobre as flags por modelo. Desativar o cache aumenta custo e latência, então só faça isso quando houver um motivo específico.
Erros Comuns na Seleção de Modelos
Erro 1: Usar Opus para tudo
- Problema: Custos 5x maiores com respostas mais lentas
- Solução: Padronize no Sonnet, escale seletivamente
Erro 2: Ficar no Haiku por muito tempo
- Problema: Qualidade de código ruim, problemas ignorados
- Solução: Mude para Sonnet para qualquer desenvolvimento real
Erro 3: Não trocar de modelo no meio da sessão
- Problema: Usando o modelo errado para a tarefa atual
- Solução: Use
/model opusou/model sonnetpara mudar na hora
Referência Rápida
| Tipo de Tarefa | Modelo Recomendado | Por quê |
|---|---|---|
| Codificação diária | Sonnet | Melhor equilíbrio entre velocidade e capacidade |
| Planejar + implementar | opusplan | Raciocínio Opus para planos, Sonnet para código |
| Arquitetura complexa | Opus | Máxima profundidade de raciocínio |
| Operações simples de arquivo | Haiku | Rápido e barato |
| Sessões longas | sonnet[1m] | Janela de 1M tokens evita compactação |
| Depuração | Comece com Sonnet, escale para Opus se travar | Escalada progressiva |
Para iniciantes: Comece com Sonnet para aprender os fluxos de trabalho.
Para desenvolvimento diário: Sonnet como padrão com Opus para depuração complexa.
Para otimização de orçamento: Troca estratégica baseada na complexidade da tarefa.
Para aprender: Consulte nosso guia de configuração para definir os padrões de modelo.
Escolha o modelo certo por tarefa e você escreve código mais rápido gastando menos. O poder equilibrado do Sonnet cuida da maior parte do trabalho. Opus é para as partes que genuinamente precisam da sua profundidade.
Próxima Ação: Configure sua configuração de modelo ideal com nosso guia de otimização de desempenho e depois aprenda técnicas avançadas de gerenciamento de contexto.
Para especificações detalhadas de todos os modelos Claude que a Anthropic lançou, veja a linha do tempo completa de modelos.
Guias Relacionados:
- Técnicas de Pensamento Profundo - Quando usar pensamento estendido com Opus
- Padrões de Eficiência - Construa frameworks para saídas consistentes
- Otimização de Uso - Acompanhe e reduza seus custos
Pare de configurar. Comece a construir.
Templates SaaS com orquestração de IA.