Técnicas de Pensamento Profundo
Frases de gatilho como think harder, ultrathink e think step by step empurram o Claude Code para raciocínio expandido e mais computação em tempo de inferência, no mesmo modelo.
Pare de configurar. Comece a construir.
Templates SaaS com orquestração de IA.
Problema: Trabalho difícil, respostas superficiais. Precisavas da causa raiz. Recebeste um patch à superfície.
Solução rápida: Coloca uma frase de gatilho de pensamento no teu próximo prompt do Claude Code:
claude "think harder about this: Analyze this codebase and suggest architectural improvements"think harder, ultrathink e think step by step dizem ao Claude para gastar mais computação em tempo de inferência antes de responder.
O Que É o Pensamento Profundo?
O pensamento profundo é o que uma frase de gatilho ativa. Adiciona think harder, ultrathink ou think step by step ao prompt, e o Claude gasta mais computação em tempo de inferência no problema antes de a resposta chegar.
Não são comandos CLI. São pistas em linguagem simples que ativam o pensamento expandido. Prompts normais respondem depressa. Prompts com frase de gatilho respondem com mais cuidado.
A Pilha de Desempenho
Nível 1: Pensamento Expandido
Começa com uma frase de gatilho de pensamento para qualquer tarefa complexa:
claude "think step by step: Optimize this React component for performance"O pensamento expandido dispara sem mudar de modelos. As três frases são intercambiáveis.
Nível 2: Modo de Planeamento + Pensamento Profundo
Combina uma frase de pensamento com planeamento para análise estruturada:
claude "think harder + plan mode: Create a migration strategy from JavaScript to TypeScript"Obtens raciocínio expandido E um plano estruturado.
Nível 3: O Motor de Revisão
Usa múltiplas rondas de crítica para elevar o desempenho ainda mais:
claude "ultrathink + plan mode: Create deployment strategy. Then critique your plan for edge cases and improvements."Cada ronda afina a resposta. Frase de gatilho mais autocrítica extrai o máximo da computação em tempo de inferência.
Aplicações Reais
Depurar Problemas Complexos
Fraco: "Por que é que isto não funciona?"
Forte: "think harder: Analyze this error stack trace and provide root cause analysis with multiple potential solutions."
Decisões de Arquitetura
Fraco: "Qual é a melhor base de dados para isto?"
Forte: "think step by step + plan mode: Evaluate database options for a real-time chat application with 100K users."
Revisões de Código
Fraco: "Revê este código"
Forte: "ultrathink: Perform comprehensive code review focusing on performance, security, and maintainability."
Configuração Persistente de Pensamento
Se o pensamento profundo é usado na maior parte do teu dia, ativa-o por padrão em vez de prefixar cada prompt.
Pensamento Expandido Sempre Ativo
Adiciona alwaysThinkingEnabled ao teu settings.json para ativar o pensamento expandido em todas as respostas:
// ~/.claude/settings.json
{
"alwaysThinkingEnabled": true
}O pensamento expandido corre então em todos os prompts, sem necessidade de think harder. Boa opção quando a maioria das sessões exige essa profundidade por padrão.
Controlar o Orçamento de Pensamento
A variável de ambiente MAX_THINKING_TOKENS controla quantos tokens o Claude pode gastar no seu processo de raciocínio interno:
# Set a custom thinking budget (default is 31,999)
export MAX_THINKING_TOKENS=31999
# Disable extended thinking entirely
export MAX_THINKING_TOKENS=0Aumenta o número e o Claude tem mais espaço para raciocinar, mas a latência e os tokens sobem com isso. Baixa-o e o raciocínio fica mais contido. 0 desativa o pensamento expandido, útil quando a velocidade supera a profundidade.
Caching de Prompts e Pensamento Expandido
O pensamento expandido colide com o caching de prompts. Os tokens de pensamento viajam com a resposta e não ficam em cache para turnos posteriores. Para trabalho repetitivo, como a mesma refatoração em muitos ficheiros, o throughput é muitas vezes melhor com o pensamento expandido desativado e um prompt preciso a fazer o trabalho.
Trade-offs de Custo vs Desempenho
Antes de ir buscar um modelo mais caro como o Claude Opus, extrai mais do que já tens:
- Frases de pensamento.
think harder,ultrathinkouthink step by stepfecham a maior parte da diferença de inteligência - Modo de planeamento. Adiciona estrutura ao raciocínio expandido
- Ciclos de revisão. Mais críticas, respostas mais afinadas
- Subagentes. Ângulos frescos sobre o mesmo problema difícil
Esta combinação entrega cerca de 80% da qualidade do Opus a 20% do custo. A computação em tempo de inferência paga mais por euro do que mudar de modelo.
Padrões Comuns de Pensamento Profundo
A Abordagem Sistemática
claude "think step by step + plan mode:
1. Analyze the current system
2. Identify bottlenecks
3. Propose solutions
4. Create implementation plan
5. Critique the plan for missing elements"A Análise Multi-Perspetiva
claude "think harder: Analyze this API design from the perspectives of:
- Performance engineer
- Security auditor
- Frontend developer
- DevOps engineer"O Refinamento Iterativo
claude "ultrathink + plan mode: Design a caching strategy.
Then critique it for edge cases and suggest improvements."Quando o Pensamento Profundo Fica Aquém
Quando as frases de gatilho, o planeamento e as rondas de revisão ainda ficam aquém:
- Traz subagentes para ângulos de especialista diferentes
- Divide o problema em tarefas menores e mais precisas
- Vai buscar o Claude Opus para o trabalho genuinamente complexo
- Integra extensões MCP ajustadas para o domínio
Indicadores de Sucesso
As frases de gatilho estão a funcionar quando o Claude:
- Te dá mais do que uma solução
- Identifica casos extremos que não tinhas visto
- Percorre os trade-offs que avaliou
- Esboça como entregar cada opção
- Assinala melhorias que vale a pena fazer
Próximos Passos
Imediato: Coloca think harder: no teu próximo prompt difícil e compara a resposta.
Avançado: Aprende estratégias de modo de planeamento que moldam o pensamento expandido.
Otimização: Analisa a seleção de modelos para equilibrar custo com profundidade.
Escala: Configura agentes personalizados para tarefas de pensamento especializadas.
Resolução de problemas: Lê o guia de otimização de desempenho se o pensamento profundo parecer lento.
Sem frases de gatilho, o Claude dá-te a primeira resposta que funciona. Com elas, dá-te a melhor que consegue construir. As frases não custam nada para adicionar.
Pare de configurar. Comece a construir.
Templates SaaS com orquestração de IA.
Preços e Consumo de Tokens no Claude Code
Corta os custos do Claude Code em 40-70% com o ccusage para tracking, /model para mudar de modelo, /compact e /clear, modo de planeamento e o plano que encaixa no teu workload.
Otimização da velocidade
A seleção do modelo, o tamanho do contexto e a especificidade do pedido são as três alavancas que decidem a rapidez com que o Código Claude responde. /modelo de haiku, /compacto, e /claro coberto.