MCP Tool Search
O MCP Tool Search carrega as definições de ferramentas do Claude Code de forma lazy quando ultrapassam 10% da janela de contexto, recuperando dezenas de milhares de tokens de servidores MCP inativos.
Pare de configurar. Comece a construir.
Templates SaaS com orquestração de IA.
Problema: Os teus servidores MCP estão a consumir a janela de contexto antes da conversa começar. Sete servidores deixam-te com 60-90K tokens utilizáveis de 200K. As tarefas difíceis morrem antes de teres escrito uma palavra.
Ganho Rápido: O Claude Code agora ativa o MCP Tool Search automaticamente assim que as tuas definições de ferramentas ultrapassam 10% da janela de contexto. Não há nada para ativar. Corre /context e vês o espaço extra disponível.
O Que É o MCP Tool Search?
As definições de ferramentas costumavam carregar no início da sessão, todas elas, sempre. O novo sistema substitui isso por um pequeno índice de pesquisa e carrega os detalhes completos das ferramentas apenas quando o Claude precisa delas.
Antes do MCP Tool Search:
Starting session...
Loading 73 MCP tools... [39.8k tokens]
Loading 56 agents... [9.7k tokens]
Loading system tools... [22.6k tokens]
Ready with 92k tokens remaining.Depois do MCP Tool Search:
Starting session...
Loading tool registry... [5k tokens]
Ready with 195k tokens available.
User: "I need to query the database"
> Auto-loading: postgres-mcp [+1.2k tokens]
> 193.8k tokens remainingPara quem usa vários servidores, o número principal é uma redução de 95% no gasto de contexto no arranque.
Como Funciona o MCP Tool Search
O gatilho é automático. Ultrapassa os 10% em tokens de descrição de ferramentas e o modo lazy entra em ação. A partir daí:
- Criação do Registo: O Claude Code constrói um índice leve de nomes e descrições de ferramentas
- Carregamento Sob Demanda: As ferramentas só carregam quando o Claude determina que são necessárias para o teu pedido
- Cache Inteligente: As ferramentas carregadas ficam disponíveis durante toda a sessão
- Mesma Experiência: As ferramentas MCP funcionam exatamente como antes, sem mudanças no workflow
O teu prompt é lido para detetar palavras-chave. Só as ferramentas que parecem relevantes são carregadas. Todo o resto fica em espera.
Para Quem Constrói Servidores MCP
Estás a construir o teu próprio servidor? O campo server instructions está a fazer trabalho real agora. Com o MCP Tool Search ativo, é isto que diz ao Claude quando deve procurar uma ferramenta.
Trata-os como descrições de capacidades. Eles identificam a funcionalidade e as palavras de ativação:
{
"mcpServers": {
"my-custom-server": {
"command": "node",
"args": ["/path/to/server.js"],
"serverInstructions": "Database operations for PostgreSQL including queries, schema management, and data migrations. Use for any database-related tasks."
}
}
}Boas instruções de servidor devem:
- Descrever as capacidades do servidor com clareza
- Incluir palavras-chave que os utilizadores possam usar nos prompts
- Especificar quando as ferramentas devem ser ativadas
- Ser concisas, mas cobrir toda a superfície
A Verificar o Uso do Contexto
Dois slash commands dizem-te o que está carregado e o que não está:
# Check current context usage
/context
# See which MCP tools are loaded
/mcpVais notar que a contagem de tokens inicial cai bastante uma vez que o carregamento lazy está ativo. À medida que o Claude carrega ferramentas para o trabalho real, a contagem sobe, mas apenas pelo que realmente usas.
Opções de Configuração
Os valores padrão funcionam para a maioria das configurações. Quando queres um comportamento diferente, o ficheiro de configuração e alguns slash commands dão-te os controlos.
Ativar ou Desativar o Tool Search
Muda o interruptor global nas configurações do Claude Code:
{
"enable_tool_search": true
}Define enable_tool_search como false se preferires que todas as ferramentas MCP sejam carregadas no início da sessão (comportamento legado).
Controlo por Servidor
Desativar para servidores específicos (se precisas sempre de certas ferramentas imediatamente):
/mcp disable tool-search my-always-needed-server
Forçar o carregamento de ferramentas específicas quando sabes que vais precisar delas:
Load the github and postgres MCP tools for this session
Impacto no Mundo Real
Os números vêm diretamente da issue #7336 do GitHub, o relatório de bug que iniciou toda esta funcionalidade:
| Recurso | Antes | Depois |
|---|---|---|
| Ferramentas MCP | 39.8k tokens (19.9%) | ~5k tokens (2.5%) |
| Contexto disponível | 92k tokens | 195k tokens |
| Utilizável para trabalho | 46% | 97.5% |
Os programadores com configurações densas, incluindo servidores de bases de dados, integrações com GitHub, automação de browser e APIs personalizadas, finalmente conseguem correr um workload completo sem atingir o limite.
Notas de Compatibilidade
Todos os servidores MCP existentes continuam a funcionar. Há alguns pontos que vale a pena conhecer:
- Servidores mais antigos: Podem funcionar com menos eficiência se não tiverem boas descrições de ferramentas
- Servidores personalizados: Adiciona
serverInstructionsclaras para melhores resultados - Ferramentas de alta frequência: Considera desativar o carregamento lazy para servidores que usas constantemente
O Que Isto Permite
Com 95% mais contexto disponível, os ganhos práticos ficam assim:
- Realizar sessões de programação mais longas e complexas
- Usar mais servidores MCP simultaneamente sem penalidade
- Manter o histórico de conversa em workflows prolongados
- Executar tarefas em múltiplos passos que antes atingiam os limites de contexto
Próximos Passos
Tira o máximo partido da tua configuração MCP:
- Audita os teus servidores: Corre
/contextpara ver o teu uso atual - Atualiza as instruções dos servidores: Adiciona instruções descritivas aos servidores personalizados
- Explora mais servidores: Consulta o nosso guia de servidores MCP populares, agora podes usar mais sem penalidade
- Aprende os fundamentos do MCP: Revê os básicos do MCP se és novo no protocolo
O custo de contexto era o maior travão na ligação de servidores MCP. O carregamento lazy desativa esse travão. Liga os servidores que queres, e o runtime mantém a janela honesta. Se preferires saltar o processo de tentativa e erro sobre quais servidores ligar, o Code Kit do ClaudeFast inclui uma configuração MCP curada juntamente com o seu sistema de 18 agentes, para que comeces a primeira sessão já afinado.
Pare de configurar. Comece a construir.
Templates SaaS com orquestração de IA.