MCP Tool Search
MCP Tool Search charge à la demande les définitions d'outils Claude Code dès qu'elles dépassent 10 % de la fenêtre de contexte, récupérant des dizaines de milliers de tokens des serveurs MCP inactifs.
Arrêtez de configurer. Commencez à construire.
Templates SaaS avec orchestration IA.
Problème : Tes serveurs MCP avalent la fenêtre de contexte avant même que la conversation commence. Sept serveurs et tu te retrouves avec 60 à 90K tokens utilisables sur 200K. Les tâches complexes meurent avant que tu aies tapé un seul mot.
Gain rapide : Claude Code active maintenant MCP Tool Search automatiquement dès que tes définitions d'outils dépassent 10 % de la fenêtre de contexte. Rien à activer. Lance /context et tu verras l'espace récupéré.
C'est quoi MCP Tool Search ?
Les définitions d'outils se chargeaient au démarrage de la session, toutes, à chaque fois. Le nouveau système remplace ça par un petit index de recherche et ne tire les détails complets des outils que quand Claude en a besoin.
Avant MCP Tool Search :
Starting session...
Loading 73 MCP tools... [39.8k tokens]
Loading 56 agents... [9.7k tokens]
Loading system tools... [22.6k tokens]
Ready with 92k tokens remaining.Après MCP Tool Search :
Starting session...
Loading tool registry... [5k tokens]
Ready with 195k tokens available.
User: "I need to query the database"
> Auto-loading: postgres-mcp [+1.2k tokens]
> 193.8k tokens remainingPour ceux qui font tourner plusieurs serveurs, le chiffre clé est une réduction de 95 % des tokens consommés au démarrage.
Comment fonctionne MCP Tool Search
Le déclenchement est automatique. Tu dépasses les 10 % sur les tokens de description d'outils et le chargement paresseux s'active. À partir de là :
- Création du registre : Claude Code construit un index léger des noms et descriptions des outils
- Chargement à la demande : Les outils se chargent seulement quand Claude détermine qu'ils sont nécessaires pour ta requête
- Mise en cache intelligente : Les outils chargés restent disponibles pendant toute la durée de la session
- Même expérience : Les outils MCP fonctionnent exactement comme avant, aucun changement de workflow requis
Ton prompt est analysé pour en extraire les mots-clés. Seuls les outils qui semblent correspondre sont chargés. Tout le reste reste en attente.
Pour les développeurs de serveurs MCP
Tu construis ton propre serveur ? Le champ server instructions fait maintenant un vrai travail. Avec MCP Tool Search activé, c'est lui qui dit à Claude quand venir chercher.
Traite-les comme des descriptions de compétences. Ils nomment la capacité et les mots déclencheurs :
{
"mcpServers": {
"my-custom-server": {
"command": "node",
"args": ["/path/to/server.js"],
"serverInstructions": "Database operations for PostgreSQL including queries, schema management, and data migrations. Use for any database-related tasks."
}
}
}De bonnes instructions de serveur doivent :
- Décrire clairement les capacités du serveur
- Inclure les mots-clés que les utilisateurs pourraient utiliser dans leurs prompts
- Préciser quand les outils doivent être activés
- Rester courtes, mais couvrir toute la surface
Vérifier l'utilisation du contexte
Deux commandes slash te disent ce qui est chargé et ce qui ne l'est pas :
# Check current context usage
/context
# See which MCP tools are loaded
/mcpTu remarqueras que le nombre de tokens au démarrage chute fortement une fois le chargement paresseux actif. Au fur et à mesure que Claude charge des outils pour le vrai travail, le compte monte, mais seulement de ce que tu utilises vraiment.
Options de configuration
Les réglages par défaut conviennent à la plupart des setups. Quand tu veux un comportement différent, le fichier de paramètres et quelques commandes slash te donnent les leviers.
Activer ou désactiver Tool Search
Bascule l'interrupteur global depuis tes paramètres Claude Code :
{
"enable_tool_search": true
}Mets enable_tool_search à false si tu préfères que tous les outils MCP se chargent au démarrage de la session (comportement classique).
Contrôle par serveur
Désactiver pour des serveurs spécifiques (si tu as toujours besoin de certains outils immédiatement) :
/mcp disable tool-search my-always-needed-server
Forcer le chargement d'outils spécifiques quand tu sais que tu en auras besoin :
Load the github and postgres MCP tools for this session
Impact concret
Les chiffres viennent directement de l'issue GitHub #7336, le rapport de bug qui a lancé toute cette fonctionnalité :
| Ressource | Avant | Après |
|---|---|---|
| Outils MCP | 39.8k tokens (19.9%) | ~5k tokens (2.5%) |
| Contexte disponible | 92k tokens | 195k tokens |
| Utilisable pour le travail | 46% | 97.5% |
Les développeurs qui tournent avec des setups denses, bases de données, intégrations GitHub, automatisation de navigateur et APIs personnalisées, peuvent enfin lancer une charge de travail complète sans toucher le plafond.
Notes de compatibilité
Tous les serveurs MCP existants continuent de fonctionner. Quelques points à retenir :
- Serveurs plus anciens : Peuvent fonctionner moins efficacement s'ils manquent de bonnes descriptions d'outils
- Serveurs personnalisés : Ajoute des
serverInstructionsclairs pour de meilleurs résultats - Outils haute fréquence : Pense à désactiver le chargement paresseux pour les serveurs que tu utilises constamment
Ce que ça rend possible
Avec 95 % de contexte en plus, les gains pratiques ressemblent à ça :
- Lancer des sessions de coding plus longues et plus complexes
- Utiliser plus de serveurs MCP simultanément sans pénalité
- Maintenir l'historique de conversation sur des workflows étendus
- Exécuter des tâches multi-étapes qui butaient auparavant sur des limites de contexte
Prochaines étapes
Tire le meilleur parti de ton setup MCP :
- Audite tes serveurs : Lance
/contextpour voir ton utilisation actuelle - Mets à jour les instructions de serveur : Ajoute des instructions descriptives aux serveurs personnalisés
- Explore plus de serveurs : Consulte notre guide des serveurs MCP populaires, tu peux maintenant en lancer plus sans pénalité
- Apprends les bases MCP : Revois les bases MCP si tu es nouveau sur le protocole
L'impôt contexte était le plus gros frein à l'empilement de serveurs MCP. Le chargement paresseux lève ce frein. Connecte les serveurs que tu veux, et le runtime garde la fenêtre honnête. Si tu préfères éviter les essais-erreurs sur quels serveurs connecter ensemble, le Code Kit de ClaudeFast livre un setup MCP sélectionné avec son système de 18 agents, pour que tu démarres la première session déjà réglé.
Arrêtez de configurer. Commencez à construire.
Templates SaaS avec orchestration IA.