MCP Tool Search
MCP Tool Search lädt Claude Code-Tool-Definitionen erst bei Bedarf nach, sobald sie 10 % des Kontextfensters überschreiten, und gibt dabei zehntausende Token von ungenutzten MCP-Servern zurück.
Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.
SaaS-Builder-Vorlagen mit KI-Orchestrierung.
Problem: Deine MCP-Server fressen das Kontextfenster auf, bevor das Gespräch überhaupt beginnt. Sieben Server bringen dich auf 60-90K nutzbare Token von 200K. Die schweren Aufgaben sterben, bevor du ein Wort getippt hast.
Schneller Einstieg: Claude Code aktiviert MCP Tool Search automatisch, sobald deine Tool-Definitionen 10 % des Kontextfensters überschreiten. Nichts zu aktivieren. Führ /context aus und du siehst den neuen Freiraum.
Was ist MCP Tool Search?
Tool-Definitionen wurden früher beim Sitzungsstart geladen, alle auf einmal, jedes Mal. Das neue System tauscht das gegen einen kleinen Suchindex aus und lädt vollständige Tool-Details nur dann, wenn Claude sie tatsächlich braucht.
Vor MCP Tool Search:
Starting session...
Loading 73 MCP tools... [39.8k tokens]
Loading 56 agents... [9.7k tokens]
Loading system tools... [22.6k tokens]
Ready with 92k tokens remaining.Nach MCP Tool Search:
Starting session...
Loading tool registry... [5k tokens]
Ready with 195k tokens available.
User: "I need to query the database"
> Auto-loading: postgres-mcp [+1.2k tokens]
> 193.8k tokens remainingFür alle, die mehrere Server betreiben, ist die Schlagzeile eine 95%ige Reduzierung des Kontextverbrauchs beim Start.
Wie MCP Tool Search funktioniert
Der Auslöser ist automatisch. Überschreite die 10%-Marke bei Tool-Beschreibungs-Token und der Lazy-Pfad tritt in Kraft. Von da an:
- Registry-Erstellung: Claude Code baut einen leichtgewichtigen Index mit Tool-Namen und Beschreibungen
- Bedarfsgerechtes Laden: Tools werden nur geladen, wenn Claude feststellt, dass sie für deine Anfrage gebraucht werden
- Intelligentes Caching: Geladene Tools bleiben für die Sitzungsdauer verfügbar
- Gleiche UX: MCP-Tools funktionieren genau wie vorher, keine Workflow-Änderungen nötig
Dein Prompt wird nach Schlüsselwörtern gelesen. Nur die Tools, die passend aussehen, werden geladen. Alles andere bleibt auf der Bank.
Für MCP-Server-Entwickler
Baust du deinen eigenen Server? Das server instructions-Feld leistet jetzt echte Arbeit. Mit aktiviertem MCP Tool Search sagt es Claude, wann es nachschauen soll.
Behandle sie wie Fähigkeitsbeschreibungen. Sie nennen die Fähigkeit und die Trigger-Wörter:
{
"mcpServers": {
"my-custom-server": {
"command": "node",
"args": ["/path/to/server.js"],
"serverInstructions": "Database operations for PostgreSQL including queries, schema management, and data migrations. Use for any database-related tasks."
}
}
}Gute Server-Anweisungen sollten:
- Die Fähigkeiten des Servers klar beschreiben
- Schlüsselwörter enthalten, die Nutzer in Prompts verwenden könnten
- Angeben, wann die Tools aktiviert werden sollen
- Kurz bleiben, aber die gesamte Oberfläche abdecken
Deinen Kontextverbrauch prüfen
Zwei Slash-Befehle zeigen dir, was geladen ist und was nicht:
# Check current context usage
/context
# See which MCP tools are loaded
/mcpDu wirst merken, dass die Starttoken-Anzahl deutlich sinkt, sobald Lazy Loading aktiv ist. Während Claude Tools für echte Arbeit lädt, steigt die Zahl, aber nur um das, was du tatsächlich nutzt.
Konfigurationsoptionen
Die Standardwerte decken die meisten Setups ab. Wenn du ein anderes Verhalten möchtest, geben dir die Einstellungsdatei und ein paar Slash-Befehle die nötigen Hebel.
Tool Search aktivieren oder deaktivieren
Schalte den globalen Schalter in deinen Claude Code-Einstellungen um:
{
"enable_tool_search": true
}Setze enable_tool_search auf false, wenn du lieber alle MCP-Tools beim Sitzungsstart geladen haben möchtest (Legacy-Verhalten).
Serverweite Kontrolle
Für bestimmte Server deaktivieren (wenn du bestimmte Tools sofort brauchst):
/mcp disable tool-search my-always-needed-server
Bestimmte Tools zwangsweise laden, wenn du weißt, dass du sie brauchst:
Load the github and postgres MCP tools for this session
Reale Auswirkungen
Die Zahlen kommen direkt aus GitHub Issue #7336, dem Bug-Report, der dieses Feature ausgelöst hat:
| Ressource | Vorher | Nachher |
|---|---|---|
| MCP-Tools | 39.8k Token (19.9%) | ~5k Token (2.5%) |
| Verfügbarer Kontext | 92k Token | 195k Token |
| Nutzbar für Arbeit | 46% | 97.5% |
Entwickler mit dichten Setups, darunter Datenbankserver, GitHub-Integrationen, Browser-Automatisierung und benutzerdefinierte APIs, können endlich eine vollständige Arbeitslast laufen, ohne gegen die Decke zu stoßen.
Kompatibilitätshinweise
Jeder bestehende MCP-Server funktioniert weiterhin. Ein paar Einschränkungen sind es wert zu wissen:
- Ältere Server: Funktionieren möglicherweise weniger effizient, wenn ihnen gute Tool-Beschreibungen fehlen
- Benutzerdefinierte Server: Füge klare
serverInstructionsfür beste Ergebnisse hinzu - Häufig genutzte Tools: Erwäge, Lazy Loading für Server zu deaktivieren, die du ständig verwendest
Was das ermöglicht
Mit 95 % mehr Kontext zum Arbeiten sehen die praktischen Gewinne so aus:
- Längere, komplexere Coding-Sitzungen durchführen
- Mehr MCP-Server gleichzeitig ohne Strafe nutzen
- Gesprächsverlauf über erweiterte Workflows hinweg beibehalten
- Mehrstufige Aufgaben ausführen, die vorher an Kontextlimits scheiterten
Nächste Schritte
Hole das Beste aus deinem MCP-Setup heraus:
- Server prüfen: Führ
/contextaus, um deinen aktuellen Verbrauch zu sehen - Server-Anweisungen aktualisieren: Füge beschreibende Anweisungen zu benutzerdefinierten Servern hinzu
- Mehr Server erkunden: Schau in unseren Leitfaden für beliebte MCP-Server, du kannst jetzt mehr ohne Strafe betreiben
- MCP-Grundlagen lernen: Lies die MCP-Grundlagen, wenn du neu im Protokoll bist
Die Kontextsteuer war die größte Bremse beim Stapeln von MCP-Servern. Lazy Loading schaltet diese Bremse ab. Bind die Server ein, die du willst, und die Laufzeit hält das Fenster ehrlich. Wenn du lieber das Ausprobieren überspringst, welche Server zusammenpassen, liefert ClaudeFast's Code Kit ein kuratiertes MCP-Setup zusammen mit seinem 18-Agenten-System, sodass du die erste Sitzung bereits abgestimmt beginnst.
Hören Sie auf zu konfigurieren. Fangen Sie an zu bauen.
SaaS-Builder-Vorlagen mit KI-Orchestrierung.