随着 AI Agent 连接的服务增多(Slack、GitHub、Jira、MCP 服务器等),工具库迅速膨胀。一个典型的多服务器设置很容易拥有 50+ 工具,在对话开始之前就消耗 55,000+ Token。当模型面对 30+ 名称相似的工具时,工具选择准确性也会下降。
工具搜索工具模式通过按需工具发现解决这个问题:
Spring AI 在2.0版本提供了该机制,可用于实现Tool的渐进加载,更好的为agent服务
- 模型初始只收到一个搜索工具 — 最小化 Token 使用
- 当需要某种能力时,模型用自然语言查询调用搜索工具
- 匹配的工具定义被动态展开到上下文中
- 模型随后可以正常调用被发现的工具
这实现了显著的 Token 节省,同时保持对大型工具目录的访问。