ИИ-агенты с tool-use: как модель сама ищет данные и добирает контекст
Tool-use превращает LLM из чат-бота в агента: модель не просто генерирует текст, а вызывает инструменты - поиск по базе знаний, запрос в CRM, чтение документа, выполнение кода. Разбираем архитектуру, MCP, оркестрацию, память и почему 90% агентов падают в production - и как это исправить.
Что такое tool-use и почему это важно
Tool-use - режим, в котором LLM не просто пишет текст, а вызывает внешние инструменты: поиск по базе знаний, запрос в 1С или CRM, чтение файла, выполнение кода, отправку уведомления. Модель перестаёт быть «умным чатиком» и становится оркестратором.
Разница между чатом и агентом простая: агент не обязан угадывать всё из головы. Если данных не хватает - он ищет. Если ответ неоднозначный - проверяет второй источник. Если задача требует нескольких шагов - выполняет их последовательно.
В 2026 году agentic AI переходит от пилотов к production. По данным Anthropic Economic Index (3.5M+ проанализированных диалогов Claude), tool-use - самый быстрорастущий паттерн использования LLM. Gartner прогнозирует 40% enterprise-приложений со встроенными агентами к концу года. Но реальность сурова: только 14% агентов доходят до production, 90% падают в первые недели.
Эволюция tool-use: от ReAct до MCP
ReAct (2022)
Рассуждение и действие - вместе. Модель думает → действует → смотрит результат → думает снова. Основа всех современных agentic workflow.
Toolformer (2023)
Модель сама учится вызывать API через специальные токены. Без ручного описания инструментов. Выбирает, когда вызов действительно нужен.
Self-RAG (2024)
Не просто ищет один раз. Адаптивно решает: нужен ли ещё retrieval, достаточно ли найденного, когда критически оценить свой ответ.
MCP (2024)
Model Context Protocol от Anthropic - открытый стандарт подключения инструментов. 10 000+ серверов, 97M загрузок SDK. OpenAI, Google, Microsoft - все приняли.
Agentic RAG (2025)
RAG как инструмент, а не статичный кусок контекста. Модель итеративно ищет, проверяет, добирает. Не один retrieval-проход.
Multi-agent (2026)
Оркестрация через supervisor, pipeline, swarm. Агенты делегируют подзадачи друг другу. MCP + A2A - протоколы для agent-to-agent коммуникации.
Архитектура агента: четыре слоя
ReAct: думать и действовать вместе
Базовый цикл агента: Thought → Action → Observation → Thought → ... Модель думает, что нужно сделать, вызывает инструмент, смотрит на результат и решает, достаточен ли он. Если нет - повторяет. Это не «один промпт - один ответ», а итеративный процесс.
Память: не забывать между шагами
В 2026 году память агента - production-дисциплина с бенчмарками (MemoryArena). 21 фреймворк, 20 векторных хранилищ. Три уровня:
- Краткосрочная: контекстное окно, текущий диалог.
- Рабочая: результаты tool calls, промежуточные выводы.
- Долговременная: факты о пользователе, проекте, предыдущих сессиях - через векторную базу.
Без памяти агент - золотая рыбка. С памятью - система, которая учится на своих ошибках. Правильная архитектура памяти снижает стоимость контекста на 60%.
MCP: стандартный слой инструментов
Model Context Protocol решил проблему «каждый вендор - свой формат tool calling». Единый протокол: сервер публикует инструменты, клиент (модель) их вызывает. В 2026 roadmap: transport scalability, agent-to-agent communication (A2A), enterprise readiness.
Наши MCP-серверы - ssh-chat-mcp и browser-search-mcp - как раз закрывают два критичных инструмента: доступ к серверам и веб-поиск. Оба zero-config, оба open-source.
Оркестрация: кто за что отвечает
Когда агентов больше одного, нужен оркестратор. Четыре основных паттерна 2026:
- Supervisor: главный агент распределяет задачи субагентам, контролирует результаты.
- Pipeline: последовательная цепочка - каждый агент получает выход предыдущего.
- Swarm: агенты работают параллельно, результаты агрегируются.
- Hierarchical: агенты делегируют другим агентам рекурсивно.
Фреймворки для агентов в 2026
| Фреймворк | Сильная сторона | MCP | Оркестрация | Для кого |
|---|---|---|---|---|
| LangGraph | Контроль потока, checkpointing, human-in-the-loop | ✅ Да | Supervisor, pipeline, DAG | Команды, которым нужен полный контроль графа |
| CrewAI | Быстрый старт, ролевая модель | ✅ Да | Sequential, hierarchical | Быстрые пилоты, малые команды |
| OpenAI Agents SDK | Нативная интеграция с GPT, function calling | ✅ Частично | Handoff, параллельная | Те, кто уже в экосистеме OpenAI |
| Claude Agent SDK | Managed agents, session/sandbox/harness | ✅ Нативно | Managed infrastructure | Enterprise, кому нужен managed runtime |
| AG2 (AutoGen) | Conversational agents, гибкие условия завершения | ✅ Да | Group chat, multicast | Исследовательские проекты, academia |
90% агентов не доживают до production
Одна ошибка агента - каскадный крах: hallucination ломает planning, missing memory теряет контекст, бесконечный цикл жжёт токены. Без guardrails и метрик агент в продакшене - это лотерея с бизнес-рисками.
Где ломаются агенты и как это чинить
Слабый retrieval
Один проход RAG - и ответ. Если чанк не тот - агент беспомощен. Решение: agentic RAG - итеративный поиск с оценкой качества на каждом шаге.
Нет recovery
Tool call упал - агент остановился. Решение: retry с backoff, fallback-инструменты, graceful degradation. Агент должен уметь сказать «этот инструмент недоступен, пробую другой».
Бесконечные циклы
Агент ищет → не находит → ищет снова → ... Решение: лимит шагов, confidence threshold, принудительный fallback на оператора после N итераций.
Нет guardrails
Агент с доступом к CRM может удалить данные. Решение: action whitelisting, approval workflows для destructive ops, audit logging. 88% организаций уже сталкивались с инцидентами.
Нет памяти
Каждая сессия с нуля. Агент не помнит пользователя, контекст проекта, предыдущие ошибки. Решение: Mem0, Zep, Letta - долговременная память через векторные базы.
Нет метрик
«Вроде работает» - не KPI. Решение: task completion rate, tool error rate, hallucination rate, cost per task, time-to-resolution. SLO для недетерминированных систем.
Безопасность, guardrails и практика AI Platforms
Guardrails: пять слоёв защиты
В 2026 году guardrails - не опция, а требование. EU AI Act вступает в силу в августе 2026: аудит, прозрачность, human oversight. Пять слоёв:
1. Input filtering - валидация и санитизация входящих данных, защита от prompt injection.
2. Action constraints - whitelist разрешённых действий, лимиты на вызовы, rate limiting.
3. Output filtering - проверка ответа на faithfulness, релевантность, отсутствие PII.
4. Human approval - destructive ops требуют подтверждения. Не «человек в цикле всегда», а «человек в цикле где нужно».
5. Audit logging - каждое действие агента записано: кто, когда, какой tool, с каким результатом.
Как мы строим агентов
В AI Platforms мы не начинаем с фреймворка. Мы начинаем с процесса:
1. Какие данные агент должен видеть и к каким системам иметь доступ.
2. Какие действия допустимы без подтверждения, какие - только с approval.
3. Какие ошибки считаются допустимыми, какие - критичными.
4. Где нужен один агент, где - субагент, где - ручной fallback.
5. Какая метрика показывает реальную пользу.
И только потом выбираем модель, RAG, MCP-инструменты, оркестрацию и мониторинг.
Где tool-use реально окупается
Самые сильные сценарии - не «агент-болталка», а операционные:
- Service desk: классификация заявки → поиск по базе знаний → черновик ответа → эскалация.
- Продажи и закупки: подбор по параметрам → проверка остатков → сравнение поставщиков.
- HR: регламенты, типовые справки, внутренние процедуры.
- Инженерный ассистент: поиск по техдокументации → проверка в CRM/ERP → сводка.
- Incident response: чтение логов → поиск причины → предложение исправления.
Во всех случаях ценность не в том, что агент «говорит умнее», а в сокращении ручных переходов между системами.
Спроектируем агента под ваш процесс
Мы строим агентов с tool-use под реальный бизнес-контур: RAG, MCP-инструменты, оркестрация, guardrails, мониторинг. От аудита процессов до пилота на ваших данных. Опишите задачу - покажем архитектуру.