Технология
15 апреля 2026 · 11 мин чтения · AI Platforms

ИИ-агенты с tool-use: как модель сама ищет данные и добирает контекст

Tool-use превращает LLM из чат-бота в агента: модель не просто генерирует текст, а вызывает инструменты - поиск по базе знаний, запрос в CRM, чтение документа, выполнение кода. Разбираем архитектуру, MCP, оркестрацию, память и почему 90% агентов падают в production - и как это исправить.

  • ["agents"
  • "tool-use"
  • "MCP"
  • "LangGraph"
  • "CrewAI"
  • "RAG"
  • "оркестрация"
  • "guardrails"
  • "память"]

Что такое tool-use и почему это важно

Tool-use - режим, в котором LLM не просто пишет текст, а вызывает внешние инструменты: поиск по базе знаний, запрос в 1С или CRM, чтение файла, выполнение кода, отправку уведомления. Модель перестаёт быть «умным чатиком» и становится оркестратором.

Разница между чатом и агентом простая: агент не обязан угадывать всё из головы. Если данных не хватает - он ищет. Если ответ неоднозначный - проверяет второй источник. Если задача требует нескольких шагов - выполняет их последовательно.

В 2026 году agentic AI переходит от пилотов к production. По данным Anthropic Economic Index (3.5M+ проанализированных диалогов Claude), tool-use - самый быстрорастущий паттерн использования LLM. Gartner прогнозирует 40% enterprise-приложений со встроенными агентами к концу года. Но реальность сурова: только 14% агентов доходят до production, 90% падают в первые недели.

Эволюция tool-use: от ReAct до MCP

ReAct (2022)

Рассуждение и действие - вместе. Модель думает → действует → смотрит результат → думает снова. Основа всех современных agentic workflow.

Toolformer (2023)

Модель сама учится вызывать API через специальные токены. Без ручного описания инструментов. Выбирает, когда вызов действительно нужен.

Self-RAG (2024)

Не просто ищет один раз. Адаптивно решает: нужен ли ещё retrieval, достаточно ли найденного, когда критически оценить свой ответ.

MCP (2024)

Model Context Protocol от Anthropic - открытый стандарт подключения инструментов. 10 000+ серверов, 97M загрузок SDK. OpenAI, Google, Microsoft - все приняли.

Agentic RAG (2025)

RAG как инструмент, а не статичный кусок контекста. Модель итеративно ищет, проверяет, добирает. Не один retrieval-проход.

Multi-agent (2026)

Оркестрация через supervisor, pipeline, swarm. Агенты делегируют подзадачи друг другу. MCP + A2A - протоколы для agent-to-agent коммуникации.

Архитектура агента: четыре слоя

ReAct: думать и действовать вместе

Базовый цикл агента: Thought → Action → Observation → Thought → ... Модель думает, что нужно сделать, вызывает инструмент, смотрит на результат и решает, достаточен ли он. Если нет - повторяет. Это не «один промпт - один ответ», а итеративный процесс.

Память: не забывать между шагами

В 2026 году память агента - production-дисциплина с бенчмарками (MemoryArena). 21 фреймворк, 20 векторных хранилищ. Три уровня:

  • Краткосрочная: контекстное окно, текущий диалог.
  • Рабочая: результаты tool calls, промежуточные выводы.
  • Долговременная: факты о пользователе, проекте, предыдущих сессиях - через векторную базу.

Без памяти агент - золотая рыбка. С памятью - система, которая учится на своих ошибках. Правильная архитектура памяти снижает стоимость контекста на 60%.

MCP: стандартный слой инструментов

Model Context Protocol решил проблему «каждый вендор - свой формат tool calling». Единый протокол: сервер публикует инструменты, клиент (модель) их вызывает. В 2026 roadmap: transport scalability, agent-to-agent communication (A2A), enterprise readiness.

Наши MCP-серверы - ssh-chat-mcp и browser-search-mcp - как раз закрывают два критичных инструмента: доступ к серверам и веб-поиск. Оба zero-config, оба open-source.

Оркестрация: кто за что отвечает

Когда агентов больше одного, нужен оркестратор. Четыре основных паттерна 2026:

  • Supervisor: главный агент распределяет задачи субагентам, контролирует результаты.
  • Pipeline: последовательная цепочка - каждый агент получает выход предыдущего.
  • Swarm: агенты работают параллельно, результаты агрегируются.
  • Hierarchical: агенты делегируют другим агентам рекурсивно.

Фреймворки для агентов в 2026

ФреймворкСильная сторонаMCPОркестрацияДля кого
LangGraph Контроль потока, checkpointing, human-in-the-loop ✅ Да Supervisor, pipeline, DAG Команды, которым нужен полный контроль графа
CrewAI Быстрый старт, ролевая модель ✅ Да Sequential, hierarchical Быстрые пилоты, малые команды
OpenAI Agents SDK Нативная интеграция с GPT, function calling ✅ Частично Handoff, параллельная Те, кто уже в экосистеме OpenAI
Claude Agent SDK Managed agents, session/sandbox/harness ✅ Нативно Managed infrastructure Enterprise, кому нужен managed runtime
AG2 (AutoGen) Conversational agents, гибкие условия завершения ✅ Да Group chat, multicast Исследовательские проекты, academia

90% агентов не доживают до production

Одна ошибка агента - каскадный крах: hallucination ломает planning, missing memory теряет контекст, бесконечный цикл жжёт токены. Без guardrails и метрик агент в продакшене - это лотерея с бизнес-рисками.

Где ломаются агенты и как это чинить

Слабый retrieval

Один проход RAG - и ответ. Если чанк не тот - агент беспомощен. Решение: agentic RAG - итеративный поиск с оценкой качества на каждом шаге.

Нет recovery

Tool call упал - агент остановился. Решение: retry с backoff, fallback-инструменты, graceful degradation. Агент должен уметь сказать «этот инструмент недоступен, пробую другой».

Бесконечные циклы

Агент ищет → не находит → ищет снова → ... Решение: лимит шагов, confidence threshold, принудительный fallback на оператора после N итераций.

Нет guardrails

Агент с доступом к CRM может удалить данные. Решение: action whitelisting, approval workflows для destructive ops, audit logging. 88% организаций уже сталкивались с инцидентами.

Нет памяти

Каждая сессия с нуля. Агент не помнит пользователя, контекст проекта, предыдущие ошибки. Решение: Mem0, Zep, Letta - долговременная память через векторные базы.

Нет метрик

«Вроде работает» - не KPI. Решение: task completion rate, tool error rate, hallucination rate, cost per task, time-to-resolution. SLO для недетерминированных систем.

Безопасность, guardrails и практика AI Platforms

Guardrails: пять слоёв защиты

В 2026 году guardrails - не опция, а требование. EU AI Act вступает в силу в августе 2026: аудит, прозрачность, human oversight. Пять слоёв:

1. Input filtering - валидация и санитизация входящих данных, защита от prompt injection.

2. Action constraints - whitelist разрешённых действий, лимиты на вызовы, rate limiting.

3. Output filtering - проверка ответа на faithfulness, релевантность, отсутствие PII.

4. Human approval - destructive ops требуют подтверждения. Не «человек в цикле всегда», а «человек в цикле где нужно».

5. Audit logging - каждое действие агента записано: кто, когда, какой tool, с каким результатом.

Как мы строим агентов

В AI Platforms мы не начинаем с фреймворка. Мы начинаем с процесса:

1. Какие данные агент должен видеть и к каким системам иметь доступ.

2. Какие действия допустимы без подтверждения, какие - только с approval.

3. Какие ошибки считаются допустимыми, какие - критичными.

4. Где нужен один агент, где - субагент, где - ручной fallback.

5. Какая метрика показывает реальную пользу.

И только потом выбираем модель, RAG, MCP-инструменты, оркестрацию и мониторинг.

Где tool-use реально окупается

Самые сильные сценарии - не «агент-болталка», а операционные:

  • Service desk: классификация заявки → поиск по базе знаний → черновик ответа → эскалация.
  • Продажи и закупки: подбор по параметрам → проверка остатков → сравнение поставщиков.
  • HR: регламенты, типовые справки, внутренние процедуры.
  • Инженерный ассистент: поиск по техдокументации → проверка в CRM/ERP → сводка.
  • Incident response: чтение логов → поиск причины → предложение исправления.

Во всех случаях ценность не в том, что агент «говорит умнее», а в сокращении ручных переходов между системами.

Спроектируем агента под ваш процесс

Мы строим агентов с tool-use под реальный бизнес-контур: RAG, MCP-инструменты, оркестрация, guardrails, мониторинг. От аудита процессов до пилота на ваших данных. Опишите задачу - покажем архитектуру.