ART: как заставить ИИ самому думать и использовать инструменты¶

Когда вы просите языковую модель решить сложную задачу в один шаг, она часто ошибается или выдает поверхностный ответ. Техника ART (Automatic Reasoning and Tool-use) предлагает другой подход: заставить модель саму планировать свои действия, разбивая проблему на шаги и при необходимости используя внешние инструменты - калькуляторы, поисковики, базы данных. Это похоже на то, как опытный специалист не пытается все сделать в уме, а составляет план и использует подручные средства.

Что такое ART и как это работает¶

ART - это метод промпт-инжиниринга, который учит большие языковые модели (LLM) двум ключевым навыкам: автоматическому рассуждению (разбивать задачу на логические шаги) и использованию инструментов (обращаться к внешним API для получения точных данных или вычислений). Вместо того чтобы давать один сложный промпт, вы предоставляете модели библиотеку примеров - «демонстраций». В каждой демонстрации показано, как для конкретного типа задачи строится цепочка рассуждений и вызываются нужные инструменты.

На схеме выше видно, как модель, получив новый вопрос, находит в библиотеке похожий пример (семплы задач), следует его логике (цепочке рассуждений) и, когда нужно, вызывает внешний инструмент (например, калькулятор для точной арифметики). Это позволяет решать задачи, где чистая генерация текста недостаточна: расчеты, проверка актуальных данных, работа с кодом.

Структура техники ART: демонстрации, планирование, исполнение¶

Работа по ART делится на три фазы:

Создание библиотеки демонстраций. Вы готовите несколько примеров (промпт-ответных пар) для разных типов задач. В каждом примере явно показан процесс рассуждения и моменты, когда модель обращается к инструменту. Эти демонстрации не смешиваются с основным промптом, а хранятся отдельно и подбираются моделью по схожести с новым запросом.
Планирование. Получив новый вопрос, модель ищет в библиотеке наиболее релевантную демонстрацию. Она не копирует ответ, а копирует структуру рассуждений из примера, адаптируя ее под новую задачу. На этом этапе модель генерирует план - последовательность шагов, которые нужно выполнить.
Исполнение. Модель выполняет сгенерированный план шаг за шагом. Когда в плане встречается действие, требующее точных данных или вычислений (например, «рассчитать общую стоимость»), модель останавливает генерацию и вызывает соответствующий внешний инструмент через API. Получив результат от инструмента, модель продолжает рассуждение, используя эти точные данные.

Промпт (демонстрация из библиотеки):

Вопрос: Если я куплю 3 книги по 450 рублей и 5 блокнотов по 120 рублей, сколько я заплачу с учетом скидки 10% на всю покупку?
Мыслим по шагам:
1. Нужно вычислить общую стоимость без скидки.
2. Для этого нужны точные вычисления. Вызову инструмент Калькулятор.
3. После получения суммы вычислю скидку.
4. И наконец, получу итоговую сумму.
Вызов инструмента: Калькулятор, выражение: (3 * 450) + (5 * 120)

Ответ модели (после получения результата от инструмента):

Результат калькулятора: 1950.
Теперь вычисляю сумму со скидкой 10%: 1950 * 0.9 = 1755.
Итоговый ответ: 1755 рублей.

Этот пример показывает, как модель делегирует точные вычисления инструменту, избегая ошибок, характерных для текстовой генерации.

Почему ART эффективен для бизнеса и сложных задач¶

Главное преимущество ART - надежность и точность. Модель не пытается угадать результат сложного расчета или актуальный курс валюты, а использует проверенные инструменты. Это критически важно для финансовых задач, аналитики данных или любых вычислений. Кроме того, подход учит модель структурированному мышлению, что снижает вероятность «галлюцинаций» - выдумывания несуществующих фактов.

В российском контексте эту технику можно применять с локальными моделями, доступными для бизнеса, такими как YandexGPT или GigaChat. Например, вы можете настроить систему для автоматического расчета стоимости проекта с учетом текущих цен на материалы (через обращение к базе данных), анализа регуляторных требований (через поиск по документам) или конвертации валют по актуальному курсу ЦБ.

Как реализовать ART на практике: ключевые шаги¶

Определите задачи. Выберите тип задач, где нужны и рассуждения, и точные данные: финансовое планирование, конкурентный анализ, технические расчеты.
Подготовьте инструменты. Настройте доступ к необходимым API: калькуляторы, поисковые системы, базы данных, специализированные сервисы (например, сервисы налоговой отчетности).
Создайте библиотеку демонстраций. Напишите 5-10 разнообразных примеров решения таких задач. В каждом явно покажите шаги рассуждения и вызов инструмента. Чем качественнее демонстрации, тем лучше модель будет обобщать.
Интегрируйте с моделью. Используя фреймворки вроде LangChain или простой код на Python, настройте pipeline: получение запроса -> поиск похожей демонстрации -> генерация плана -> пошаговое исполнение с вызовом инструментов.
Тестируйте и улучшайте. Проверяйте систему на новых вопросах, дополняйте библиотеку демонстраций для edge-кейсов, оптимизируйте подбор инструментов.

Ограничения и будущее развития¶

ART требует больше вычислительных ресурсов и времени на ответ по сравнению с простым запросом, так как включает поиск по библиотеке и многократные вызовы API. Эффективность сильно зависит от качества подобранных демонстраций и доступных инструментов. Однако это один из самых перспективных путей к созданию действительно надежных AI-ассистентов, способных заменить человека в сложных, но структурированных workflows.

Исследования, такие как "ART: Automatic multi-step reasoning and tool-use for large language models", показывают, что этот подход значительно повышает точность моделей в задачах, требующих вычислений и знаний о мире. По сути, ART превращает языковую модель из генератора текста в координатора, который умеет думать и делегировать задачи специализированным инструментам.

Попробуйте ENGRAM на своих данных

Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.

Зарегистрироваться бесплатно