Как писать промпты для генерации текста: практика¶
Что происходит внутри модели и почему это важно для практики¶
Языковая модель не "понимает" текст - она предсказывает следующий токен по вероятностному распределению. Каждое слово (точнее, его часть) выбирается на основе того, что было до него. Отсюда прямое следствие: чем точнее вы задаёте контекст в начале промпта, тем уже пространство вероятных продолжений - и тем ближе результат к нужному.
Два параметра, которые стоит знать:
- Температура - управляет случайностью. При значении 0 модель всегда выбирает наиболее вероятный токен: предсказуемо, но шаблонно. Выше 1 - разнообразнее, но менее точно. Для деловых текстов, инструкций, резюме документов держите температуру в диапазоне 0.2-0.5. Для брейншторма или вариантов заголовков - 0.7-0.9.
- Контекстное окно - сколько текста модель видит одновременно. GPT-4o держит 128 тысяч токенов (около 300 страниц), Claude 3 - до 200 тысяч. Длинный документ, историю переписки или несколько примеров можно передавать целиком.
Пошаговая инструкция: как строить промпт¶
Шаг 1. Определите роль и аудиторию
Начните промпт с того, кто отвечает и для кого. Не "напиши письмо", а "ты - менеджер по работе с клиентами B2B-компании, пишешь ответ на претензию от закупщика крупного ритейлера".
Это не формальность. Модель использует роль как фильтр: она сужает стиль, лексику, уровень детализации.
Шаг 2. Объясните зачем, а не только что
Исследования Anthropic показывают: добавление бизнес-контекста - "зачем нужен этот текст" и "что должен сделать читатель после" - снижает неоднозначность сильнее, чем детальное описание формата.
Плохо: "Напиши описание продукта". Лучше: "Напиши описание продукта для карточки на маркетплейсе. Покупатель сравнивает нас с тремя конкурентами, цена у нас выше. Цель - объяснить, за что он платит, и снять возражение по цене".
Шаг 3. Добавьте 2-5 примеров (few-shot)
Есть образцы нужного результата - вставьте их в промпт. Модель подхватывает паттерн: структуру, тон, длину, стиль. Работает надёжнее, чем словесное описание желаемого формата.
Формат: "Вот примеры правильных ответов: [пример 1] / [пример 2]. Теперь сделай то же самое для: [новая задача]".
Шаг 4. Для сложных задач - chain-of-thought
Добавьте в промпт фразу "думай пошагово" или "сначала разбери задачу, потом дай ответ". По данным OpenAI и Anthropic, это повышает точность на задачах с логикой, анализом и структурированием. Особенно заметно на длинных документах и задачах с несколькими условиями.
Шаг 5. Структурируйте промпт визуально
Используйте разметку: заголовки, теги, блоки. Это помогает модели разграничить роль, инструкцию, примеры и входные данные.
Пример структуры:
## Роль
Ты - редактор корпоративных коммуникаций.
## Задача
Перепиши письмо ниже: сделай его короче на 30%, убери канцеляризмы, сохрани все факты.
## Письмо для редактуры
[текст]
## Формат ответа
Только итоговый текст, без комментариев.
Шаг 6. Разбейте сложную задачу на цепочку промптов
Если задача многосоставная - например, собрать данные, проанализировать, написать отчёт, адаптировать под разные аудитории - не пытайтесь уместить всё в один промпт. Используйте prompt chaining: результат первого шага становится входом для второго. Это снижает вероятность галлюцинаций и даёт контроль на каждом этапе.
Конкретный пример¶
Задача: написать короткое коммерческое предложение для отдела закупок.
Промпт:
## Роль
Ты - менеджер по продажам B2B, пишешь КП для директора по закупкам производственного предприятия.
## Контекст
Мы поставляем промышленные фильтры. Клиент сейчас работает с другим поставщиком, но жалуется на сроки. Наше преимущество - склад в России, отгрузка за 2 дня.
## Задача
Напиши КП на 150-200 слов. Начни с проблемы клиента, затем - наше решение, конкретные цифры, призыв к действию.
## Пример нужного тона
[вставьте образец, если есть]
Такой промпт даёт предсказуемый результат с первой попытки.
Типичные ошибки¶
Слишком общий запрос. "Напиши текст о нашей компании" - модель не знает, для кого, зачем, какой длины, в каком стиле. Результат будет усреднённым и бесполезным.
Инструкция вместо контекста. Вы описываете формат, но не объясняете задачу. Модель выполнит инструкцию буквально, но не попадёт в суть.
Правка инструкции вместо правки контекста. По данным исследования IBM (1523 промпта, 57 сессий), пользователи чаще всего редактируют именно контекст - примеры и документы, а не саму инструкцию. Если результат не устраивает, сначала проверьте, достаточно ли контекста.
Один длинный промпт на всё. Сложные задачи лучше разбивать. Один большой промпт с десятью условиями даёт нестабильный результат.
Игнорирование температуры. Для задач, где важна точность - резюме документа, извлечение данных, юридический текст - снижайте температуру. Для творческих задач повышайте.
Что получаем в итоге¶
Правильно выстроенный промпт - это шаблон, который работает стабильно, а не разовая удача. По данным Anthropic, системный промпт-инжиниринг дал рост точности на 20% в реальном корпоративном кейсе - чат-ассистент для клиентов Fortune 500. Для российского бизнеса те же техники применимы к GigaChat и YandexGPT: обе модели поддерживают структурированные промпты, few-shot и chain-of-thought, хотя реакция на разметку у них несколько отличается от GPT-4o и Claude.
Мнение редакции ENGRAM
Рекомендуем начинать с двух вещей: зафиксировать шаблоны промптов для повторяющихся задач (КП, письма, резюме документов) и сразу тестировать их на GigaChat или YandexGPT - оба доступны из РФ с оплатой в рублях и подходят для работы с данными, которые нельзя выгружать за рубеж по 152-ФЗ. На нашем опыте, структурированный промпт с ролью, контекстом и 2-3 примерами даёт стабильный результат уже с первой попытки - без итераций и без зависимости от конкретного сотрудника, который "умеет общаться с нейросетью".
Источники¶
Материал подготовлен на основе:
- A Primer on the Inner Workings of Transformer-based Language Models
- Transformers, the tech behind LLMs | Deep Learn... | 3Blue1Brown
- Decoder-Only Transformers: The Workhorse of Generative LLMs
- Transformer Explainer: LLM Transformer Model Visually Explained
- How Transformers Work: A Detailed Exploration of Transformer Architecture | DataCamp
- https://arxiv.org/pdf/2408.04619
- Which AI should I use? Superpowers and the State of Play
- Comparing Top Generative AI Models: GPT-4o, Claude, Gemini, and More
- GPT-4 Turbo vs. Claude 3 Opus vs. Google Gemini 1.5 Pro
- GPT-4o vs. Gemini 1.5 Pro vs. Claude 3 Opus Model Comparison | Encord
Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.
Зарегистрироваться бесплатноENGRAM запоминает ваши встречи, документы и переписку и мгновенно находит ответ со ссылкой на источник. Ваша вторая память на базе ИИ. Данные в России, старт бесплатный.
Зарегистрироваться бесплатно