Дата публикации
coding

Как говорить с ИИ, чтобы он работал на вас: практическое руководство по prompt‑инженерии

Что нового

Anthropic систематизировала подход к prompt‑инженерии вокруг Claude 4.x и современных LLM. В одном материале собрали то, что реально влияет на качество ответов:

  • базовый набор приёмов, которые сразу улучшают ответы без кода и сложных настроек;
  • продвинутые техники для длинных цепочек запросов, сложных аналитических задач и работы с форматом вывода (JSON, таблицы и т.п.);
  • честный разбор «старых» практик — XML‑теги, агрессивное role‑prompting — когда они ещё полезны, а когда уже мешают;
  • фреймворк выбора нужной техники под задачу, плюс чек‑лист типичных ошибок и их исправлений.

Цифр производительности или стоимости у Anthropic тут нет — это не релиз новой версии Claude, а практическое руководство по тому, как выжать максимум из уже доступных моделей (включая бесплатный Claude.ai).

Как это работает

Prompt‑инженерия в понимании Anthropic — это не магические заклинания, а структурирование входных данных для LLM. Ключевые механики под капотом моделей Claude 4.x, на которые опирается гайд:

  1. Чувствительность к явным инструкциям. Claude реагирует на прямые, конкретные команды: глагол действия + чёткое ожидание результата. Чем меньше модель вынуждена «додумывать», тем стабильнее ответы.

  2. Использование контекста и мотивации. Claude умеет выводить цели пользователя из описания «зачем это нужно». Если вы объясняете, для кого текст, как он будет использоваться и почему важны ограничения, модель точнее подбирает стиль и структуру.

  3. Few‑shot обучение на лету. One‑shot и few‑shot‑примеры в prompt'е выступают как мини‑датасет: Claude внимательно копирует формат, стиль, структуру примеров. Это особенно заметно в версиях 4.x — модель буквально «прилипает» к паттернам из примера.

  4. Управление форматом вывода. Модели Claude хорошо следуют формальным ограничениям: можно жёстко требовать «валидный JSON без пролога», «только абзацы без маркированных списков», «таблица с такими‑то колонками». В API Anthropic предлагает prefill — вы заранее задаёте начало ответа (например, {), и модель продолжает в нужном формате.

  5. Явное разрешение на «не знаю». Если прямо попросить «не выдумывать и говорить, когда данных мало», это заметно снижает галлюцинации. Модель оптимизирована под правдивость, но явное разрешение ещё сильнее смещает её поведение.

  6. Встроенное «расширенное мышление». В Claude 4.x Anthropic добавила режим расширенного рассуждения: модель сама простраивает цепочку мыслей для сложных задач. Когда этот режим недоступен (например, в бесплатном Claude.ai), его можно частично заменить ручным Chain‑of‑Thought в prompt'е.

  7. Контекст‑инжиниринг. У Claude 4.x большой контекст и улучшенная работа с длинными документами, в том числе снижение эффекта «Lost in the Middle». Но даже при этом дробление задач и явная структура контекста по‑прежнему дают выигрыш в качестве.

Что это значит для вас

Когда хватит базовых приёмов

Если вы:

  • пишете тексты (статьи, описания, письма);
  • делаете резюме, конспекты, презентации;
  • готовите простые технические задания или документацию;
  • просите примеры кода, рефакторинг, комментарии к функциям;

вам достаточно базового набора:

  1. Будьте предельно явными. Не «сделай дашборд», а: «Создай проект дашборда для продуктовой аналитики: воронка, retention, cohort‑анализ, сегментация по устройствам. Опиши метрики, события, фильтры и пример структуры дашборда».

  2. Давайте контекст и цель. Не «перепиши текст проще», а: «Перепиши текст проще для начинающих разработчиков. Цель — чтобы человек с опытом до года в веб‑разработке понял концепцию без словаря терминов».

  3. Фиксируйте формат. «Ответь в одном абзаце до 5 предложений», «Сделай таблицу с колонками: Проблема | Причина | Как исправить», «Без списков, только сплошной текст».

  4. Разрешайте не знать. «Если в данных не хватает информации для вывода, напиши об этом прямо и не додумывай факты».

Это уже сильно сокращает количество «переспрашиваний» и правок.

Когда нужны продвинутые техники

Используйте расширенный набор приёмов, если вы:

  • строите сложные пайплайны (исследование → анализ → сводка → выводы);
  • работаете с длинными документами (отчёты, научные статьи, продуктовые спецификации);
  • интегрируете Claude в продукт (чат‑бот, ассистент в IDE, внутренний тул для аналитиков);
  • хотите строгий формат вывода (JSON, XML, CSV‑подобные таблицы).

В этих сценариях полезны:

  1. Prefill и жёсткий контроль формата. Для API‑интеграций: начинаете ответ с { и явно описываете схему JSON. В чат‑интерфейсе — формулируете: «Ответь только валидным JSON. Начни с {, без пояснений и пролога».

  2. Chain‑of‑Thought (CoT). Для задач с несколькими логическими шагами: «Сначала проанализируй данные, затем сформулируй 3 гипотезы, потом оцени каждую по рискам. Думай по шагам, покажи рассуждения».

  3. Промпт‑чейнинг. Разбиваете большую задачу на серию запросов:

    • 1‑й шаг — краткий пересказ документа;
    • 2‑й — проверка пересказа на полноту/точность;
    • 3‑й — финальная выжимка для презентации.

    Это повышает качество, но увеличивает задержку и число обращений к API.

  4. Примеры (one‑shot / few‑shot). Для стилистики и нестандартных форматов проще показать один идеальный пример, чем описывать словами. Важно: пример должен демонстрировать именно желаемое поведение, без «антипаттернов».

Где эти подходы не помогут

  • Нет доступа к интернету / VPN. Если Claude в вашем регионе заблокирован и вы не используете VPN, эти советы напрямую не примените к Claude, но они почти полностью переносятся на другие LLM (GPT‑4o, Gemini и т.п.).
  • Жёсткие регуляторные ограничения. Если вам нельзя передавать в облако реальные данные (финансы, медицина, гос‑сектор), придётся анонимизировать или синтетически моделировать входные данные. Prompt‑инженерия это не решает.
  • Плохая постановка задачи. Если вы сами не понимаете, чего хотите, никакой приём не спасёт. Модель не заменяет продакт‑мышление и архитектурные решения.

Место на рынке

Anthropic в этом материале не приводит сравнения Claude с GPT‑4o, Gemini 1.5 или другими моделями по скорости, цене или качеству. Фокус — только на том, как разговаривать с LLM так, чтобы они работали лучше.

Из полезных рыночных акцентов:

  • Claude 4.x умеет:

    • аккуратно работать с длинным контекстом и снижать эффект «Lost in the Middle»;
    • автоматически строить цепочки рассуждений (расширенное мышление), что частично снимает необходимость вручную прописывать CoT;
    • очень внимательно относиться к few‑shot‑примерам и формату вывода.
  • Старые техники вроде XML‑разметки в prompt'ах и агрессивного role‑prompting Anthropic теперь считает второстепенными для современных моделей. Для большинства задач достаточно явных инструкций, структуры и контекста.

Если вы уже используете другие LLM, этот гайд полезен как универсальный набор практик: почти все приёмы переносятся между Claude, GPT‑4o и аналогами без изменений.

Как это работает на практике: ключевые техники

1. Явные и конкретные инструкции

Пример из гайда Anthropic:

  • Плохо: «Создай аналитический дашборд».
  • Лучше: «Создай аналитический дашборд. Включи максимум релевантных метрик и интерактивностей. Не ограничивайся базовым набором, опиши полноценную реализацию».

Практический чек‑лист:

  • начинайте запрос с глагола действия: «напиши», «проанализируй», «сгенерируй», «создай»;
  • без длинных предисловий — сразу к сути задачи;
  • описывайте не только задачу, но и структуру результата: «3 абзаца», «таблица», «список шагов»;
  • фиксируйте глубину: «поверхностный обзор», «подробный разбор с примерами кода».

2. Контекст и мотивация

Пример:

  • Менее эффективно: «Не используй списки».
  • Лучше: «Предпочитаю ответ в виде плавного текста без списков. Так мне легче читать и воспринимать материал в разговорном стиле. Маркированные списки кажутся слишком формальными».

Когда добавлять контекст:

  • объясняете, кто целевая аудитория;
  • указываете, зачем вам этот текст/код/анализ;
  • описываете ограничения (регуляция, бренд‑гайд, формат площадки);
  • формулируете проблему, которую решаете.

3. Конкретика в требованиях

Пример с питанием:

  • Плохо: «Составь план питания в средиземноморском стиле».
  • Лучше: «Составь средиземноморский план питания для контроля преддиабета. 1800 ккал в день, акцент на продуктах с низким ГИ. Нужны завтрак, обед, ужин и один перекус с указанием нутриентов».

Что стоит явно задавать:

  • ограничения: объём текста, формат, срок, бюджет, диета, технические рамки;
  • контекст: кто пользователь, какая цель;
  • желаемая структура: таблица, список, абзацы, JSON;
  • жёсткие запреты: «без ссылок», «без кода», «без советов по медицине».

4. Примеры (one‑shot / few‑shot)

Примеры особенно полезны, когда:

  • формат сложно описать словами;
  • нужен специфический тон (например, «дружелюбный, но без сюсюканья»);
  • в задаче много тонких правил и паттернов;
  • простые инструкции дают нестабильный результат.

Стратегия от Anthropic:

  • начните с одного примера (one‑shot);
  • если модель всё ещё «плавает», добавляйте ещё 1–2 примера (few‑shot);
  • следите, чтобы примеры не содержали того, чего вы не хотите видеть в ответе.

5. Разрешение на «не знаю»

Пример формулировки:

«Проанализируй эти финансовые данные и выдели тренды. Если данных недостаточно для уверенных выводов, не делай предположений — прямо напиши, что информации мало».

Одна такая фраза заметно повышает надёжность ответа, особенно в аналитике и работе с частично заполненными таблицами.

Продвинутые техники

Prefill: управление началом ответа

Prefill даёт вам контроль над тем, как Claude начнёт ответ:

  • полезно, когда нужен строгий JSON, XML или другой формат;
  • удобно, если хотите убрать типичное «Вот ваш ответ: …» и сразу получить полезный контент;
  • помогает удерживать голос/персонажа ассистента в продукте.

Пример с JSON:

  • Без prefill Claude может написать: «Вот запрошенный JSON: { ... }».
  • С prefill в API вы задаёте начало ответа как { — модель продолжает только валидным JSON.

В чат‑режиме это имитируется текстом:

«Ответь только валидным JSON. Никакого текста до или после. Начни ответ с {».

Chain‑of‑Thought (CoT)

CoT — это явная просьба думать по шагам.

Когда полезно:

  • нет доступа к расширенному рассуждению Claude (например, бесплатный тариф Claude.ai);
  • нужна прозрачная цепочка логики, которую можно проверить;
  • задача состоит из нескольких аналитических шагов;
  • вы хотите, чтобы модель учла конкретные факторы.

Форматы CoT:

  1. Базовый. Добавляете: «Подумай по шагам».
  2. Гайдированный. Структурируете: «Сначала опиши данные, затем сформулируй гипотезы, потом оцени риски и сделай вывод».
  3. Структурированный. Разделяете рассуждения и финальный ответ тегами или пометками, например РАССУЖДЕНИЕ: и ОТВЕТ:.

Даже при наличии расширенного мышления в Claude явный CoT иногда полезен — например, когда вы хотите видеть логику или встроить её в отчёт.

Контроль формата ответа

Anthropic предлагает три простых правила:

  1. Говорите, что нужно делать, а не чего избегать.

    • Вместо «не используй Markdown» — «ответь в виде сплошного текста без разметки».
  2. Синхронизируйте стиль prompt'а и желаемого ответа.

    • Много Markdown в запросе увеличивает шанс получить Markdown в ответе.
  3. Явно описывайте формат.

    • «Таблица с колонками…», «JSON со структурой…», «Три абзаца, каждый до 4 предложений».

Промпт‑чейнинг

Чейнинг — это серия запросов вместо одного «комбайна».

Пример с научной статьёй:

  1. «Кратко перескажи методологию, результаты и клиническое значение этой медицинской статьи».
  2. «Проверь пересказ выше на точность, ясность и полноту. Дай поэтапный фидбек».
  3. «Улучшай пересказ с учётом этого фидбека: [вставляете комментарии из шага 2]».

Когда это оправдано:

  • задача сложная и многослойная;
  • нужен цикл «черновик → критика → улучшение»;
  • вы строите аналитический пайплайн или продуктовый флоу с промежуточной проверкой.

Минус очевиден: больше запросов, выше задержка и стоимость. Плюс — заметно лучшее качество и предсказуемость результата.

«Старые» техники: когда они ещё нужны

XML‑теги для структуры

Раньше XML‑обёртки часто использовали, чтобы структурировать prompt. Claude 4.x и другие современные LLM и без них хорошо понимают структуру, но XML всё ещё может помочь, если:

  • prompt очень длинный и в нём смешано несколько типов контента;
  • вам критично жёстко отделять блоки (например, «инструкция», «данные», «пример»);
  • вы работаете со старыми версиями моделей.

Во многих случаях достаточно чётких заголовков, отступов и явных фраз вроде «Используй данные ниже о спортсменах: …» — без XML.

Ролевой prompt (role‑prompting)

Формат: «Ты финансовый консультант. Проанализируй портфель…».

Anthropic считает, что для Claude 4.x этого чаще всего не нужно. Модель и так умеет переключаться между стилями и глубиной.

Когда роль всё же полезна:

  • вам нужен стабильный тон в серии ответов (например, бренд‑голос);
  • вы строите продукт с конкретной персоной ассистента;
  • вы хотите усилить доменную экспертизу в ответах.

Главный совет — не перегибать:

  • лучше: «Ты полезный ассистент, который объясняет просто и честно»;
  • хуже: «Ты мировой эксперт, никогда не ошибаешься и говоришь только техническим жаргоном» — это сужает полезность и повышает риск самоуверенных ошибок.

Часто эффективнее формулировка без роли: «Проанализируй портфель с фокусом на риске и долгосрочном росте».

Как выбрать нужную технику

Anthropic предлагает простой фреймворк:

  1. Запрос понятен и конкретен?

    • Если нет — сначала перепишите его.
  2. Задача простая?

    • Используйте базовые приёмы: конкретика, явные инструкции, контекст.
  3. Нужен особый формат?

    • Добавьте примеры, prefill или очень чёткие формальные требования.
  4. Задача сложная и многослойная?

    • Разбейте её на шаги и используйте промпт‑чейнинг.
  5. Нужна явная логика рассуждений?

    • Включите расширенное мышление Claude 4.x, а если его нет — Chain‑of‑Thought с явными шагами.

Сводная таблица из гайда:

  • Нужен конкретный формат → примеры, prefill, явные форматные инструкции.
  • Нужны поэтапные рассуждения → расширенное мышление Claude 4.x или CoT.
  • Многошаговая сложная задача → промпт‑чейнинг.
  • Прозрачная логика → CoT с разделением «рассуждение / ответ».
  • Минимум галлюцинаций → явное разрешение говорить «не знаю».

Типичные проблемы и как их чинить

Anthropic приводит мини‑справочник по багфиксу prompt'ов:

  • Ответ слишком общий.

    • Добавьте конкретику, примеры, явно попросите «выйти за рамки базового уровня».
  • Ответ уходит от темы.

    • Чётко сформулируйте цель: зачем вы задаёте вопрос и какой результат нужен.
  • Формат ответа плавает.

    • Дайте пример (few‑shot) или используйте prefill для контроля начала ответа.
  • Задача слишком сложна, результат нестабилен.

    • Разбейте на несколько запросов, каждый решает одну подзадачу.
  • Много вступлений и «воды».

    • Попросите «пропустить пролог и сразу перейти к сути» или используйте prefill.
  • Модель придумывает факты.

    • Разрешите ей говорить «не знаю», если данных мало.
  • Вместо изменений модель даёт советы.

    • Формулируйте команду как действие: «Измени код так, чтобы…», а не «Предложи, как изменить…».

Общий подход: начинайте с простого prompt'а и постепенно добавляйте только те элементы, которые реально улучшают результат.

Частые ошибки

Anthropic отдельно перечисляет ловушки, в которые все регулярно попадают:

  • переусложнение prompt'а ради «профессиональности»;
  • игнор базовых принципов ясности и конкретики;
  • ожидание, что ИИ сам догадается о ваших намерениях;
  • попытка применить все техники сразу;
  • отсутствие итераций и тестов;
  • опора на устаревшие практики (XML‑обёртки, чрезмерное role‑prompting) там, где хватает простых инструкций.

Работа с длинными текстами и большими задачами

При продвинутой prompt‑инженерии растёт расход токенов: примеры, инструкции, несколько шагов — всё это контекст.

Anthropic даёт несколько практических советов:

  • используйте сложные техники только там, где они действительно добавляют ценности;
  • для длинных документов явно структурируйте текст и выносите критически важные детали в начало или конец;
  • дробите большие задачи на фокусные подзадачи не из‑за лимита контекста, а чтобы модель лучше фокусировалась на каждом шаге.

Claude 4.x лучше справляется с длинным контекстом и реже «теряет» середину текста, но аккуратная работа со структурой и разбивкой задач всё равно даёт выигрыш.

Как понять, что prompt хороший

Prompt‑инженерия — это навык. Единственный способ его прокачать — систематически тестировать свои запросы.

Быстрый чек‑лист оценки:

  • результат попадает в ваши требования по содержанию и формату;
  • вы получили нужное с первой или второй попытки, без бесконечных уточнений;
  • формат ответов стабилен от запуска к запуску;
  • вы избегаете перечисленных выше типичных ошибок.

Anthropic отдельно развивает эту тему в своём курсе по prompt‑инженерии на anthropic.skilljar.com, где фокус на объективной оценке качества prompt'ов.

Зачем всё это лично вам

Если вы уже пользуетесь Claude или любым другим LLM, этот гайд — короткий путь от «поиграться с чатом» к инструменту, который экономит часы работы:

  • маркетологу — для брифов, раскадровок, email‑кампаний и презентаций в нужном тоне;
  • продакту — для структурирования требований, customer journey, сценариев UX‑исследований;
  • разработчику — для генерации и ревью кода, документации, миграций и тестов в заданном формате;
  • аналитику — для первичного разбора отчётов, гипотез и текстовых сводок.

Главная идея Anthropic проста: лучший prompt — не самый длинный и не самый «умный», а тот, который минимальным набором чётких инструкций стабильно даёт нужный вам результат. Чем лучше вы формулируете задачи, тем полезнее становится Claude и любые другие модели.


Читайте также