- Дата публикации
Amazon QuickSight учит данные разговаривать: как Dataset Q&A превращает BI‑отчёты в чат
Что нового
Amazon QuickSight (в оригинале — Amazon Quick) получил режим Dataset Q&A — по сути, это «чат с датасетом» поверх SQL и Redshift, который уже используют команды AWS.
Главные изменения и цифры из продакшена AWS:
- Натуральный язык вместо дашбордов. Можно задавать вопросы к данным текстом, без настройки Topics, без сборки отдельных дашбордов и без участия BI‑инженера.
- SQL на лету. Dataset Q&A переводит запросы на человеческом языке в SQL во время выполнения, опираясь на семантику, встроенную прямо в датасет.
- +≈48 % к точности ответов. Внутри AWS команда Specialist Data Lens (SDL) измерила рост точности ответов TARA (Technical Analysis Research Agent) по бенчмаркам с «землёй» (ручной SQL + верификация аналитика).
- Почти ноль фейлов запросов. Сложные аналитические вопросы, которые раньше падали, начали отрабатываться корректно. Команда описывает снижение числа неуспешных запросов до «почти нуля».
- Скорость: с 2–3 минут до ~10 секунд. Время ответа на сложные вопросы сократилось более чем на 90 % — с нескольких минут до порядка 10 секунд.
- Время анализа: с 90 минут до <5 минут. Полный цикл ответа на нетривиальный бизнес‑вопрос (сейчас — через TARA) стал короче примерно в 18 раз.
- Рост success rate с 80–85 % до >95 %. Доля запросов, которые дают полезный ответ без правок, выросла до более чем 95 %.
- Минус 2–3 дня рутины в месяц. Команда SDL перестала тратить несколько дней каждый месяц на обслуживание семантических моделей Topics.
Плюс архитектурный сдвиг:
- Q&A теперь работает напрямую с датасетом, а не через отдельный слой Topics, где раньше приходилось руками описывать каждое поле, связи и синонимы.
Функция уже используется внутри AWS в системе TARA — это чат‑ассистент для аналитики полевых технических команд и программ AWS.
Как это работает
Базовая идея
Dataset Q&A — это прослойка между вашим вопросом на естественном языке и SQL‑движком, который ходит в Redshift и другие источники QuickSight.
Она делает три вещи:
- Понимает, что вы хотите узнать (намерение и метрики).
- Находит подходящие датасеты и поля.
- Генерирует SQL‑запрос к этим датасетам и возвращает результат с визуализациями и пояснениями.
Ключевой момент: семантика (описания полей, синонимы, инструкции по использованию) живёт внутри датасета, а не в отдельной Topic‑модели.
Архитектура на примере TARA
TARA — внутренний аналитический ассистент AWS, построенный на QuickSight, Dataset Q&A и MCP‑интеграциях.
У него четыре слоя.
1. Слой доступа и оркестрации
- Интерфейс — веб‑чат на базе Amazon Quick Chat Agent.
- Пользователь логинится через AWS‑аккаунт.
- Chat Agent решает, куда отправить запрос:
- в Dataset Q&A и датасеты;
- в существующие дашборды;
- в внешние системы по API (через MCP‑Actions);
- в специализированных «исследовательских» агентов.
2. Dataset Q&A + Quick Spaces
- Данные лежат в Amazon Redshift (внутренний data lake Windsor) и подключены к QuickSight.
- Quick Spaces — это логические «пространства», где собраны датасеты для конкретных команд.
- TARA использует несколько Spaces:
- основной Space с операционными и перформанс‑датасетами;
- Workshop Studio Space с данными по воркшопам и событиям.
- Dataset Q&A позволяет:
- задавать вопросы про операционные метрики, запросы к специалистам, продажи, цели;
- не знать схему, имена таблиц и поля;
- получать ответы напрямую из датасетов.
3. Семантический слой через инструкции агенту
Вместо ручной настройки Topics команда SDL описала бизнес‑логику в инструкциях для кастомного чат‑агента:
- Что такое «активный участник» — не по уровню, а по флагу статуса.
- Как считать SLA по Specialist Requests — только по завершённым, без отменённых.
- Что такое «текущий месяц» — последний месяц с полными данными, а не календарный.
Эти инструкции работают как переводчик между бизнес‑языком и схемой данных. Благодаря этому руководитель может писать:
«Покажи SLA по домену Analytics за последние 15 месяцев»
а система сама поймёт, какие фильтры и формулы применить.
4. Слой действий и внешних систем
TARA не ограничивается отчётами. Через Amazon Quick Actions и MCP она подключена к рабочим системам AWS:
- Alchemy — поиск приоритетных кейсов клиентов, подбор AWS‑ и партнёрских решений, валидирующие ресурсы и sales‑плейбуки.
- SpecReq — приём и маршрутизация запросов к специалистам, трекинг и выполнение.
- Service 360 Deep Research Agent — глубокий анализ фич‑реквестов, трендов по запросам к специалистам и болевых точек клиентов.
Запланированы новые агенты, например:
- Specialist Super Agent — набор ИИ‑агентов по 30+ технологическим доменам.
- InstructAI — автоматизация воркфлоу и BI по выручке, пайплайну и перформансу.
Жизненный цикл запроса
- Руководитель пишет вопрос: например, «Как домен Analytics выступает в 2026 YTD?».
- Chat Agent определяет, что это аналитический запрос к датасетам, и отправляет его в Dataset Q&A.
- Dataset Q&A:
- разбирает текст на сущности: домен, период, метрики;
- выбирает релевантные датасеты (члены, компетенции, SpecReq, продажи и т.д.);
- строит SQL с нужными join’ами, фильтрами и агрегациями;
- выполняет запрос.
- QuickSight возвращает:
- таблицу/графики;
- текстовое резюме;
- панель объяснения: формулы, фильтры, объёмы, сравнение год к году.
Если вопрос требует живого контекста (например, «покажи последние взаимодействия с клиентами по этому домену»), TARA отправляет его в нужный MCP‑Action и подтягивает данные из внешних систем.
Ключевое отличие от Topics‑подхода
Раньше QuickSight Q опирался на Topics — отдельный семантический слой:
- нужно было вручную описывать каждое поле, связи, синонимы, правила агрегации;
- любые изменения схемы требовали апдейта Topics.
Теперь Dataset Q&A:
- читает схему датасета на лету;
- сам выводит связи по ключам и названиям колонок;
- строит SQL динамически;
- использует встроенные в датасет описания и инструкции.
Практический эффект:
- новые колонки можно спрашивать сразу после появления в датасете;
- кросс‑датасетные запросы собираются автоматически по общим ключам;
- бизнес‑логика применятся контекстно, а не жёстко прошивается в Topics;
- поддержка семантики перестаёт быть отдельным проектом.
Что это значит для вас
Где это полезно
Если вы работаете с BI и аналитикой на данных в AWS, Dataset Q&A интересен в нескольких сценариях.
-
Руководители и продакты, уставшие от очереди в BI.
- Задачи: «как у нас идёт выполнение SLA за последние 15 месяцев», «какие домены проседают по запросам клиентов», «где растёт спрос по регионам».
- Польза: не нужно ждать, пока аналитик соберёт новый дашборд. Вопрос → ответ за секунды.
-
Аналитики данных.
- Задачи: быстрые гипотезы, «черновые» срезы, исследование данных без написания SQL.
- Польза: меньше рутины по разовым вопросам от менеджеров, больше времени на сложный анализ.
-
Операционные команды и техподдержка.
- Задачи: мониторинг нагрузки, производительности, качества закрытия обращений.
- Польза: можно быстро уточнить, где именно растёт нагрузка, какие типы запросов тормозят, какие команды справляются лучше.
-
Команды, работающие с PII и чувствительными данными.
- В TARA данные с PII остаются под контролем: Q&A работает по тем датасетам и полям, к которым у пользователя есть доступ.
- Можно давать доступ к аналитике без раскрытия лишних деталей.
Где инструмент будет слабее
Dataset Q&A — не серебряная пуля.
Не лучший вариант, если:
- Нужен тяжёлый data science. Сложное моделирование, прогнозирование, обучение моделей — это территория SageMaker, Databricks и Python‑стека, а не чат‑интерфейс QuickSight.
- Схема данных хаотична и не описана. Если в датасете нет внятных описаний полей, а названия колонок абстрактные, качество ответов упадёт.
- Нужен детальный контроль над SQL. Для тонкой оптимизации запросов, CTE, window‑функций и сложных джойнов всё равно придётся писать SQL вручную.
Ограничения доступности
Dataset Q&A работает в экосистеме AWS и требует:
- AWS‑аккаунт.
- Amazon QuickSight Enterprise Edition с минимум одним Enterprise‑ и одним Professional‑пользователем.
Если вы в России:
- прямой доступ к AWS и QuickSight может потребовать VPN и юридическую проверку политики вашей компании;
- биллинг AWS и соблюдение экспортных ограничений нужно уточнять отдельно.
Практический чек‑лист перед запуском
- У вас есть данные в Redshift или других источниках QuickSight, и ими уже пользуются через дашборды.
- Руководители регулярно задают ad‑hoc вопросы и ждут BI‑инженеров по несколько часов или дней.
- Вы готовы потратить время на внятные описания полей и базовые инструкции для чат‑агента.
- Вам важно сохранять контроль над PII и доступами, а не выгружать всё в внешние LLM‑сервисы.
Если всё это похоже на вашу ситуацию, Dataset Q&A может резко сократить количество ручной работы и ускорить принятие решений.
Место на рынке
Dataset Q&A живёт внутри Amazon QuickSight и работает поверх AWS‑инфраструктуры. Это не прямой конкурент GPT‑класса, а альтернатива ручному BI в экосистеме AWS.
По сравнению с классическими BI‑инструментами:
- Tableau, Power BI, Looker тоже двигаются к Q&A по данным, но в исходном материале нет прямых цифр по скорости, точности или стоимости, поэтому сравнивать некорректно.
- Главное отличие QuickSight в данном кейсе — тесная связка с Redshift, Quick Spaces, MCP‑Actions и чат‑агентом, который уже встроен в AWS‑аккаунт.
По сравнению с LLM‑чатами общего назначения (GPT‑4o, Claude 3.5 и др.):
- Dataset Q&A не пытается заменить их. Он решает другую задачу — управляемый доступ к корпоративным датасетам с гарантированным SQL‑бэкендом и контролем PII.
- Конкретных бенчмарков «быстрее GPT‑4o на X %» или сравнений по стоимости в материале нет, поэтому приводить их нельзя.
Внутри AWS Dataset Q&A уже показал:
- рост точности ответов примерно на 48 %;
- рост успешности запросов до >95 %;
- сокращение времени анализа сложных вопросов с 90 до <5 минут;
- экономию 2–3 рабочих дней в месяц на поддержке семантического слоя.
Эти цифры важны, если вы решаете, вкладываться ли в перенос BI‑нагрузки в чат‑формат.
Как запустить (базовые шаги)
Официальная документация AWS по QuickSight даёт детальные инструкции, но общая схема, описанная на примере TARA, выглядит так.
1. Подготовьте аккаунт и QuickSight
- Зарегистрируйте или используйте существующий AWS‑аккаунт.
- Включите Amazon QuickSight Enterprise Edition.
- Создайте как минимум одного Enterprise‑ и одного Professional‑пользователя.
2. Настройте кастомный чат‑агент
- В консоли QuickSight создайте кастомный Chat Agent.
- Задайте ему инструкции:
- терминологию бизнеса;
- правила расчёта ключевых метрик;
- дефолтные временные рамки;
- ограничения по использованию PII.
- Привяжите к агенту Spaces и Actions (следующие шаги).
3. Подключите датасеты к Space
- В боковой панели QuickSight откройте раздел Spaces.
- Создайте новый Space, задайте имя и назначение.
- Добавьте в Space нужные датасеты QuickSight. На примере TARA это:
- членство и активность участников;
- трекинг компетенций;
- Specialist Requests и их SLA;
- отчётность по доменам;
- индивидуальные вклады и перформанс.
- Убедитесь, что датасеты обновляются по расписанию — Dataset Q&A будет работать с актуальными данными.
4. Подключите Actions через MCP
- В разделе Integrations создайте новый Action.
- Настройте подключение к MCP‑серверу нужной системы (например, SpecReq, Alchemy или внутренний сервис).
- Привяжите Action к вашему чат‑агенту.
Теперь агент сможет комбинировать ответы из структурированных датасетов и живых API.
5. Используйте естественный язык для запросов
После настройки вы можете:
- открыть чат с агентом в браузере;
- начать с простого «Привет»;
- задавать вопросы:
- «Как домен Analytics выступает в 2026 YTD?»
- «Сравни SpecReq‑перформанс по доменам и покажи топовые primary topics с разбивкой по гео».
- «Сделай deep dive по SLA за последние 15 месяцев».
QuickSight вернёт:
- таблицы и графики;
- текстовое резюме;
- панель объяснения формул и фильтров.
Если вы руководитель, это сокращает путь от вопроса до ответа до одной вкладки браузера и нескольких фраз в чате.