Google Gemini 3.5 Flash: новый дефолтный ИИ, который пишет код быстрее и работает дешевле — VogueTech

Что нового

Google на I/O 2026 представила линейку Gemini 3.5 и первой запустила Gemini 3.5 Flash. Это теперь дефолтная модель для приложения Gemini и AI Mode в Google Search по всему миру.

Ключевые изменения:

Новый базовый ИИ Google: Gemini 3.5 Flash становится моделью «по умолчанию» в Gemini и поиске. Отдельно существует более мощная Gemini 3.5 Pro — её обещают открыть в следующем месяце.
Скорость: по данным Google, 3.5 Flash выдаёт токены в секунду примерно в 4 раза быстрее, чем другие frontier‑модели того же класса.
Бенчмарки по коду и агентам:
- Terminal-Bench 2.1 — 76,2%
- MCP Atlas (масштабное использование инструментов) — 83,6%
- CharXiv Reasoning (мультимодальное понимание) — 84,2%
Реальная задача — «агентность»: Google делает упор на долгие многошаговые процессы. Партнёры (банки и финтех) уже используют 3.5 Flash, чтобы автоматизировать рабочие процессы, которые раньше занимали недели.
Цена и позиционирование: 3.5 Flash задуман как более дешёвый и быстрый вариант по сравнению с текущими Gemini Pro. При этом он слабее, чем будущий Gemini 3.5 Pro, в задачах с глубоким рассуждением и сложным контекстом.
Безопасность: Google усилила защиту от киберугроз и CBRN‑рисков (chemical, biological, radiological, nuclear), чтобы модель реже генерировала опасный контент и меньше «паниковала» на безопасных запросах.
Доступность для разработчиков: 3.5 Flash уже доступен через Google Antigravity, Gemini API в Google AI Studio и Android Studio, а также в Gemini Enterprise Agent Platform и Gemini Enterprise.
Личный ИИ‑агент: новый персональный агент Gemini Spark, который Google только начинает отдавать тестировщикам, тоже работает на Gemini 3.5 Flash.

Информации о стоимости платных тарифов Google пока не раскрывает.

Как это работает

Google не раскрывает архитектуру по слоям, но по факту Gemini 3.5 Flash — это оптимизированная версия крупной модели с упором на скорость генерации и работу в роли «агента».

Из того, что можно понять по описанию:

Оптимизация под throughput. Google явно настраивает 3.5 Flash на максимальное количество токенов в секунду. Это критично для чатов, ассистентов и онлайн‑сервисов, где важна мгновенная реакция.
Баланс между размерами и качеством. 3.5 Flash уступает будущей 3.5 Pro в глубоком рассуждении и понимании длинного контекста, но при этом уже превосходит актуальный Gemini 3.1 Pro по коду, работе с инструментами и мультимодальным задачам.
Агентный режим. Модель умеет планировать и выполнять многошаговые сценарии: вызывать инструменты, писать и править код, ходить по API, собирать и обрабатывать данные. Google подчёркивает, что под присмотром человека 3.5 Flash может надёжно тянуть длинные пайплайны.
Усиленные фильтры безопасности. Для кибербезопасности и CBRN Google явно доучила модель на специальных наборах данных и добавила более жёсткие политики: фильтрация вредного кода, сценариев атак, а также материалов, связанных с химическими, биологическими, радиационными и ядерными рисками.

Под капотом — всё тот же стек Google: облачная инфраструктура, интеграция с Google Antigravity, тесная связка с инструментами разработки (AI Studio, Android Studio) и корпоративными платформами Gemini Enterprise.

Что это значит для вас

Если вы разработчик

Gemini 3.5 Flash сейчас — рабочая лошадка Google для кода и агентов.

Где он полезен:

Генерация и рефакторинг кода. По бенчмаркам 3.5 Flash уже обгоняет Gemini 3.1 Pro на Terminal-Bench 2.1 (76,2%). Это хороший вариант для автодополнения, генерации модулей, написания тестов.
Инструментальные агенты. Высокий результат на MCP Atlas (83,6%) говорит о том, что модель уверенно использует внешние инструменты и API. Подходит, если вы строите:
- внутренних ботов, которые ходят в CRM/ERP;
- ассистентов для DevOps и поддержки;
- системы, которые сами запускают скрипты, собирают отчёты, обновляют данные.
Мультимодальные задачи. С результатом 84,2% на CharXiv Reasoning модель лучше понимает сложные мультимодальные входы. Это полезно для аналитики документов, презентаций, графиков.
Продолжительные пайплайны. Google прямо пишет, что партнёры уже закрывают с помощью 3.5 Flash процессы длиной в несколько недель. Модель подойдёт для бэкенд‑агентов, которые долго «жуют» очереди задач под присмотром человека.

Где стоит быть осторожнее:

Глубокие исследования и сложные рассуждения. Для задач, где важно максимально точное рассуждение на длинном контексте (юридический анализ, сложная наука, стратегическое планирование), Google сама рекомендует ждать Gemini 3.5 Pro.
Полностью автономные решения. Google явно подразумевает человеческий надзор. Если вы строите систему, где ИИ сам принимает критичные решения без контроля, 3.5 Flash лучше использовать как помощника, а не единственный «мозг».

По доступу: Gemini 3.5 Flash уже работает через Gemini API, Google AI Studio и Android Studio. Для России могут понадобиться VPN и аккаунт, который допускает доступ к сервисам Google AI — это зависит от вашей инфраструктуры и политики Google на момент использования.

Если вы продуктовый менеджер или основатель стартапа

Gemini 3.5 Flash имеет смысл рассматривать как базовый ИИ‑слой для:

чат‑ассистентов внутри продукта;
автоматизации поддержки и обработки заявок;
внутренних корпоративных агентов, которые ходят по внутренним системам и собирают отчёты;
прототипов ИИ‑функций, где важно быстрое время отклика и разумная цена.

Google позиционирует 3.5 Flash как более доступный по стоимости, чем текущие Gemini Pro. Если вы строите массовый сервис с большим количеством запросов, это может быть выгоднее, чем ставить более тяжёлую и дорогую модель на каждый запрос.

Если вы обычный пользователь

Изменения вы заметите в двух местах:

Приложение Gemini. Ответы должны приходить быстрее, а работа с кодом, документами и картинками — быть более точной.
AI Mode в Google Search. Объяснения, резюме и разборы страниц будут работать на Gemini 3.5 Flash. Ожидается более быстрый и аккуратный ответ на сложные запросы.

Личный ИИ‑агент Gemini Spark пока доступен только тестировщикам, но он тоже работает на 3.5 Flash. Это намёк на то, что именно эта модель станет основой для персональных цифровых ассистентов Google.

Место на рынке

Сейчас Gemini 3.5 Flash занимает в линейке Google роль «массовой» модели:

быстрее текущих Gemini Pro по скорости генерации (до 4 раз по токенам в секунду);
лучше Gemini 3.1 Pro по коду, агентным задачам и мультимодальным бенчмаркам;
дешевле, чем Pro‑линейка, по заявлению Google.

При этом Google честно разводит роли:

Gemini 3.5 Flash — для скорости, массовых сценариев, агентов и кода.
Gemini 3.5 Pro (ожидается через месяц) — для задач, где важны максимальное качество рассуждений и глубокое понимание контекста.

Конкретных сравнений с GPT‑5, GPT‑4o, Claude 3.5 и другими моделями Google не приводит. Но по собственным бенчмаркам компания явно нацеливает 3.5 Flash на конкуренцию в сегменте «быстрый и недорогой ИИ‑двигатель для приложений и агентов».

Для экосистемы Google это ещё и сигнал: все новые продукты вокруг ИИ‑агентов, разработки и поиска будут собираться вокруг Gemini 3.5 Flash и будущей 3.5 Pro. Если вы завязаны на Google Cloud и инструменты разработки Google, имеет смысл уже сейчас тестировать 3.5 Flash как базовую модель для своих сервисов.