- Дата публикации
Claude нашёл 22 бага в Firefox, NVIDIA выпустила гибридную модель, а Google — единый эмбеддинг
Что появилось / что изменилось
NVIDIA представила открытую модель Nemotron-3-Super-120B. Она имеет 120 миллиардов параметров, из которых активно используются 12 миллиардов. Контекстное окно — 1 миллион токенов. На бенчмарке SWE-Bench точность составляет 60%, на PinchBench — 85.6%. Модель оптимизирована для GPU Blackwell и занимает в четыре раза меньше памяти.
Claude Opus 4.6 от Anthropic обнаружил 22 уязвимости в коде браузера Firefox за две недели. Все ошибки уже исправлены в версии 148. За один месяц 2025 года такого количества критических CVE найти не удавалось.
Google выпустила Gemini Embedding 2. Это единая модель для создания векторных представлений текста, видео, аудио и PDF. Она обрабатывает текст длиной до 8192 токенов, видео до 120 секунд и PDF до 6 страниц. Стоимость: 0.2 доллара за миллион токенов для текста и до 12 долларов за миллион токенов для видео.
Исследователи из Пекинского университета и ByteDance открыли код модели Helios для генерации видео. Её дистиллированная версия работает со скоростью 19.5 кадров в секунду на одном GPU H100 и создаёт ролики длиной более минуты.
Как это работает
Nemotron-3-Super-120B использует гибридную архитектуру. В ней чередуются слои Mamba-2, MoE и механизм внимания (Attention). Модель обучена на 25 триллионах токенов и дообучена на 7 миллионах примеров. Она поддерживает семь языков, включая русский.
Anthropic использовала Claude 4.6 для анализа примерно 6000 файлов на C++ в кодовой базе Firefox. Модель искала уязвимости, включая ошибки типа use-after-free. Первый баг был найден за 20 минут.
Gemini Embedding 2 переводит данные разных типов в единое векторное пространство. Это позволяет сравнивать смысл текста, изображения и видео напрямую, без отдельных пайплайнов. Модель поддерживает более 100 языков.
Helios генерирует длинные видео, борясь с дрейфом объектов. Система отслеживает позицию объектов по времени, использует первый кадр как якорь и специально обучается на искажённых данных, чтобы не накапливать ошибки.
Что это значит для вас
Nemotron-3-Super-120B — мощный инструмент для создания AI-агентов, которые работают с длинным контекстом. Её стоит попробовать, если вы разрабатываете сложные автономные системы. Модель доступна через build.nvidia.com, Hugging Face и другие платформы.
Поиск уязвимостей с помощью Claude показывает, что большие языковые модели могут серьёзно усиливать аудит безопасности. Разработчикам стоит обратить внимание на этот подход для анализа собственного кода, особенно на C++.
Gemini Embedding 2 упрощает создание мультимодальных поисковых систем. Если вам нужно искать информацию по видеоархиву или сравнивать описание товара с его изображением — эта модель подойдёт. Учтите, что стоимость обработки видео высокая.
Helios открывает путь к быстрой генерации длинных видеороликов, например, для создания контента. Однако модель работает с разрешением 384×640, и на стыках фрагментов может быть заметно мерцание.
Место на рынке
По заявлению NVIDIA, Nemotron-3-Super-120B эффективнее использует память новых GPU Blackwell по сравнению с предыдущими архитектурами. Прямых сравнений по скорости с другими 120B-моделями в анонсе нет.
Claude 4.6 показал впечатляющий результат в аудите Firefox. Однако в изолированных тестах на взлом модель смогла успешно эксплуатировать лишь две из сотен уязвимостей.
Gemini Embedding 2 по результатам внутренних тестов Google опережает Amazon Nova 2 и Voyage Multimodal 3.5, особенно в работе с видео и текстом (68.8 против 60.3 балла у Amazon). У OpenAI embedding-модели не обновлялись с января 2024 года.
Helios генерирует видео в 128 раз быстрее, чем базовая модель Wan-2.1. Прямых аналогов с открытыми весами, способных создавать минутные ролики в реальном времени, на рынке пока немного.