Nvidia Rubin Ultra: первый ИИ‑ускоритель с 1 ТБ HBM‑памяти выйдет в 2027 году — VogueTech

Что появилось / что изменилось

Nvidia показала Rubin Ultra — новое поколение GPU‑платформы для ИИ‑нагрузок. Главный факт: ускоритель получает 1 ТБ памяти HBM4E. По заявлению Nvidia, это первый ИИ‑ускоритель с терабайтом памяти на борту.

Rubin Ultra рассчитан на запуск крупных моделей и обучение следующего поколения ИИ‑систем. Nvidia планирует вывести его на рынок в 2027 году, то есть это анонс на несколько лет вперёд, а не продукт "купить завтра".

Ключевые изменения:

до 1 ТБ памяти HBM4E на один GPU‑модуль;
четыре вычислительных чиплета в составе Rubin Ultra;
новая стоечная архитектура Kyber NVL144 вместо нынешней NVL72;
вертикальное размещение модулей в стойке и изначальный расчёт на жидкостное охлаждение;
до 144 GPU‑модулей Rubin Ultra в одной стойке Kyber;
переход с NVLink Switch 6‑го поколения на 7‑е при той же скорости 3600 ГБ/с;
подготовка Ethernet‑процессора ConnectX / CX9‑1600G для ускорения внешних соединений.

Как это работает

Rubin Ultra строится вокруг четырёх вычислительных чиплетов. Nvidia не показывает упаковку, но логика понятна: несколько кристаллов объединяют в одном модуле с общей HBM4E‑памятью. Терабайт HBM4E располагают максимально близко к вычислительным блокам, чтобы минимизировать задержки и получить высокую пропускную способность.

Новая стойка Kyber NVL144 меняет сам подход к раскладке железа: вместо привычного горизонтального размещения GPU Nvidia переходит на вертикальное. Это нужно, чтобы компактно разместить до 144 модулей Rubin Ultra и эффективно отводить тепло. Вся архитектура изначально рассчитана на жидкостное охлаждение, без попыток "дожать" воздушные системы.

Внутри стойки работает NVLink Switch 7‑го поколения. Скорость межсоединения остаётся 3600 ГБ/с, но новая версия даёт возможность связать больше GPU в единую систему. Для связи с внешним миром Nvidia готовит Ethernet‑процессор ConnectX / CX9‑1600G, который должен ускорить сетевые соединения между стойками и дата‑центрами.

Что это значит для вас

Rubin Ultra — история не для домашнего ПК и не для стартапа на одном сервере. Это железо для крупных дата‑центров, hyperscaler‑ов и исследовательских лабораторий, которые обучают и запускают гигантские модели.

Когда 1 ТБ HBM4E становится нормой для одного GPU‑модуля, меняется масштаб задач:

обучение и инференс огромных языковых и мультимодальных моделей без агрессивного шардирования по десяткам GPU;
запуск ИИ‑систем с очень длинным контекстом, сложными агентными сценариями и большим объёмом данных в памяти;
симуляции, научные расчёты и граф, где объём данных раньше был узким местом.

Если вы:

работаете в крупном облаке или корпорации — Rubin Ultra и Kyber задают ориентир по инфраструктуре к 2027 году. Это влияние на бюджеты, дизайн дата‑центров и стратегии охлаждения.
строите стартап на ИИ — напрямую вы Rubin Ultra в ближайшие годы не купите. Но появление такой платформы означает, что через несколько поколений облачные провайдеры смогут предлагать более ёмкие и мощные инстансы. Планируя архитектуру, закладывайте, что лимиты по памяти GPU будут постепенно сдвигаться.
занимаетесь on‑prem‑инфраструктурой — Kyber показывает, куда движется high‑end: вертикальная компоновка, плотная упаковка GPU и обязательная жидкость. Воздушные стойки для топовых ИИ‑нагрузок будут всё менее актуальны.

Для обычного пользователя и малого бизнеса Rubin Ultra пока останется фоном: вы будете взаимодействовать не с самим железом, а с сервисами, которые на нём работают. Но именно такие системы определят, какими станут облачные GPT‑уровня модели к концу десятилетия.

Место на рынке

По объёму памяти Rubin Ultra выходит за рамки текущего поколения ИИ‑ускорителей. Сейчас даже флагманские GPU предлагают десятки или, в лучшем случае, сотни гигабайт памяти на модуль. Rubin Ultra с 1 ТБ HBM4E задаёт новую планку именно по объёму доступной памяти для одной вычислительной единицы.

Nvidia одновременно усиливает не только сам GPU, но и инфраструктуру вокруг него: Kyber NVL144, NVLink Switch 7‑го поколения и ConnectX / CX9‑1600G формируют целостную платформу под крупные ИИ‑кластеры. Это важно для hyperscaler‑ов, которым нужна не просто мощность одного ускорителя, а масштабируемые стоечные решения.

Прямых цифр по производительности, энергопотреблению и стоимости Rubin Ultra Nvidia пока не раскрывает. Понятно одно: это продукт верхнего ценового сегмента, рассчитанный на тех, кто уже сегодня строит многотысячные GPU‑кластеры и готов перестраивать дата‑центры под жидкостное охлаждение.

Что появилось / что изменилось

Как это работает

Что это значит для вас

Место на рынке

Читайте также