Tenstorrent показала настольную ИИ-станцию на RISC-V за $10 000: 2654 TFLOPS и 128 ГБ GDDR6 для локальных LLM до 120B — VogueTech

Что появилось / что изменилось

Tenstorrent представила TT-QuietBox 2 — настольную рабочую станцию для ИИ на архитектуре RISC-V. Это не сервер в стойке, а именно «коробка под стол», которая работает от обычной розетки и не требует серверной инфраструктуры.

Ключевые характеристики:

Цена: около $10 000
Целевая аудитория: малый бизнес, команды разработчиков, ресёрч-группы
Поддержка локальных языковых моделей до 120 млрд параметров
Поддерживаемые LLM: в том числе GPT-OSS и Llama 3.1 70B
Вычислительная мощность: 2654 TFLOPS в формате FP8
Память: 128 ГБ GDDR6 (видеопамять) + 256 ГБ DDR5 (системная)
Архитектура: RISC-V + четыре ИИ-ускорителя Blackhole
Охлаждение: жидкостное, ориентированное на тихую работу
ОС: предустановленная Ubuntu 24.04
Софт: полностью открытый стек — от компилятора до ядра
Фреймворки: поддержка PyTorch и TensorFlow «из коробки»
Старт глобальных поставок: второй квартал 2026 года

Акцент Tenstorrent делает на локальном запуске крупных моделей без обращения к облаку и на прозрачной, открытой программной среде.

Как это работает

Внутри TT-QuietBox 2 стоят четыре специализированных ускорителя Blackhole. Вместе они дают 480 ядер Tensix. Именно эти ядра обеспечивают заявленные 2654 TFLOPS в FP8 — формат с пониженной точностью, который сейчас активно используют для инференса больших языковых моделей.

Станция оснащена 128 ГБ GDDR6 — это видеопамять, в которой живут веса моделей и промежуточные тензоры. Плюс 256 ГБ системной DDR5 для остальной части стека: данных, препроцессинга, вспомогательных сервисов.

Ключевой архитектурный ход Tenstorrent — использование SRAM на кристалле ускорителей. Такая память работает значительно ближе к вычислительным ядрам, чем внешняя DRAM. За счёт этого снижается задержка доступа к данным и отпадает необходимость в дорогой HBM-памяти, которую сейчас используют многие GPU для ИИ.

Жидкостная система охлаждения рассчитана на тихую работу при высокой нагрузке. Отсюда и название QuietBox: станция должна жить в офисе или студии, а не в серверной.

На уровне софта пользователю достаётся Ubuntu 24.04 и полностью открытый стек: компиляторы, драйверы, инструменты низкоуровневой отладки. Tenstorrent делает ставку на свои инструменты TT-Forge и TT-Metalium — через них можно отлаживать модели буквально на уровне железа. Для прикладных задач доступны привычные PyTorch и TensorFlow, которые работают поверх этого стека.

Что это значит для вас

TT-QuietBox 2 — вариант для тех, кому нужны крупные языковые модели локально и кто готов инвестировать в собственную инфраструктуру вместо подписки на облако.

Где станция особенно полезна:

Конфиденциальные данные: юристы, финтех, медтех, внутренние корпоративные ассистенты. Можно обучать и запускать LLM на чувствительных данных без передачи в облако.
R&D и стартапы в ИИ: команды, которые разрабатывают свои архитектуры, оптимизируют инференс, пишут компиляторы и рантаймы. Открытый стек и низкоуровневые инструменты дают больше контроля, чем закрытые GPU-платформы.
Прототипирование продуктов на LLM: генерация текста, кода, чат-ассистенты, поиск по корпоративным базам, аналитика документов — без зависимости от внешних API.
Обучение и дообучение моделей среднего размера: эксперименты с дообучением LLM до 70–120B параметров, кастомизация под доменные задачи.

Когда TT-QuietBox 2 вряд ли подойдёт:

Если вам нужны только готовые облачные модели вроде GPT-4o или Claude 3.5 и нет собственной разработки — дешевле и проще остаться на API.
Если бюджет ограничен несколькими тысячами долларов — $10 000 за одну станцию будет избыточно.
Если важна максимальная производительность на ватт по сравнению с топовыми GPU — Tenstorrent пока не даёт прямых сравнений с флагманскими видеокартами.

О доступности в России Tenstorrent ничего не уточняет. Для заказа и поддержки, скорее всего, понадобится зарубежный юридический контур и, возможно, VPN для работы с документацией и репозиториями.

Место на рынке

TT-QuietBox 2 целится в нишу настольных ИИ-станций, где сейчас доминируют решения на базе GPU — от готовых рабочих станций на NVIDIA до кастомных сборок.

Главные отличия подхода Tenstorrent:

Архитектура RISC-V и собственные ускорители Blackhole вместо классических GPU.
Отказ от HBM в пользу GDDR6 и крупного пула on-chip SRAM.
Полностью открытый программный стек, включая низкоуровневые компоненты.

По цифрам Tenstorrent называет 2654 TFLOPS в FP8 и поддержку моделей до 120B параметров, но не приводит прямых сравнений с конкретными GPU или системами конкурентов. Поэтому оценивать TT-QuietBox 2 нужно скорее как альтернативный путь к локальному ИИ: не про «быстрее всех», а про контроль над железом и софтом, отсутствие HBM и ориентацию на разработчиков, которым важен доступ к архитектуре RISC-V и низкоуровневой отладке.

Для рынка это ещё один сигнал: настольные станции для ИИ перестают быть экзотикой. Но TT-QuietBox 2 — всё ещё инструмент для тех, кто строит свои ИИ-продукты, а не просто подключается к чужому API.

Что появилось / что изменилось

Как это работает

Что это значит для вас

Место на рынке

Читайте также