- Дата публикации
Tenstorrent показала настольную ИИ-станцию на RISC-V за $10 000: 2654 TFLOPS и 128 ГБ GDDR6 для локальных LLM до 120B
Что появилось / что изменилось
Tenstorrent представила TT-QuietBox 2 — настольную рабочую станцию для ИИ на архитектуре RISC-V. Это не сервер в стойке, а именно «коробка под стол», которая работает от обычной розетки и не требует серверной инфраструктуры.
Ключевые характеристики:
- Цена: около $10 000
- Целевая аудитория: малый бизнес, команды разработчиков, ресёрч-группы
- Поддержка локальных языковых моделей до 120 млрд параметров
- Поддерживаемые LLM: в том числе GPT-OSS и Llama 3.1 70B
- Вычислительная мощность: 2654 TFLOPS в формате FP8
- Память: 128 ГБ GDDR6 (видеопамять) + 256 ГБ DDR5 (системная)
- Архитектура: RISC-V + четыре ИИ-ускорителя Blackhole
- Охлаждение: жидкостное, ориентированное на тихую работу
- ОС: предустановленная Ubuntu 24.04
- Софт: полностью открытый стек — от компилятора до ядра
- Фреймворки: поддержка PyTorch и TensorFlow «из коробки»
- Старт глобальных поставок: второй квартал 2026 года
Акцент Tenstorrent делает на локальном запуске крупных моделей без обращения к облаку и на прозрачной, открытой программной среде.
Как это работает
Внутри TT-QuietBox 2 стоят четыре специализированных ускорителя Blackhole. Вместе они дают 480 ядер Tensix. Именно эти ядра обеспечивают заявленные 2654 TFLOPS в FP8 — формат с пониженной точностью, который сейчас активно используют для инференса больших языковых моделей.
Станция оснащена 128 ГБ GDDR6 — это видеопамять, в которой живут веса моделей и промежуточные тензоры. Плюс 256 ГБ системной DDR5 для остальной части стека: данных, препроцессинга, вспомогательных сервисов.
Ключевой архитектурный ход Tenstorrent — использование SRAM на кристалле ускорителей. Такая память работает значительно ближе к вычислительным ядрам, чем внешняя DRAM. За счёт этого снижается задержка доступа к данным и отпадает необходимость в дорогой HBM-памяти, которую сейчас используют многие GPU для ИИ.
Жидкостная система охлаждения рассчитана на тихую работу при высокой нагрузке. Отсюда и название QuietBox: станция должна жить в офисе или студии, а не в серверной.
На уровне софта пользователю достаётся Ubuntu 24.04 и полностью открытый стек: компиляторы, драйверы, инструменты низкоуровневой отладки. Tenstorrent делает ставку на свои инструменты TT-Forge и TT-Metalium — через них можно отлаживать модели буквально на уровне железа. Для прикладных задач доступны привычные PyTorch и TensorFlow, которые работают поверх этого стека.
Что это значит для вас
TT-QuietBox 2 — вариант для тех, кому нужны крупные языковые модели локально и кто готов инвестировать в собственную инфраструктуру вместо подписки на облако.
Где станция особенно полезна:
- Конфиденциальные данные: юристы, финтех, медтех, внутренние корпоративные ассистенты. Можно обучать и запускать LLM на чувствительных данных без передачи в облако.
- R&D и стартапы в ИИ: команды, которые разрабатывают свои архитектуры, оптимизируют инференс, пишут компиляторы и рантаймы. Открытый стек и низкоуровневые инструменты дают больше контроля, чем закрытые GPU-платформы.
- Прототипирование продуктов на LLM: генерация текста, кода, чат-ассистенты, поиск по корпоративным базам, аналитика документов — без зависимости от внешних API.
- Обучение и дообучение моделей среднего размера: эксперименты с дообучением LLM до 70–120B параметров, кастомизация под доменные задачи.
Когда TT-QuietBox 2 вряд ли подойдёт:
- Если вам нужны только готовые облачные модели вроде GPT-4o или Claude 3.5 и нет собственной разработки — дешевле и проще остаться на API.
- Если бюджет ограничен несколькими тысячами долларов — $10 000 за одну станцию будет избыточно.
- Если важна максимальная производительность на ватт по сравнению с топовыми GPU — Tenstorrent пока не даёт прямых сравнений с флагманскими видеокартами.
О доступности в России Tenstorrent ничего не уточняет. Для заказа и поддержки, скорее всего, понадобится зарубежный юридический контур и, возможно, VPN для работы с документацией и репозиториями.
Место на рынке
TT-QuietBox 2 целится в нишу настольных ИИ-станций, где сейчас доминируют решения на базе GPU — от готовых рабочих станций на NVIDIA до кастомных сборок.
Главные отличия подхода Tenstorrent:
- Архитектура RISC-V и собственные ускорители Blackhole вместо классических GPU.
- Отказ от HBM в пользу GDDR6 и крупного пула on-chip SRAM.
- Полностью открытый программный стек, включая низкоуровневые компоненты.
По цифрам Tenstorrent называет 2654 TFLOPS в FP8 и поддержку моделей до 120B параметров, но не приводит прямых сравнений с конкретными GPU или системами конкурентов. Поэтому оценивать TT-QuietBox 2 нужно скорее как альтернативный путь к локальному ИИ: не про «быстрее всех», а про контроль над железом и софтом, отсутствие HBM и ориентацию на разработчиков, которым важен доступ к архитектуре RISC-V и низкоуровневой отладке.
Для рынка это ещё один сигнал: настольные станции для ИИ перестают быть экзотикой. Но TT-QuietBox 2 — всё ещё инструмент для тех, кто строит свои ИИ-продукты, а не просто подключается к чужому API.