- Дата публикации
Digital Optimus: Илон Маск показал ИИ, который управляет компьютером как сотрудник
Что появилось / что изменилось
Илон Маск представил Digital Optimus (внутреннее название Macrohard) — совместный проект xAI и Tesla. Это связка из двух частей:
- Grok — «мозг» и навигатор, который понимает происходящее на экране и решает, что делать.
- Digital Optimus — исполнитель, который управляет компьютером как человек: двигает мышь, нажимает клавиши, запускает действия.
Ключевые моменты из анонса:
- Grok анализирует видео с экрана за последние 5 секунд в реальном времени.
- Система учитывает действия клавиатуры и мыши и на их основе принимает решения.
- Маск описывает Digital Optimus как «Систему 1» (инстинктивная часть разума), а Grok — как «Систему 2» (обдумывающая часть).
- Проект работает на Tesla AI4 стоимостью около 650 долларов за вычислительный блок.
- Более тяжёлые задачи Маск предлагает отправлять на GPU Nvidia в инфраструктуре xAI.
- По словам Маска, сейчас это единственная интеллектуальная система ИИ, которая работает в реальном времени и способна эмулировать работу целых компаний.
Macrohard — намеренная шутка в сторону Microsoft: намёк на то, что Digital Optimus может брать на себя объём задач, который сегодня выполняют офисные команды.
Как это работает
Архитектура Digital Optimus строится вокруг двух уровней мышления:
-
Digital Optimus (Система 1)
- Получает потоковое видео с экрана компьютера.
- В реальном времени отслеживает, что происходит в интерфейсе.
- Выполняет низкоуровневые действия: клики, ввод текста, навигация по окнам.
- Реагирует на события почти мгновенно, без сложных рассуждений.
-
Grok (Система 2)
- Анализирует последние 5 секунд экрана как контекст.
- Интерпретирует, в каком приложении идёт работа и какая задача решается.
- Формулирует план действий и передаёт его Digital Optimus.
- Корректирует поведение по мере появления новой информации на экране.
С вычислительной стороны Маск предлагает гибридный подход:
- Базовая логика и часть вычислений — на дешёвом Tesla AI4 (650 долларов за модуль).
- Сложные ИИ-задачи — на кластерах Nvidia, которые использует xAI.
Идея в том, чтобы дешёвое железо обрабатывало постоянный поток действий, а дорогое GPU-время уходило только на тяжёлые рассуждения Grok.
Что это значит для вас
Digital Optimus — это не чат-бот, а цифровой исполнитель, который может работать в интерфейсе обычного компьютера. Потенциальные сценарии:
- Рутинные офисные задачи: заполнение форм, перенос данных между системами, простая работа в CRM или ERP.
- Поддержка операционных команд: мониторинг экранов, быстрый отклик на типовые события в интерфейсе.
- Автоматизация «мышь + клавиатура» там, где нет API, но есть человеко-ориентированный интерфейс.
Чего ждать пользователю:
- Это история не про «поговорить с ИИ», а про замену части ручной работы за компьютером.
- Система особенно интересна компаниям, у которых много устаревших интерфейсов без нормальной интеграции.
- Для частного пользователя ценность появится, когда Digital Optimus научится уверенно работать с популярными офисными приложениями и браузером.
Чего ждать не стоит:
- Творческих задач уровня написания сценариев или сложной аналитики — это по-прежнему зона текстовых ИИ вроде Grok, GPT-5 или Claude 4.
- Глубокой доменной экспертизы без обучения на ваших данных.
- Мгновенного доступа: проект только анонсирован, о публичном запуске и географии работы Маск не говорил. На доступ из России могут влиять ограничения xAI и Tesla, а также возможная необходимость VPN.
Место на рынке
Digital Optimus занимает нишу между классическими ассистентами и роботизированной автоматизацией процессов (RPA):
- В отличие от GPT-5 или Claude 4, Grok+Digital Optimus не ограничиваются текстом и API, а работают с «живым» экраном.
- По словам Маска, система обрабатывает экран в реальном времени, опираясь на последние 5 секунд видео и действия пользователя. Подобных публичных заявлений у OpenAI, Google или Anthropic о готовых продуктах с таким уровнем «живой» автоматизации нет.
- Стоимость Tesla AI4 — 650 долларов за модуль — показывает ориентацию на массовое развёртывание, но общая цена владения зависит от объёма использования Nvidia-GPU, о чём Маск пока не говорил.
Главное отличие подхода xAI и Tesla — ставка на сочетание собственного дешёвого железа (AI4) и более дорогих GPU Nvidia. Это может сделать Digital Optimus интересным для компаний, которые хотят автоматизировать рутину в больших масштабах и готовы строить инфраструктуру вокруг экосистемы Маска.