Дата публикации
ai_products

Digital Optimus: Илон Маск показал ИИ, который управляет компьютером как сотрудник

Что появилось / что изменилось

Илон Маск представил Digital Optimus (внутреннее название Macrohard) — совместный проект xAI и Tesla. Это связка из двух частей:

  • Grok — «мозг» и навигатор, который понимает происходящее на экране и решает, что делать.
  • Digital Optimus — исполнитель, который управляет компьютером как человек: двигает мышь, нажимает клавиши, запускает действия.

Ключевые моменты из анонса:

  • Grok анализирует видео с экрана за последние 5 секунд в реальном времени.
  • Система учитывает действия клавиатуры и мыши и на их основе принимает решения.
  • Маск описывает Digital Optimus как «Систему 1» (инстинктивная часть разума), а Grok — как «Систему 2» (обдумывающая часть).
  • Проект работает на Tesla AI4 стоимостью около 650 долларов за вычислительный блок.
  • Более тяжёлые задачи Маск предлагает отправлять на GPU Nvidia в инфраструктуре xAI.
  • По словам Маска, сейчас это единственная интеллектуальная система ИИ, которая работает в реальном времени и способна эмулировать работу целых компаний.

Macrohard — намеренная шутка в сторону Microsoft: намёк на то, что Digital Optimus может брать на себя объём задач, который сегодня выполняют офисные команды.

Как это работает

Архитектура Digital Optimus строится вокруг двух уровней мышления:

  1. Digital Optimus (Система 1)

    • Получает потоковое видео с экрана компьютера.
    • В реальном времени отслеживает, что происходит в интерфейсе.
    • Выполняет низкоуровневые действия: клики, ввод текста, навигация по окнам.
    • Реагирует на события почти мгновенно, без сложных рассуждений.
  2. Grok (Система 2)

    • Анализирует последние 5 секунд экрана как контекст.
    • Интерпретирует, в каком приложении идёт работа и какая задача решается.
    • Формулирует план действий и передаёт его Digital Optimus.
    • Корректирует поведение по мере появления новой информации на экране.

С вычислительной стороны Маск предлагает гибридный подход:

  • Базовая логика и часть вычислений — на дешёвом Tesla AI4 (650 долларов за модуль).
  • Сложные ИИ-задачи — на кластерах Nvidia, которые использует xAI.

Идея в том, чтобы дешёвое железо обрабатывало постоянный поток действий, а дорогое GPU-время уходило только на тяжёлые рассуждения Grok.

Что это значит для вас

Digital Optimus — это не чат-бот, а цифровой исполнитель, который может работать в интерфейсе обычного компьютера. Потенциальные сценарии:

  • Рутинные офисные задачи: заполнение форм, перенос данных между системами, простая работа в CRM или ERP.
  • Поддержка операционных команд: мониторинг экранов, быстрый отклик на типовые события в интерфейсе.
  • Автоматизация «мышь + клавиатура» там, где нет API, но есть человеко-ориентированный интерфейс.

Чего ждать пользователю:

  • Это история не про «поговорить с ИИ», а про замену части ручной работы за компьютером.
  • Система особенно интересна компаниям, у которых много устаревших интерфейсов без нормальной интеграции.
  • Для частного пользователя ценность появится, когда Digital Optimus научится уверенно работать с популярными офисными приложениями и браузером.

Чего ждать не стоит:

  • Творческих задач уровня написания сценариев или сложной аналитики — это по-прежнему зона текстовых ИИ вроде Grok, GPT-5 или Claude 4.
  • Глубокой доменной экспертизы без обучения на ваших данных.
  • Мгновенного доступа: проект только анонсирован, о публичном запуске и географии работы Маск не говорил. На доступ из России могут влиять ограничения xAI и Tesla, а также возможная необходимость VPN.

Место на рынке

Digital Optimus занимает нишу между классическими ассистентами и роботизированной автоматизацией процессов (RPA):

  • В отличие от GPT-5 или Claude 4, Grok+Digital Optimus не ограничиваются текстом и API, а работают с «живым» экраном.
  • По словам Маска, система обрабатывает экран в реальном времени, опираясь на последние 5 секунд видео и действия пользователя. Подобных публичных заявлений у OpenAI, Google или Anthropic о готовых продуктах с таким уровнем «живой» автоматизации нет.
  • Стоимость Tesla AI4 — 650 долларов за модуль — показывает ориентацию на массовое развёртывание, но общая цена владения зависит от объёма использования Nvidia-GPU, о чём Маск пока не говорил.

Главное отличие подхода xAI и Tesla — ставка на сочетание собственного дешёвого железа (AI4) и более дорогих GPU Nvidia. Это может сделать Digital Optimus интересным для компаний, которые хотят автоматизировать рутину в больших масштабах и готовы строить инфраструктуру вокруг экосистемы Маска.