Дата публикации
ai_products

GigaChat сдал экзамен уровня магистратуры по математике и компьютерным наукам

Что появилось / что изменилось

GigaChat от Сбера прошёл очную аттестацию в Сколтехе и показал результат на уровне выпускника магистратуры по математике и компьютерным наукам.

Ключевые факты:

  • Средний процент правильных ответов — 76,9%.
  • На очном экзамене с участием экспертов с учёными степенями GigaChat набрал 7 из 10 баллов.
  • Это соответствует оценке «хорошо» (4) по традиционной шкале.
  • Экзамен покрывал 9 тематических блоков, среди них:
    • алгоритмы;
    • базы данных;
    • кибербезопасность;
    • искусственный интеллект;
    • другие разделы математики и компьютерных наук.
  • Проверяли не только теорию, но и умение решать прикладные задачи.

Ранее GigaChat уже проходил профильные экзамены в российских вузах:

  • ЕГЭ по обществознанию;
  • тесты по медицине, финансам, экономике, музыковедению и другим дисциплинам.

Теперь у Сбера есть формальное подтверждение уровня GigaChat именно в инженерно-техническом треке.

Как это работает

Сбер использовал GigaChat как полноценного «виртуального студента» на экзамене в Сколтехе.

Эксперты с академическими степенями подготовили и провели очную аттестацию. Формат близок к реальному экзамену для магистров:

  • формулировки задач и вопросов — академические, а не «чат-ботные»;
  • есть теоретический блок: определения, доказательства, сравнение подходов;
  • есть практический блок: прикладные задачи по алгоритмам, базам данных, кибербезопасности и ИИ.

GigaChat генерировал ответы на эти задания, а преподаватели оценивали их по стандартной шкале, как работы живых студентов. Итоговая оценка складывалась из:

  • процента правильных ответов (76,9%);
  • экспертной оценки качества решений по десятибалльной шкале (7/10, «хорошо»).

По сути, Сколтех проверил не только «знание теории из интернета», но и способность GigaChat выдержать формат структурированного экзамена по девяти академическим темам.

Что это значит для вас

Если вы работаете или учитесь в ИТ, GigaChat можно использовать как помощника уровня «сильный магистрант по CS», а не просто чат для общих вопросов.

Где это полезно:

  • Учёба и подготовка к экзаменам

    • разбор теории по алгоритмам, базам данных, ИИ;
    • объяснение сложных тем простым языком;
    • генерация тренировочных вопросов и задач.
  • Работа разработчика и инженера

    • помощь в выборе алгоритмического подхода;
    • структурирование архитектурных решений на уровне «как объяснить на защите диплома»;
    • черновики документации и технических обоснований.
  • Кибербезопасность и ИИ

    • разбор базовых концепций и терминов;
    • помощь в подготовке презентаций и отчётов по безопасности и ML.

Где полагаться на GigaChat не стоит:

  • как на единственный источник истины при критичных инженерных решениях;
  • для задач, где важна стопроцентная корректность доказательств или формальных выводов без проверки человеком;
  • при подготовке к экзаменам «под копирку» — ответы всё равно нужно перепроверять и адаптировать.

Логика простая: относитесь к GigaChat как к толковому напарнику-магистранту. Он хорошо ориентируется в теории и задачах, но ответственность за итоговое решение остаётся за вами.

Место на рынке

Сбер позиционирует GigaChat как крупную русскоязычную нейросеть общего назначения. Экзамен в Сколтехе добавляет к этому конкретное измеримое утверждение: по математике и компьютерным наукам GigaChat работает на уровне выпускника магистратуры.

На фоне зарубежных систем вроде GPT-5 или Claude 4 у GigaChat есть несколько очевидных акцентов:

  • сильная русскоязычная специализация и ориентация на российскую академическую программу;
  • интеграция в экосистему Сбера и российских вузов;
  • серия формальных экзаменов: от ЕГЭ по обществознанию до профильных тестов по медицине, финансам, экономике и музыковедению.

Численных сравнений с другими ИИ по тем же экзаменам нет, но сам факт очной аттестации в Сколтехе с результатом 76,9% и оценкой «хорошо» даёт понятную планку: это инструмент, который уже можно использовать в серьёзных образовательных и инженерных задачах, но не без человеческого контроля и экспертизы.


Читайте также

GigaChat сдал экзамен уровня магистратуры по математике и компьютерным наукам — VogueTech | VogueTech