- Дата публикации
Слой корпоративного контекста: почему 1000 строк кода на Python оказались сложнее, чем кажется
Что появилось / что изменилось
Появился новый подход к созданию «слоя корпоративного контекста» — централизованной системы знаний для компании. Он позволяет ИИ отвечать на сложные внутренние вопросы. Ключевое изменение: осознание, что задача распадается на две принципиально разные — поиск информации и её синтез с учётом организационного контекста. Решения вроде Glean показывают, что для качественного поиска нужны сотни инженеров, контекстные графы, модели эмбеддингов под каждого клиента и калибровочные циклы. Но даже лучшие системы поиска не справляются с синтезом.
Как это работает
Система-пример из статьи строится на базе RAG (Retrieval-Augmented Generation). Под капотом — около 1000 строк кода на Python и репозиторий на GitHub. Для корректной работы требуется точно настроенная система поиска, которая различает внутренние и внешние названия продуктов, понимает семантику релизов (ранний доступ, общий доступ, региональные ограничения) и знает внутренние процессы компании. Например, в Abnormal Security для показа дорожной карты требуется подписание NDA. Glean использует комбинацию контекстных графов, trace learning, персональных моделей эмбеддингов и калибровочных циклов для улучшения поиска.
Что это значит для вас
Если ваша задача — быстро находить внутренние документы, вам подойдут специализированные поисковые системы. Glean, по мнению автора, лучшая в этом. Но если вам нужны ответы на сложные вопросы, требующие суждений и институциональной памяти, готового решения нет. Например, на вопрос «Когда данные клиента удаляются после оттока?» поисковик даст цитату из документа, но правильный ответ — «Не отвечай, перенаправь в отдел безопасности». Для таких задач потребуется собственная разработка, учитывающая политики эскалации, конфликты в источниках и скрытые риски. Glean и аналогичные продукты доступны глобально, но их внедрение требует глубокой интеграции.
Место на рынке
Glean позиционируется как лидер в корпоративном поиске. Его разработкой занимаются сотни инженеров, включая бывших специалистов по поисковой инфраструктуре Google. Система решает задачи, с которыми не справились Microsoft и Atlassian в своих продуктах. Ключевое отличие от гипотетического «слоя контекста» — Glean фокусируется на поиске документов, а не на синтезе организационных знаний. Прямых цифровых сравнений по скорости или цене с GPT-4 или Claude в материале нет. Рынок показывает, что создание универсального «мозга компании» — пока не решённая задача, и даже мощные поисковые движки — только часть решения.