Continuum
Отвечает на режимы сбоя 1 + 2 — деградация и отсутствие видимости.
Самообучающиеся агенты, с аварийным стопом.
Базовый агент, который со временем становится лучше в вашей работе — и никогда не меняет себя, не пройдя установленные вами правила.
На главной странице мы назвали три причины, по которым корпоративный ИИ глохнет. Continuum отвечает на первые две: модель, которая продолжает учиться в работе, и система, где каждое изменение проходит шлюз и фиксируется.
Проблема деградации
Модель, обученная однажды, стареет немедленно.
А привычное решение — периодическое переобучение — медленное, рискованное и тихо пропускается.
Ответом отрасли на деградацию были более крупные модели и редкое переобучение. В регулируемой деятельности переобучение — проект, который никто не хочет запускать, поэтому он не происходит, а работа идёт дальше. Устойчивый ответ — это система, которая учится на реальной работе внутри ограждений, поддающихся аудиту, и которая не может изменить себя так, как вы не одобряли.
Совместное обучение
Модель улучшается в работе, управляемая по своей конструкции.
Это не анимация обучения — настоящая сеть учится здесь и сейчас. Она выполняет прямые проходы, оценивает потери и обновляет свои веса методом обратного распространения. Смотрите, как граница решения становится чётче.
Настоящий MLP [2·8·8·3], tanh + softmax, обучается вживую методом backprop + SGD на трёхклассовой спирали. Каждое значение вычисляется в вашем браузере — откройте консоль.
Как это работает
Действие, предложение, контроль, журнал, каждый шаг виден.
Проверьте сами
Попробуйте провести изменение через шлюз.
Выберите предлагаемую самоправку. Шлюз принимает решение по установленным вами правилам — и фиксирует его.
Предлагаемое изменение в собственном регламенте агента:
Защищённый от подмены журнал
Это архитектура и шлюз. Показатели живого со-обучения остаются в дорожной карте до подтверждения.
Что вы получаете
Возможности, а не список функций.
Подписанный список разрешённого
Рассматриваются только санкционированные виды изменений.
Порог возможностей
Система не может опуститься ниже безопасного базового уровня.
Согласование двух человек
Изменения высокого влияния требуют второго человека.
Аварийный стоп + цепочка аудита
Остановите мгновенно; докажите, что было сделано.
Что мы заявляем, а что нет
Управление построено, кривая обучения поэтапна.
Управляемая обвязка, аварийный стоп, список разрешённого, порог возможностей и защищённый от подмены аудит построены и тестируемы уже сейчас. Показатели живого со-обучения находятся в дорожной карте и помечены как таковые до подтверждения. Для организации, ставящей на нас критическую операцию, эта граница — суть, а не мелкий шрифт.
Уже работает
- Управляемая обвязка + цепочка аудита
- Аварийный стоп, список разрешённого, порог возможностей, согласование
- SaaS + суверенный хостинг
В разработке
- Консоль оператора (наблюдение и контроль запуска)
- Управляемые пилотные развёртывания
В дорожной карте
- Подтверждённые результаты живого со-обучения
- Опубликованные эталонные показатели
Развёртывание
Работает там, где живут ваши данные, на ваших условиях.
SaaS, когда нужна скорость; суверенно и локально (on-prem), когда данные не могут уходить. Для суверенных развёртываний система дозванивается к нам — нам никогда не нужен путь внутрь. Она может работать полностью изолированно, вообще без обратной связи наружу.
Начать