Российская компания Smart Engines анонсировала интеграцию ИИ-агентов в свою систему распознавания документов Smart Document Engine. По заявлению разработчика, эти агенты способны автономно создавать шаблоны для нестандартных документов — от анкет до сложных договоров — сокращая время настройки с часов или дней до нескольких секунд. Это позиционируется как решение для банков, страховых компаний и госучреждений, ежедневно обрабатывающих огромные массивы разноформатных документов.
Идея автоматизации шаблонизации документов не нова. Мировые лидеры вроде ABBYY или Kofax давно предлагают инструменты для обработки структурированных данных, но их решения либо требуют облачной инфраструктуры, либо не адаптированы под российские реалии, включая локальные требования к хранению персональных данных (не говоря уже о необходимости их импортозамещения). Smart Engines делает ставку на полностью автономную работу без GPU и внешних серверов, что теоретически исключает риски утечек . Однако вопрос в том, насколько уникален этот подход. Например, NTT DATA уже внедряет аналогичные Agentic AI-решения для банковского сектора, правда, с упором на облачные платформы.
«Сегодня весь мир работает над созданием ИИ-агентов, способных выполнять задачи и принимать решения в автономном режиме без участия человека. Однако между идеей и ее реализацией – огромная пропасть. Создать простого ИИ-агента достаточно несложно. Но все меняется, если мы говорим о реальных требованиях бизнеса к системам ИИ в части их применения в критически важных процессах. Это особенно важно, когда речь идет о распознавании документов с конфиденциальной информации или персональными данными. Разработать высокоточных ИИ-агентов, которые способны работать автономно, on-premise, без доступа к интернету и передачи данных третьим лицам, а также в условиях ограниченных вычислительных ресурсов, – это совершенно нетривиальная задача, с которой наши специалисты успешно справились», – говорит генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.
Главный козырь Smart Engines — локальность и прозрачность: агенты работают на локальной инфраструктуре (on-premise), а пользователь может отслеживать каждый этап обработки. Это критично для отраслей с жесткими требованиями к конфиденциальности. Кроме того, система поддерживает даже сложные элементы вроде рукописных пометок и таблиц, что выделяет ее на фоне традиционных OCR-решений.
Впрочем, важно понимать, что заявленная скорость в 15 страниц в секунду достигается только на серверах, тогда как производительность на мобильных устройствах ниже: 1 секунда на документ.
Комментируя новинку, CEO Smart Engines Владимир Арлазаров подчеркивает, что создание автономных агентов для критически важных процессов — задача, которую мало кто решает в России. Это справедливо: большинство локальных игроков сосредоточены на облачных OCR-сервисах, тогда как Smart Engines предлагает on-premise-решение. С другой стороны, успех этой инициативы будет зависеть от готовности рынка к переходу на полностью автоматические процессы. Для многих задач — особенно с предсказуемыми формами документов — традиционные rule-based-системы остаются более надежными и менее ресурсозатратными, чем ИИ.
Так что внедрение ИИ-агентов Smart Engines — логичный шаг в эволюции распознавания документов, но не революция. Их главная ценность — в адаптации под специфику российского рынка с его регуляторными ограничениями. Однако говорить о массовом переходе на такие решения пока рано: слишком многое зависит от конкретных сценариев использования и готовности инфраструктуры заказчика.