Система Smart Engines извлекает данные из электронных документов полностью внутри ИТ-контура организации. Обработка выполняется локально – без передачи файлов, изображений и извлеченных реквизитов во внешние облачные сервисы. Это позволяет работать с персональными данными, финансовыми сведениями, документами сотрудников и клиентов в защищенной инфраструктуре заказчика и минимизирует риски утечек при обработке чувствительной информации.
Система Smart Engines обеспечивает единый механизм обработки документов независимо от их исходного происхождения и формата: сканов, фотографий, многостраничных PDF, XML-файлов и документов, изначально созданных в цифровом виде. Искусственный интеллект автоматически определяет тип документа, извлекает реквизиты и формирует структурированный результат для передачи в корпоративные системы. Это позволяет использовать одну технологию для обработки как бумажных, так и электронных документов, включая выгрузки из государственных сервисов.
Система Smart Engines извлекает данные напрямую из электронных документов – PDF, XML и других цифровых форматов – без необходимости переводить их обратно в бумажный или графический вид. Решение сохраняет структуру исходного документа, выделяет ключевые реквизиты и подготавливает результат для передачи в учетные, скоринговые, KYC- и ECM-системы.
Система Smart Engines автоматически распознает документы, подтверждающие доход, занятость и статус гражданина: справки о доходах, сведения из личного кабинета ФНС, документы из Госуслуг и СФР, а также другие электронные формы для банков, МФО, кадровых служб и государственных организаций. Искусственный интеллект извлекает ключевые реквизиты, проверяет структуру документа и подготавливает данные для дальнейшей обработки в учетных, скоринговых, кадровых и KYC-системах.
Решение поддерживает распознавание цифровых документов, используемых для подтверждения личности, статуса и прав на имущество: АДИ-РЕГ (электронный СНИЛС), эСТС, эПТС, эПСМ и других документов в электронном виде. Система извлекает персональные данные, идентификаторы, регистрационные номера, даты, сведения о документе и другие реквизиты, необходимые для автоматического ввода данных в корпоративные и государственные информационные системы.
Решение распознает документы, полученные из государственных и ведомственных цифровых сервисов: Госуслуг, личного кабинета ФНС, сервисов СФР, ЕГРН и других источников. Система извлекает реквизиты из справок, выписок, уведомлений, электронных форм и позволяет автоматически включать такие данные в бизнес-процессы без ручной проверки и перепечатки.
Антифрод-технология Smart Engines выявляет как полностью сгенерированные изображения, так и точечные изменения отдельных полей – фотографии, даты рождения, ФИО, номера документа, адреса регистрации и других данных. ИИ обнаруживает дипфейки, созданные с помощью наиболее популярных генеративных моделей – NanoBanana, ChatGPT, Grok, Qwen, Midjourney, Stable Diffusion, Flux и еще более чем 20 других.
Решение распознает документы с адаптивной версткой, где расположение реквизитов может изменяться в зависимости от устройства, версии сервиса, языка интерфейса или формата выгрузки. Искусственный интеллект находит ключевые поля не по жесткой координатной сетке, а по смысловой структуре документа, текстовым признакам и взаимному расположению элементов. Это обеспечивает стабильное извлечение данных из электронных документов, даже если их внешний вид отличается от шаблона.
Система Smart Engines распознает документы, предъявленные с экранов смартфонов, планшетов, ноутбуков и компьютеров. Искусственный интеллект автоматически определяет, что документ был снят с экрана, извлекает данные с учетом искажений, бликов, пикселизации и особенностей отображения на дисплее. Это позволяет обрабатывать документы в сценариях, где пользователь показывает электронный документ с другого устройства, и одновременно учитывать такой формат предъявления при антифрод-проверке.
Интеллектуальное распознавание документов, полученных через Госуслуги, ФНС, СФР, ЕГРН и другие цифровые сервисы. Технология одинаково эффективно обрабатывает как сканы и фотографии документов, так и документы, изначально созданные в электронном виде, без необходимости печати, сканирования и ручного ввода данных. Решение автоматически извлекает сведения из документов, подтверждающих доход и занятость, электронных удостоверений личности, АДИ-РЕГ, эСТС, эПТС и других цифровых документов. Система работает полностью внутри ИТ-контура организации, выявляет цифровые подделки и дипфейки, поддерживает распознавание документов с экранов устройств и сохраняет высокую точность даже при адаптивной верстке и динамическом изменении структуры документа.
IdEngine engine = IdEngine.Create((<PATH_TO_CONFIGURATION_FILE>, true);
IdSessionSettings settings = engine.CreateSessionSettings();
settings.SetCurrentMode("edoc_demo");
settings.AddEnabledDocumentTypes("*");
IdSession session = engine.SpawnSession(settings, <PERSONALIZED_SIGNATURE>);
Image image = Image.FromFile(<PATH_TO_IMAGE>);
IdResult result = session.Process(image);
String type = result.GetDocumentType();
for (IdTextFieldsMapIterator it = result.TextFieldsBegin(); !it.Equals(result.TextFieldsEnd()); it.Advance()) {
String name = field.GetName();
String value = field.GetValue().GetFirstString().GetCStr();
}
std::unique_ptr<se::id::IdEngine> engine(se::id::IdEngine::Create(<PATH_TO_CONFIGURATION_FILE>, true));
std::unique_ptr<se::id::IdSessionSettings> settings(engine->CreateSessionSettings());
settings->SetCurrentMode("edoc_demo");
settings->AddEnabledDocumentTypes("*");
std::unique_ptr<se::id::IdSession> session(engine->SpawnSession(*settings, <PERSONALIZED_SIGNATURE>));
std::unique_ptr<se::common::Image> image(se::common::Image::FromFile(<PATH_TO_IMAGE>));
const se::id::IdResult& result = session->Process(*image);
std::string type = result.GetDocumentType();
for (auto it = result.TextFieldsBegin(); it != result.TextFieldsEnd(); ++it) {
const se::id::IdTextField& field = it.GetValue();
std::string name = field.GetName();
std::string value = field.GetValue().GetFirstString().GetCStr();
}
IdEngine engine = IdEngine.Create(<PATH_TO_CONFIGURATION_FILE>);
IdSessionSettings settings = engine.CreateSessionSettings();
settings.SetCurrentMode("edoc_demo");
settings.AddEnabledDocumentTypes("*");
IdSession session = engine.SpawnSession(settings, <PERSONALIZED_SIGNATURE>);
Image image = Image.FromFile(<PATH_TO_IMAGE>);
IdResult result = session.Process(image);
String type = result.GetDocumentType();
for (IdTextFieldsMapIterator i = result.TextFieldsBegin(); !i.Equals(result.TextFieldsEnd()); i.Advance()) {
IdTextField field = i.GetValue();
String name = field.GetName();
String value = field.GetValue().GetFirstString().GetCStr();
}
engine = pyidengine.IdEngine.Create(<PATH_TO_CONFIGURATION_FILE>, True)
settings = engine.CreateSessionSettings()
settings.SetCurrentMode("edoc_demo")
settings.AddEnabledDocumentTypes("*")
session = engine.SpawnSession(settings, <PERSONALIZED_SIGNATURE>)
image = pyidengine.Image.FromFile(<PATH_TO_IMAGE>)
session.Process(image)
result = session.GetCurrentResult()
type = result.GetDocumentType()
iterator = result.TextFieldsBegin()
while(iterator != result.TextFieldsEnd()):
field = iterator.GetValue()
name = field.GetName()
value = field.GetValue()
iterator.Advance()
Автовыбор документов из списка, отсеивание ненужных документов
Уверенность распознавания, координаты объектов, вырезание полей и документов
Возврат зоны принятия решения для проверок подлинности