Отчет о мошенничестве с поддельными документами 2025 годаПодробнее

Искусственный интеллект для распознавания в СЭД и ECM

logo
logo
logo
logo
logo
logo
logo
logo
logo
logo
Дистанционное обслуживание ЮЛ и ИП без бумажной рутины
Дистанционное обслуживание ЮЛ и ИП без бумажной рутины
Извлечение реквизитов, классификация И подготовка документов к регистрации в системе
Уникальные Хаф-сети Для выравнивания и разглаживания изображений документов
Без ручной обработки автоматический ввод изображений документов в СЭД/ECM
State-of-the-art бинаризация изображений корпоративных документов
Автоматический ввод входящей корреспонденции для канцелярии
Высокая производительность Для обработки больших массивов архивных документов
Универсальный инструмент Работа со сканами, фотографиями и многостраничными PDF
Распознавание бумажных архивов С экспортом в PDF с текстовым слоем
Работа полностью в контуре заказчика без передачи данных во внешние сервисы
  • Извлечение реквизитов, классификация
    И подготовка документов к регистрации в системе
    Уникальные 
Хаф-сети
    Для выравнивания и разглаживания изображений документов
    Без ручной обработки
    автоматический ввод изображений документов в СЭД/ECM
  • State-of-the-art бинаризация изображений
    корпоративных документов
    Автоматический ввод входящей корреспонденции
    для канцелярии
    Высокая производительность
    Для обработки больших массивов архивных документов
  • Универсальный инструмент
    Работа со сканами, фотографиями и многостраничными PDF
    Распознавание бумажных архивов
    С экспортом в PDF с текстовым слоем
    Работа полностью в контуре заказчика
    без передачи данных во внешние сервисы

Как работает распознавание для СЭД и ECM

Программное обеспечение на базе искусственного интеллекта для распознавания в СЭД и ECM позволяет автоматически вводить документы в цифровой контур организации без ручной обработки. Решение классифицирует бухгалтерские и корпоративные документы, извлекает реквизиты, подготавливает материалы к регистрации в системе, распознает входящую корреспонденцию с экспортом в PDF с текстовым слоем. Система работает со сканами, фотографиями и многостраничными PDF, включая изображения низкого качества. Используются современные методы бинаризации, выравнивания и нормализации документов, а также компактные 4.6-битные нейросети для быстрого распознавания на CPU без GPU. ПО работает полностью в контуре заказчика, обрабатывая до 1800 страниц в минуту на сервере.

Учредители - резиденты РФ Учредители — резиденты РФ
Собственная разработка Собственная разработка
Запись 9617 в реестре ПО Запись 9617 в реестре ПО
Поддержка российских ОС Поддержка российских ОС

Возможности распознавания

  • Автоматическая классификация бухгалтерских и корпоративных документов перед загрузкой в СЭД и ECM
  • Извлечение реквизитов для заполнения регистрационных карточек
  • Подготовка документов к регистрации в системе без ручного ввода
  • Обработка сканов, фотографий и многостраничных PDF-документов
  • Потоковое распознавание больших массивов документов и архивов
  • Распознавание сканов и фотографий низкого качества
  • Поиск, выравнивание и нормализация документа на фотографии
  • Распознавание документа А4 на смартфоне за 2-3 секунды
  • GreenOCR® — экологичный искусственный интеллект распознавания текста
  • Уникальные 4.6 битные нейросетевые модели для скоростного распознавания на CPU
  • Распознавание силами CPU, не требует ресурсов GPU и NPU
  • Высокоточное распознавание текста на фото и скане
  • Полнотекстовое распознавание бумажных архивов с экспортом в PDF с текстовым слоем
  • State-of-the-art бинаризация изображений корпоративных документов
  • Выравнивание, разглаживание и нормализация изображений документов
  • Поиск границ документа на фото и автоматическая коррекция перспективы
  • Высокоточное распознавание печатного текста на документах различного качества
  • Распознавание таблиц, штампов, печатей, пометок и служебных отметок
  • Распознавание полностью рукописных документов, смешанных текстов и пометок
  • Работа полностью в контуре заказчика без передачи данных во внешние сервисы
  • Высокая производительность обработки архивных и текущих потоков документов на CPU

Какие документы
распознаются

Универсальный передаточный документ (УПД) Товарно-транспортная накладная (ТТН) Счет-фактура (включая исправленный счет-фактуру) Корректировачный счет-фактура ТОРГ-12 УКД ТОРГ-13 2-НДФЛ Платежное поручения Платежное требование Платежный ордер Банковский ордер Инкассовое поручение ЕГРИП ЕГРЮЛ Сертификат самозанятого Бух. баланс ИНН юр.лица Акт передачи прав (шаблон 1С) Счет Акт Акт сверки Справка кс-3 Акт КС-2 Акт МХ-1 Акт МХ-3 Акт ОС-1 Акт ОС-1а Акт ОС-4 Акт ОС-15 Свидетельство ОГРН Свидетельство ОГРНИП Справка-расчет рублевых сумм документа в валюте Книга покупок Справка о доходах по налогу на профессиональный доход Реестр сертификатов и деклараций (приложение к накладной) Отчет о финансовых результатах Устав компании Приказ о назначении генерального директора ЕГРН Транспортная накладная (от 2021 года) Приказ (распоряжение) о приеме работника на работу (Форма Т-1) Личная карточка работника (Форма Т-2)

Возможности
интеграции

DocEngine engine = DocEngine.Create(<PATH_TO_CONFIGURATION_FILE>, true);
DocSessionSettings settings = engine.CreateSessionSettings();
settings.SetCurrentMode("primary_accounting");
settings.AddEnabledDocumentTypes("*");
DocSession session = engine.SpawnSession(settings, <PERSONALIZED_SIGNATURE>);
DocProcessingSettings proc_settings = session.CreateProcessingSettings();
Image image = Image.FromFile(<PATH_TO_IMAGE>);
session.ProcessImage(image, proc_settings);

DocResult result = session.GetCurrentResult();
Document document = result.DocumentsBegin().GetDocument();
for (DocTextFieldsIterator iterator = doc.TextFieldsBegin(); !iterator.Equals(doc.TextFieldsEnd()); iterator.Advance()) {
  String name = iterator.GetField().GetBaseFieldInfo().GetName();
  String value = iterator.GetField().GetOcrString().GetFirstString().GetCStr();
}
std::unique_ptr<se::doc::DocEngine> engine(se::doc::DocEngine::Create(<PATH_TO_CONFIGURATION_FILE>, true));
std::unique_ptr<se::doc::DocSessionSettings> settings(engine->CreateSessionSettings());
settings->SetCurrentMode("primary_accounting");
settings->AddEnabledDocumentTypes("*");
std::unique_ptr<se::doc::DocSession> session(engine->SpawnSession(*settings, <PERSONALIZED_SIGNATURE>));
std::unique_ptr<se::doc::DocProcessingSettings> proc_settings(session->CreateProcessingSettings());
std::unique_ptr<se::common::Image> image(se::common::Image::FromFile(<PATH_TO_IMAGE>));
session->ProcessImage(*image, proc_settings.get());

const se::doc::DocResult& result = session->GetCurrentResult();
const se::doc::Document& doc = result.DocumentsBegin().GetDocument();
for (auto iterator = doc.TextFieldsBegin(); iterator != doc.TextFieldsEnd(); ++iterator) {
  std::string name = iterator.GetFieldPtr()->GetBaseFieldInfo().GetName();
  std::string value = iterator.GetFieldPtr()->GetOcrString().GetFirstString().GetCStr();
}
DocEngine engine = DocEngine.Create(<PATH_TO_CONFIGURATION_FILE>, true);
DocSessionSettings settings = engine.CreateSessionSettings();
settings.SetCurrentMode("primary_accounting");
settings.AddEnabledDocumentTypes("*");
DocSession session = engine.SpawnSession(session_settings, <PERSONALIZED_SIGNATURE>);
DocProcessingSettings proc_settings = session.CreateProcessingSettings();
Image image = Image.FromFile(<PATH_TO_IMAGE>);
session.ProcessImage(image, proc_settings);

DocResult result = session.GetCurrentResult();
doc_it = recog_result.DocumentsBegin()
Document doc = recog_result.DocumentsBegin().GetDocument();
for (DocTextFieldsIterator iterator = doc.TextFieldsBegin(); !iterator.Equals(doc.TextFieldsEnd()); iterator.Advance()) {
  String name = iterator.GetField().GetBaseFieldInfo().GetName();
  String value = iterator.GetField().GetOcrString().GetFirstString().GetCStr());
}
engine = pydocengine.DocEngine.Create(<PATH_TO_CONFIGURATION_FILE>)
settings = engine.CreateSessionSettings()
settings.SetCurrentMode("primary_accounting")
settings.AddEnabledDocumentTypes("*")
session = engine.SpawnSession(settings, <PERSONALIZED_SIGNATURE>)
proc_settings = session.CreateProcessingSettings()
image = pydocengine.Image.FromFile(<PATH_TO_IMAGE>)
session.ProcessImage(image, proc_settings)

result = session.GetCurrentResult()
doc_it = recog_result.DocumentsBegin()
doc = recog_result.DocumentsBegin().GetDocument()
iterator = doc.TextFieldsBegin()
while(iterator != doc.TextFieldsEnd()):
  name = iterator.GetField().GetBaseFieldInfo().GetName()
  value = iterator.GetField().GetOcrString().GetFirstString().GetCStr()
  iterator.Advance()

Автовыбор документов из списка, отсеивание ненужных документов

Уверенность распознавания, координаты объектов, вырезание полей и документов

Возврат зоны принятия решения для проверок подлинности

Операционные системы
Android
iOS
MS Windows
Linux
ОС Аврора
ОС Эльбрус
РЕД ОС
Astra Linux
ОС Атликс
ОС Альт Линукс
Low-code интеграция, простой и понятный REST API
API на
C
C++
C#
Java
Python
PHP
Фреймворки:
React Native
Flutter
интеграция с 1C
Примеры использования на языках
C
C++
C#
Java
Python
PHP
Архитектуры процессоров
х86
x86_64
ARMv7-v8-v9 (AArch32 и AArch64)
MIPS (MIPS32 и MIPS64)
Elbrus
Попробуйте качество наших технологий

Попробуйте качество наших технологий

  • Скачайте мобильное демо-приложение, в котором все возможности собраны воедино
  • Можно на время отключить интернет, чтобы убедиться, что изображения и ваши данные не передаются
  • Извлекайте данные паспортов, удостоверений личности и других документов. Пробуйте распознавать оригиналы и копии при различных условиях съемки.

Заказать продукт

Для заказа решений, получения подробной информации или триал-версий заполните приведенную форму, и мы обязательно с Вами свяжемся.






    Часто задаваемые вопросы

    Система позволяет автоматически вводить данные из документов в цифровой контур организации без ручной обработки. Решение классифицирует бухгалтерские, кадровые и корпоративные документы, извлекает реквизиты и возвращает структурированные данные для регистрации в СЭД/ECM. Это помогает ускорить обработку входящего потока документов, избежать ошибок ручного ввода и повысить качество данных в корпоративных ИС.
    Система поддерживает все основные форматы файлов и изображений: JPEG (JPG), PNG, TIFF, PDF, а также сканы и фотографии архивных документов. Решение автоматически распознает все данные из одностраничных и многостраничных документов. Искусственный интеллект автоматически извлекает текст и реквизиты независимо от формата файла и качества изображения.
    Да. Технология Smart Engines предназначена для высокоточной потоковой оцифровки архивов и бумажных фондов в компаниях. Система выполняет полнотекстовое распознавание архивных документов с экспортом в PDF с текстовым слоем, делая возможным поиск по словам и ключевым фразам и быстрый доступ из ECM-систем. Решение помогает значительно ускорить цифровизацию архивов и сократить затраты на перенос документов в цифровой формат.
    Да. Система автоматически распознает входящую корреспонденцию любого типа: письма, заявления, обращения, сопроводительные документы и внутренние служебные материалы. Искусственный интеллект извлекает реквизиты отправителя, дату, регистрационные номера, содержимое документов и другую информацию для последующей регистрации в СЭД. Это позволяет ускорить документооборот и минимизировать ошибки при обработке входящих писем.
    Технология Smart Engines обрабатывает до 1800 страниц в минуту на одном сервере без GPU и масштабируется под любые корпоративные нагрузки. Применение сверхкомпактных 4.6-битных нейросетей позволяет минимизировать требования к инфраструктуре и сократить затраты на внедрение и эксплуатацию системы в компаниях.
    Да. Система использует методы бинаризации изображений документов, а также интеллектуальные алгоритмы выравнивания, разглаживания и нормализации. Искусственный интеллект автоматически устраняет шумы, артефакты сканирования, дефекты печати, а также перекосы и искажения, обеспечивая высокое качество распознавания даже старых и частично поврежденных документов.
    Да. Технология автоматически выполняет поиск границ и коррекцию проективных искажений документа на фотографиях. Алгоритмы ИИ автоматически устраняют артефакты, возникающие при мобильной съемке, и обеспечивают высокоточное извлечение данных из документов, сфотографированных в условиях реальной жизни.
    Решение обеспечивает высокоточное распознавание печатного и рукописного текста из документов с качеством до 99,9%. Система надежно работает со сканами и фотографиями с шумами, бликами, тенями, размытием и дефектами печати. Алгоритмы искусственного интеллекта обеспечивают автоматическое извлечение данных даже из документов на изображениях низкого качества.
    Да. Искусственный интеллект распознает таблицы, штампы, печати, служебные отметки, рукописные пометки и полностью рукописные документы. Система возвращает результаты распознавания в структурированном виде для быстрой интеграции в СЭД и ECM. Решение поддерживает обработку печатных, рукописных и смешанных текстов, где одновременно присутствуют печатные и рукописные фрагменты.
    Да. Решение распознает документы полностью в защищенном контуре заказчика без передачи изображений и данных на внешние серверы. Все документы и извлеченные данные обрабатываются локально внутри инфраструктуры организации без отправки в облачные сервисы. Это обеспечивает высокий уровень безопасности данных и полное соответствие требованиям по защите персональных данных и коммерческой тайны.