Отчет о мошенничестве с поддельными документами 2025 годаПодробнее

Надежное и точное распознавание текстов для ИИ-агентов

logo
logo
logo
logo
logo
logo
logo
logo
logo
logo
Надежное и точное распознавание текстов для ИИ-агентов
Надежное и точное распознавание текстов для ИИ-агентов
Оптимизировано для построения ИИ‑агентов на основе LLM
100+ языков Включая арабский, китайский, японский и корейский
State-of-the-art методы поиска текстов На изображениях документов
Классификация и выделение реквизитов Из 3000+ деловых документов РФ и ДУЛ всего мира
Печатные, рукописные и смешанные тексты Распознавание с возвратом всех альтернатив для NLP методов
1800 страниц в минуту Скорость распознавания на сервере без применения GPU
Распознавание без обработки Возвращает то, что на бумаге
Работает в реальных условиях Распознает сканы и фотографии в реальных условиях и низкого качества
Работает в контуре (on-premise) Автономно, без риска утечки данных и коммерческой тайны
  • Оптимизировано для построения ИИ‑агентов на основе LLM
    100+ языков
    Включая арабский, китайский, японский и корейский
    State-of-the-art методы поиска текстов
    На изображениях документов
  • Классификация и выделение реквизитов
    Из 3000+ деловых документов РФ и ДУЛ всего мира
    Печатные, рукописные и смешанные тексты
    Распознавание с возвратом всех альтернатив для NLP методов
    1800 страниц в минуту
    Скорость распознавания на сервере без применения GPU
  • Распознавание без обработки
    Возвращает то, что на бумаге
    Работает в реальных условиях
    Распознает сканы и фотографии низкого качества в реальных условиях
    Работает в контуре (on-premise)
    Автономно, без риска утечки данных и коммерческой тайны

Как работает распознавание для ИИ‑агентов

Надежное и точное распознавание текстов для создания ИИ-агентов на базе LLM‑моделей, где критически важна полнота, скорость и особенно достоверность данных. Система распознает печатный текст на 100+ языках, включая арабский, китайский, японский и корейский, кириллический, рукописный и смешанный тексты. Для результатов распознавания возвращает знакоместа, альтернативы и всю геометрию. ПО работает с фото и сканами низкого качества. Поддерживается поиск, выравнивание и нормализация документа, распознавание таблиц и многостраничных файлов, классификация документов и выделение реквизитов. Решение работает автономно в контуре заказчика, не требует GPU, обрабатывает до 1800 страниц в минуту на сервере.

Учредители - резиденты РФ Учредители — резиденты РФ
Собственная разработка Собственная разработка
Запись 9617 в реестре ПО Запись 9617 в реестре ПО
Поддержка российских ОС Поддержка российских ОС

Возможности распознавания

  • Распознавание сканов и фотографий низкого качества
  • Поиск, выравнивание и нормализация документа на фотографии
  • Распознавание документа А4 на смартфоне за 2-3 секунды
  • GreenOCR® — экологичный искусственный интеллект распознавания текста
  • Уникальные 4.6-битные нейросетевые модели для скоростного распознавания на CPU
  • Распознавание силами CPU, не требует ресурсов GPU и NPU
  • Высокоточное распознавание текста на фото и скане
  • Распознавание рукописных текстов, надписей и пометок вне зависимости от почерка
  • Новаторские малобитные и компактные нейросетевые модели
  • Распознавание печатной и рукописной кириллической письменности
  • Высокоточный OCR для всех языков, базирующихся на латинице
  • Распознавание арабского, японского, корейского и китайского языков
  • Распознавание иврита, греческого, грузинского и армянского
  • Распознавание многостраничных документов
  • Поиск и распознавание таблиц
  • Потоковое распознавание в контуре (on-premise) со скоростью более 100 тысяч страниц в час на сервере без GPU
  • Надежное распознавание рукописи и печатного текста без лингвистических галлюцинаций
  • AI модели обучены исключительно на синтетических данных
  • Возврат геометрии текстов и символов
  • Возврат альтернатив распознавания каждого символа

Какие документы
распознаются

ЕГРИП ЕГРЮЛ ИНН юр.лица Приказ о назначении генерального директора Устав компании Отчет о финансовых результатах Свидетельство ОГРН Свидетельство ОГРНИП ЕГРН Паспорт РФ (печатный и рукописный) Документы, удостоверяющие личность 210 стран мира (паспорта, ID-карты, водительские удостоверения и др.) 2-НДФЛ Акт Акт КС-2 Акт МХ-1 Акт МХ-3 Акт ОС-1 Акт ОС-15 Акт ОС-1а Акт ОС-4 Акт передачи прав (шаблон 1С) Акт сверки Банковский ордер Бух. баланс Инкассовое поручение Книга покупок Корректировачный счет-фактура Платежное поручения Платежное требование Платежный ордер Реестр сертификатов и деклараций (приложение к накладной) Сертификат самозанятого Справка кс-3 Справка о доходах по налогу на профессиональный доход Справка-расчет рублевых сумм документа в валюте Счет Счет-фактура (включая исправленный счет-фактуру) Товарно-транспортная накладная (ТТН) ТОРГ-12 ТОРГ-13 УКД Универсальный передаточный документ (УПД)

Возможности
интеграции

DocEngine engine = DocEngine.Create(<PATH_TO_CONFIGURATION_FILE>, true);
DocSessionSettings settings = engine.CreateSessionSettings();
settings.SetCurrentMode("primary_accounting");
settings.AddEnabledDocumentTypes("*");
DocSession session = engine.SpawnSession(settings, <PERSONALIZED_SIGNATURE>);
DocProcessingSettings proc_settings = session.CreateProcessingSettings();
Image image = Image.FromFile(<PATH_TO_IMAGE>);
session.ProcessImage(image, proc_settings);

DocResult result = session.GetCurrentResult();
Document document = result.DocumentsBegin().GetDocument();
for (DocTextFieldsIterator iterator = doc.TextFieldsBegin(); !iterator.Equals(doc.TextFieldsEnd()); iterator.Advance()) {
  String name = iterator.GetField().GetBaseFieldInfo().GetName();
  String value = iterator.GetField().GetOcrString().GetFirstString().GetCStr();
}
std::unique_ptr<se::doc::DocEngine> engine(se::doc::DocEngine::Create(<PATH_TO_CONFIGURATION_FILE>, true));
std::unique_ptr<se::doc::DocSessionSettings> settings(engine->CreateSessionSettings());
settings->SetCurrentMode("primary_accounting");
settings->AddEnabledDocumentTypes("*");
std::unique_ptr<se::doc::DocSession> session(engine->SpawnSession(*settings, <PERSONALIZED_SIGNATURE>));
std::unique_ptr<se::doc::DocProcessingSettings> proc_settings(session->CreateProcessingSettings());
std::unique_ptr<se::common::Image> image(se::common::Image::FromFile(<PATH_TO_IMAGE>));
session->ProcessImage(*image, proc_settings.get());

const se::doc::DocResult& result = session->GetCurrentResult();
const se::doc::Document& doc = result.DocumentsBegin().GetDocument();
for (auto iterator = doc.TextFieldsBegin(); iterator != doc.TextFieldsEnd(); ++iterator) {
  std::string name = iterator.GetFieldPtr()->GetBaseFieldInfo().GetName();
  std::string value = iterator.GetFieldPtr()->GetOcrString().GetFirstString().GetCStr();
}
DocEngine engine = DocEngine.Create(<PATH_TO_CONFIGURATION_FILE>, true);
DocSessionSettings settings = engine.CreateSessionSettings();
settings.SetCurrentMode("primary_accounting");
settings.AddEnabledDocumentTypes("*");
DocSession session = engine.SpawnSession(session_settings, <PERSONALIZED_SIGNATURE>);
DocProcessingSettings proc_settings = session.CreateProcessingSettings();
Image image = Image.FromFile(<PATH_TO_IMAGE>);
session.ProcessImage(image, proc_settings);

DocResult result = session.GetCurrentResult();
doc_it = recog_result.DocumentsBegin()
Document doc = recog_result.DocumentsBegin().GetDocument();
for (DocTextFieldsIterator iterator = doc.TextFieldsBegin(); !iterator.Equals(doc.TextFieldsEnd()); iterator.Advance()) {
  String name = iterator.GetField().GetBaseFieldInfo().GetName();
  String value = iterator.GetField().GetOcrString().GetFirstString().GetCStr());
}
engine = pydocengine.DocEngine.Create(<PATH_TO_CONFIGURATION_FILE>)
settings = engine.CreateSessionSettings()
settings.SetCurrentMode("primary_accounting")
settings.AddEnabledDocumentTypes("*")
session = engine.SpawnSession(settings, <PERSONALIZED_SIGNATURE>)
proc_settings = session.CreateProcessingSettings()
image = pydocengine.Image.FromFile(<PATH_TO_IMAGE>)
session.ProcessImage(image, proc_settings)

result = session.GetCurrentResult()
doc_it = recog_result.DocumentsBegin()
doc = recog_result.DocumentsBegin().GetDocument()
iterator = doc.TextFieldsBegin()
while(iterator != doc.TextFieldsEnd()):
  name = iterator.GetField().GetBaseFieldInfo().GetName()
  value = iterator.GetField().GetOcrString().GetFirstString().GetCStr()
  iterator.Advance()

Автовыбор документов из списка, отсеивание ненужных документов

Уверенность распознавания, координаты объектов, вырезание полей и документов

Возврат зоны принятия решения для проверок подлинности

Операционные системы
Android
iOS
MS Windows
Linux
ОС Аврора
ОС Эльбрус
РЕД ОС
Astra Linux
ОС Атликс
ОС Альт Линукс
Low-code интеграция, простой и понятный REST API
API на
C
C++
C#
Java
Python
PHP
Фреймворки:
React Native
Flutter
интеграция с 1C
Примеры использования на языках
C
C++
C#
Java
Python
PHP
Архитектуры процессоров
х86
x86_64
ARMv7-v8-v9 (AArch32 и AArch64)
MIPS (MIPS32 и MIPS64)
Elbrus
Попробуйте качество наших технологий

Попробуйте качество наших технологий

  • Скачайте мобильное демо-приложение, в котором все возможности собраны воедино
  • Можно на время отключить интернет, чтобы убедиться, что изображения и ваши данные не передаются
  • Извлекайте данные паспортов, удостоверений личности и других документов. Пробуйте распознавать оригиналы и копии при различных условиях съемки

Заказать продукт

Для заказа решений, получения подробной информации или триал-версий заполните приведенную форму, и мы обязательно с Вами свяжемся.






    Часто задаваемые вопросы

    Система подходит для автоматизации ввода данных в любые LLM и агентные модели ИИ, построенные на их основе. Решение может использоваться как источник достоверных данных для корпоративных AI-платформ, интеллектуальных помощников, RAG-систем, NLP-моделей, AI-агентов для документооборота, KYC/KYB-сценариев и других систем анализа и принятия решений, работающих на основе текстовой информации из документов. Решение обеспечивает высокоточный структурированный ввод без искажения исходных данных, что особенно важно для ИИ-агентов, принимающих решения на основе содержимого документов.
    Технология Smart Engines позволяет существенно повысить качество работы ИИ-агентов за счет высокоточного и достоверного извлечения данных. Система обеспечивает максимальное качество распознавания без галлюцинаций и рисков искажения исходной информации. На выходе решение формирует расширенный результат распознавания: текст, знакоместа, геометрию документа и альтернативы для NLP-обработки. Это позволяет значительно точнее анализировать документы с помощью ИИ-агентов, учитывать контекст расположения данных и минимизировать ошибки интерпретации при автоматическом принятии решений.
    Система Smart Engines распознает печатный, рукописный и смешанный текст любой сложности. Поддерживается обработка рукописных пометок, комментариев, анкет, заявлений, подписей и других текстовых элементов, заполненных от руки. Решение корректно работает даже с трудноразборчивым почерком, а также с текстом, написанным ручкой, карандашом или пером. Решение поддерживает распознавание смешанного текста в документах, где одновременно присутствуют печатные и рукописные фрагменты.
    Да. Система Smart Engines автоматически определяет тип документа на фотографиях и сканах и извлекает ключевые реквизиты из различных типов документации. Решение поддерживает обработку 80+ видов деловых документов РФ, а также 3000+ типов удостоверений личности всего мира. OCR распознает и классифицирует договоры, счета, акты, анкеты, заявления, бухгалтерские и кадровые документы и другие формы документации. Технология поддерживает потоковую обработку больших массивов документов, ускоряя ввод данных, проверку, маршрутизацию и автоматизацию бизнес-процессов без участия человека.
    Технология поддерживает распознавание текста более чем на 100 языках мира. Система эффективно работает не только с латиницей и кириллицей, но и со сложными системами письменности, включая арабскую вязь, китайские и японские иероглифы, корейское письмо и другие алфавиты. Поддерживается омнифонтовое распознавание независимо от гарнитуры, начертания и качества печати, что позволяет использовать решение в мультиязычных AI-сценариях.
    Да. Технология с высочайшей точностью распознает документы, снятые в реальных условиях, и работает с изображениями низкого качества. Система автоматически выполняет локализацию документа в кадре, выравнивание и нормализацию изображения. Искусственный интеллект устойчив к шумам, бликам, теням, размытию, сложному фону и артефактам сканирования. Это позволяет одинаково эффективно обрабатывать как фотографии с мобильных устройств, так и низкокачественные сканы документов, обеспечивая высокую точность извлечения данных.
    Система передает результаты распознавания в структурированном виде, подходящем для последующей обработки ИИ-агентами и NLP-системами. Вместе с извлеченным текстом решение возвращает знакоместа, геометрию документа и альтернативы. Такой уровень детализации позволяет применять технологию для ввода данных в существующие системы интеллектуального анализа документов и автоматического принятия решений, а также для построения мультиагентных моделей на базе AI.
    Решение Smart Engines обеспечивает сверхбыструю обработку документов — до 1800 страниц в минуту на одном сервере без использования GPU. Архитектура решения позволяет легко масштабировать систему для работы с большими объемами данных без усложнения ИТ-инфраструктуры и дополнительных затрат на специализированное оборудование. Высокая производительность системы делает решение эффективным инструментом для потоковой обработки документов, корпоративных AI-платформ и высоконагруженных систем, где критически важна скорость, полнота и достоверность данных.
    Система Smart Engines — мультиплатформенный программный продукт, который быстро встраивается в существующую ИТ-инфраструктуру заказчика без необходимости доработок. Для работы решения не требуется интернет-соединение и привлечение мощностей графических ускорителей (GPU). Это позволяет применять систему как на серверах, так и на рабочих станциях, мобильных устройствах и на веб-страницах.
    Да. Решение работает полностью автономно в инфраструктуре заказчика по модели on-premise и обеспечивает 100% локальную обработку документов. Во время распознавания изображения и извлеченные данные не передаются за пределы защищенного контура организации и не отправляются во внешние облачные сервисы. Это обеспечивает высокий уровень конфиденциальности и соответствие требованиям информационной безопасности, что особенно важно для банков, государственных организаций, промышленности и корпоративных заказчиков.