Надежное и точное распознавание текстов для ИИ-агентов

Реестровая запись №9617

Надежное и точное распознавание текстов для ИИ-агентов

Заказать продукт

Оптимизировано для построения ИИ‑агентов на основе LLM

100+ языков Включая арабский, китайский, японский и корейский

State-of-the-art методы поиска текстов На изображениях документов

Классификация и выделение реквизитов Из 3000+ деловых документов РФ и ДУЛ всего мира

Печатные, рукописные и смешанные тексты Распознавание с возвратом всех альтернатив для NLP методов

1800 страниц в минуту Скорость распознавания на сервере без применения GPU

Распознавание без обработки Возвращает то, что на бумаге

Работает в реальных условиях Распознает сканы и фотографии в реальных условиях и низкого качества

Работает в контуре (on-premise) Автономно, без риска утечки данных и коммерческой тайны

Оптимизировано для построения ИИ‑агентов на основе LLM

100+ языков
Включая арабский, китайский, японский и корейский

State-of-the-art методы поиска текстов
На изображениях документов
Классификация и выделение реквизитов
Из 3000+ деловых документов РФ и ДУЛ всего мира

Печатные, рукописные и смешанные тексты
Распознавание с возвратом всех альтернатив для NLP методов

1800 страниц в минуту
Скорость распознавания на сервере без применения GPU
Распознавание без обработки
Возвращает то, что на бумаге

Работает в реальных условиях
Распознает сканы и фотографии низкого качества в реальных условиях

Работает в контуре (on-premise)
Автономно, без риска утечки данных и коммерческой тайны

Возможности распознавания

Распознавание сканов и фотографий низкого качества
Поиск, выравнивание и нормализация документа на фотографии
Распознавание документа А4 на смартфоне за 2-3 секунды
GreenOCR^® — экологичный искусственный интеллект распознавания текста
Уникальные 4.6-битные нейросетевые модели для скоростного распознавания на CPU
Распознавание силами CPU, не требует ресурсов GPU и NPU
Высокоточное распознавание текста на фото и скане

Распознавание рукописных текстов, надписей и пометок вне зависимости от почерка
Новаторские малобитные и компактные нейросетевые модели
Распознавание печатной и рукописной кириллической письменности
Высокоточный OCR для всех языков, базирующихся на латинице
Распознавание арабского, японского, корейского и китайского языков
Распознавание иврита, греческого, грузинского и армянского
Распознавание многостраничных документов

Поиск и распознавание таблиц
Потоковое распознавание в контуре (on-premise) со скоростью более 100 тысяч страниц в час на сервере без GPU
Надежное распознавание рукописи и печатного текста без лингвистических галлюцинаций
AI модели обучены исключительно на синтетических данных
Возврат геометрии текстов и символов
Возврат альтернатив распознавания каждого символа
Автоматическое определение типа документа

Заказать продукт

Возможности
интеграции

DocEngine engine = DocEngine.Create(<PATH_TO_CONFIGURATION_FILE>, true);
DocSessionSettings settings = engine.CreateSessionSettings();
settings.SetCurrentMode("primary_accounting");
settings.AddEnabledDocumentTypes("*");
DocSession session = engine.SpawnSession(settings, <PERSONALIZED_SIGNATURE>);
DocProcessingSettings proc_settings = session.CreateProcessingSettings();
Image image = Image.FromFile(<PATH_TO_IMAGE>);
session.ProcessImage(image, proc_settings);

DocResult result = session.GetCurrentResult();
Document document = result.DocumentsBegin().GetDocument();
for (DocTextFieldsIterator iterator = doc.TextFieldsBegin(); !iterator.Equals(doc.TextFieldsEnd()); iterator.Advance()) {
  String name = iterator.GetField().GetBaseFieldInfo().GetName();
  String value = iterator.GetField().GetOcrString().GetFirstString().GetCStr();
}

std::unique_ptr<se::doc::DocEngine> engine(se::doc::DocEngine::Create(<PATH_TO_CONFIGURATION_FILE>, true));
std::unique_ptr<se::doc::DocSessionSettings> settings(engine->CreateSessionSettings());
settings->SetCurrentMode("primary_accounting");
settings->AddEnabledDocumentTypes("*");
std::unique_ptr<se::doc::DocSession> session(engine->SpawnSession(*settings, <PERSONALIZED_SIGNATURE>));
std::unique_ptr<se::doc::DocProcessingSettings> proc_settings(session->CreateProcessingSettings());
std::unique_ptr<se::common::Image> image(se::common::Image::FromFile(<PATH_TO_IMAGE>));
session->ProcessImage(*image, proc_settings.get());

const se::doc::DocResult& result = session->GetCurrentResult();
const se::doc::Document& doc = result.DocumentsBegin().GetDocument();
for (auto iterator = doc.TextFieldsBegin(); iterator != doc.TextFieldsEnd(); ++iterator) {
  std::string name = iterator.GetFieldPtr()->GetBaseFieldInfo().GetName();
  std::string value = iterator.GetFieldPtr()->GetOcrString().GetFirstString().GetCStr();
}

DocEngine engine = DocEngine.Create(<PATH_TO_CONFIGURATION_FILE>, true);
DocSessionSettings settings = engine.CreateSessionSettings();
settings.SetCurrentMode("primary_accounting");
settings.AddEnabledDocumentTypes("*");
DocSession session = engine.SpawnSession(session_settings, <PERSONALIZED_SIGNATURE>);
DocProcessingSettings proc_settings = session.CreateProcessingSettings();
Image image = Image.FromFile(<PATH_TO_IMAGE>);
session.ProcessImage(image, proc_settings);

DocResult result = session.GetCurrentResult();
doc_it = recog_result.DocumentsBegin()
Document doc = recog_result.DocumentsBegin().GetDocument();
for (DocTextFieldsIterator iterator = doc.TextFieldsBegin(); !iterator.Equals(doc.TextFieldsEnd()); iterator.Advance()) {
  String name = iterator.GetField().GetBaseFieldInfo().GetName();
  String value = iterator.GetField().GetOcrString().GetFirstString().GetCStr());
}

engine = pydocengine.DocEngine.Create(<PATH_TO_CONFIGURATION_FILE>)
settings = engine.CreateSessionSettings()
settings.SetCurrentMode("primary_accounting")
settings.AddEnabledDocumentTypes("*")
session = engine.SpawnSession(settings, <PERSONALIZED_SIGNATURE>)
proc_settings = session.CreateProcessingSettings()
image = pydocengine.Image.FromFile(<PATH_TO_IMAGE>)
session.ProcessImage(image, proc_settings)

result = session.GetCurrentResult()
doc_it = recog_result.DocumentsBegin()
doc = recog_result.DocumentsBegin().GetDocument()
iterator = doc.TextFieldsBegin()
while(iterator != doc.TextFieldsEnd()):
  name = iterator.GetField().GetBaseFieldInfo().GetName()
  value = iterator.GetField().GetOcrString().GetFirstString().GetCStr()
  iterator.Advance()

Уверенность распознавания, координаты объектов, вырезание полей и документов

Возврат зоны принятия решения для проверок подлинности

Операционные системы

Android

iOS

MS Windows

Linux

ОС Аврора

ОС Эльбрус

РЕД ОС

Astra Linux

ОС Атликс

ОС Альт Линукс

Low-code интеграция, простой и понятный REST API

API на

C++

Java

Python

PHP

Фреймворки:

React Native

Flutter

интеграция с 1C

Примеры использования на языках

C++

Java

Python

PHP

Архитектуры процессоров

х86

x86_64

ARMv7-v8-v9 (AArch32 и AArch64)

MIPS (MIPS32 и MIPS64)

Elbrus

Как встроить за 5 минут в iOS, Android

Заказать продукт

Часто задаваемые вопросы

Для каких агентных моделей ИИ подходит решение?

Система подходит для автоматизации ввода данных в любые LLM и агентные модели ИИ, построенные на их основе. Решение может использоваться как источник достоверных данных для корпоративных AI-платформ, интеллектуальных помощников, RAG-систем, NLP-моделей, AI-агентов для документооборота, KYC/KYB-сценариев и других систем анализа и принятия решений, работающих на основе текстовой информации из документов. Решение обеспечивает высокоточный структурированный ввод без искажения исходных данных, что особенно важно для ИИ-агентов, принимающих решения на основе содержимого документов.

Как система помогает повысить качество работы ИИ-агентов?

Технология Smart Engines позволяет существенно повысить качество работы ИИ-агентов за счет высокоточного и достоверного извлечения данных. Система обеспечивает максимальное качество распознавания без галлюцинаций и рисков искажения исходной информации. На выходе решение формирует расширенный результат распознавания: текст, знакоместа, геометрию документа и альтернативы для NLP-обработки. Это позволяет значительно точнее анализировать документы с помощью ИИ-агентов, учитывать контекст расположения данных и минимизировать ошибки интерпретации при автоматическом принятии решений.

Какой текст можно распознать с помощью решения?

Система Smart Engines распознает печатный, рукописный и смешанный текст любой сложности. Поддерживается обработка рукописных пометок, комментариев, анкет, заявлений, подписей и других текстовых элементов, заполненных от руки. Решение корректно работает даже с трудноразборчивым почерком, а также с текстом, написанным ручкой, карандашом или пером. Решение поддерживает распознавание смешанного текста в документах, где одновременно присутствуют печатные и рукописные фрагменты.

Подходит ли система для ввода данных деловых документов?

Да. Система Smart Engines автоматически определяет тип документа на фотографиях и сканах и извлекает ключевые реквизиты из различных типов документации. Решение поддерживает обработку 80+ видов деловых документов РФ, а также 3000+ типов удостоверений личности всего мира. OCR распознает и классифицирует договоры, счета, акты, анкеты, заявления, бухгалтерские и кадровые документы и другие формы документации. Технология поддерживает потоковую обработку больших массивов документов, ускоряя ввод данных, проверку, маршрутизацию и автоматизацию бизнес-процессов без участия человека.

Какие языки поддерживает технология распознавания?

Технология поддерживает распознавание текста более чем на 100 языках мира. Система эффективно работает не только с латиницей и кириллицей, но и со сложными системами письменности, включая арабскую вязь, китайские и японские иероглифы, корейское письмо и другие алфавиты. Поддерживается омнифонтовое распознавание независимо от гарнитуры, начертания и качества печати, что позволяет использовать решение в мультиязычных AI-сценариях.

Работает ли система с изображениями низкого качества?

Да. Технология с высочайшей точностью распознает документы, снятые в реальных условиях, и работает с изображениями низкого качества. Система автоматически выполняет локализацию документа в кадре, выравнивание и нормализацию изображения. Искусственный интеллект устойчив к шумам, бликам, теням, размытию, сложному фону и артефактам сканирования. Это позволяет одинаково эффективно обрабатывать как фотографии с мобильных устройств, так и низкокачественные сканы документов, обеспечивая высокую точность извлечения данных.

В каком виде решение возвращает результаты?

Система передает результаты распознавания в структурированном виде, подходящем для последующей обработки ИИ-агентами и NLP-системами. Вместе с извлеченным текстом решение возвращает знакоместа, геометрию документа и альтернативы. Такой уровень детализации позволяет применять технологию для ввода данных в существующие системы интеллектуального анализа документов и автоматического принятия решений, а также для построения мультиагентных моделей на базе AI.

Какую производительность обеспечивает система?

Решение Smart Engines обеспечивает сверхбыструю обработку документов — до 1800 страниц в минуту на одном сервере без использования GPU. Архитектура решения позволяет легко масштабировать систему для работы с большими объемами данных без усложнения ИТ-инфраструктуры и дополнительных затрат на специализированное оборудование. Высокая производительность системы делает решение эффективным инструментом для потоковой обработки документов, корпоративных AI-платформ и высоконагруженных систем, где критически важна скорость, полнота и достоверность данных.

Каковы инфраструктурные требования для работы решения?

Система Smart Engines — мультиплатформенный программный продукт, который быстро встраивается в существующую ИТ-инфраструктуру заказчика без необходимости доработок. Для работы решения не требуется интернет-соединение и привлечение мощностей графических ускорителей (GPU). Это позволяет применять систему как на серверах, так и на рабочих станциях, мобильных устройствах и на веб-страницах.

Подходит ли система для работы с конфиденциальной информацией?

Да. Решение работает полностью автономно в инфраструктуре заказчика по модели on-premise и обеспечивает 100% локальную обработку документов. Во время распознавания изображения и извлеченные данные не передаются за пределы защищенного контура организации и не отправляются во внешние облачные сервисы. Это обеспечивает высокий уровень конфиденциальности и соответствие требованиям информационной безопасности, что особенно важно для банков, государственных организаций, промышленности и корпоративных заказчиков.

Надежное и точное распознавание текстов для ИИ-агентов

Как работает распознавание для ИИ‑агентов

Возможности распознавания

Какие документы
распознаются

Возможности
интеграции

Попробуйте качество наших технологий

Заказать продукт

Часто задаваемые вопросы

Надежное и точное распознавание текстов для ИИ-агентов

Как работает распознавание для ИИ‑агентов

Возможности распознавания

Какие документы распознаются

Возможности интеграции

Попробуйте качество наших технологий

Заказать продукт

Часто задаваемые вопросы

Какие документы
распознаются

Возможности
интеграции