Отчет о мошенничестве с поддельными документами 2025 года

Smart Document Engine — IDP платформа на базе AI OCR

Высокопроизводительная on-premise платформа Headless IDP для сквозной автоматизации и масштабирования бизнеса

AI OCR в 50 раз быстрее и в 1,5 раза точнее человека* при вводе документов без GPU, NPU и TPU

Снижение издержек за счет интеграции IDP внутрь бизнес-процессов без усложнения архитектуры

Автоматическая классификация документов и извлечение бизнес-значимых атрибутов

Распознавание печатных и рукописных документов на 102 языках мира

Explainable AI (XAI) на всех этапах распознавания и обработки документов, для понимания и контроля результатов

Document Studio для настройки шаблонов распознавания и интегрируемый on-premise UI для верификации результатов

Бесшовная интеграция в любую ИТ-архитектуру, включая мобильную, веб-, десктоп-, серверную и гибридную

Полностью российская IDP платформа, Реестровая запись №9617

Smart Document Engine

Headless IDP — ИИ платформа для обработки документов

  • Полная автоматизация классификации документов и выделения ключевых атрибутов
  • Enterprise производительность: до 500 000 страниц A4 в сутки на одном сервере и 16 миллионов страниц в сутки на кластере
  • Распознавание сфотографированных и отсканированных документов в одном потоке, автоматическое разглаживание сложенных и изогнутых документов
  • Интеллектуальная обработка комплектов и многостраничных документов
  • Автоматическая верификация атрибутов и реквизитов, встраиваемый UI для on-premise верификации результатов
  • Кроссплатформенная интеграция IDP не требует изменения IT архитектуры с поддержкой российских ОС

AI OCR — высочайшая скорость и точность без галлюцинаций

  • Точность OCR до 99.9%, скорость — до 15 страниц в секунду без GPU, NPU и TPU
  • Омнифонтовое распознавание текста, обученное на исключительно синтетических данных
  • Специальные сверхкомпактные архитектуры нейросетей для OCR, ICR, HTR
  • Хаф-сети для state-of-the-art нейросетевого поиска текстов на документах
  • Российский ИИ для поиска и распознавания всех объектов документов: текстов на 102 языках, штрихкодов, чекбокcов, таблиц, печатей, подписей и др.
  • GreenOCR® — распознавание в гармонии с природой России
AI OCR - высочайшая скорость и точность без галлюцинаций

ИИ модель «Да Винчи» для точного распознавания рукописного текста

  • Надежное распознавание рукописного текста вне зависимости от почерка
  • Распознавание рукописи, написанной любой ручкой, карандашом, пером
  • Автоматическое определение печатного и рукописного текста
  • Распознавание рукописных документов и отдельных рукописных атрибутов
  • Чистое распознавание трудночитаемых рукописных слов — со строчными буквами «ш», «л», «и», «п» — без языковых моделей и словарей
  • Распознавание рукописных букв, цифр и их комбинаций

Выделение атрибутов и реквизитов с помощью NLP на основе методов XAI

  • Верифицируемые Nano-LLM для выделения ключевых атрибутов документа исключающие галлюцинации
  • Патентованный адаптивный NER (поиск и распознавание именных атрибутов) алгоритм с простым синтаксисом настройки
  • NLP-модели и алгоритмы, построенные в парадигме XAI, для структурирования и форматирования результатов распознавания
  • Полная информация о процессе выделения атрибутов и реквизитов с привязкой к изображению документа на уровне знакомест отдельных символов, слов, строк и зон
  • Автоматический контроль наличия текстовых и графических реквизитов документов и их свойств (расположения, формы, размера, цвета и т.п.)
Выделение атрибутов и реквизитов с помощью NLP на основе методов XAI

ИИ модель «Шерлок» для аутентификации документов

  • Проверка реквизитов документов (подписи, печати, логотипы и др.)
  • Проверка корректности оформления документа (цвет печатей, подписей, наличие обязательных атрибутов и др.)
  • Детектирование пересъемки с экрана и ксерокопий документов
  • Антифотошоп — проверка вмешательства в изображение документа
  • Выявление традиционного синтеза и ИИ синтеза документов, а также deepfake
  • Инструментальная проверка подлинности бланков гособразца и выявления физических манипуляций с данными в документе

ИИ платформа и обученные модели

  • Эталонная модель для обработки первичной бухгалтерской документации (60 типов документов)
  • Эталонная модель для обработки кадровых документов граждан РФ и мигрантов (100 типов документов)
  • Эталонная модель для KYC (Know Your Customer), KYB (Know Your Business) и AML (Anti Money Laundering)
  • Модуль с искусственным интеллектом Document Studio для создания пользовательских моделей обработки в рамках кредитного конвейера, анкетирования и других процессов
  • «Тонкий» и «толстый» встраиваемый пользовательский интерфейс для построения HITL внутри бизнес-процесса on-premise
  • Регулируемый уровень детализации ручного контроля результатов распознавания — от отдельных символов до таблиц
ИИ платформа и обученные модели

Интеграция и внедрение

  • Возможности распараллеливания на уровне документа, потока. Поддержка контейнеров, виртуализации и кластеризации
  • Распознавание в браузере и PWA-приложениях с помощью специально WASM-модуля
  • REST API для low-code, API на C, С++, C#, Java, Python, PHP
  • Фреймворки: React Native, Flutter, интеграция с 1C
  • Примеры использования на языках C/C++/C#/Java/PHP/Python
  • ОС Аврора, Android, iOS, РЕД ОС М, MS Windows, Linux, ОС Эльбрус, РЕД ОС, Astra Linux, ОС «ОСнова», ОС «МСВСфера», ALT Linux
  • х86, x86_64, ARMv7-v8-v9 (AArch32 и AArch64), MIPS (MIPS32 и MIPS64), Elbrus
Выберите язык:
TextEngine engine = TextEngine.Create(<PATH_TO_CONFIGURATION_FILE>, true); TextSessionSettings session_settings = engine.CreateSessionSettings(); settings.SetOption("mode", "page"); settings.AddEnabledLanguages("rus:eng:punct:digits"); TextSession session = engine.SpawnSession(settings, <PERSONALIZED_SIGNATURE>); Image image = Image.FromFile(<PATH_TO_IMAGE>); session.ProcessImage(image); TextResult result = session.GetCurrentResult(); TextScene scene = result.GetCurrentScene(); TextIterator iterator = scene.CreateIterator("default"); while(!iterator.Finished()) { String chunk = iterator.GetTextChunk().GetOcrString().GetFirstString().GetCStr(); chunk_iterator.Advance(); }
std::unique_ptr<se::text::TextEngine> engine(se::text::TextEngine::Create(<PATH_TO_CONFIGURATION_FILE>, true)); std::unique_ptr<se::text::TextSessionSettings> settings(engine->CreateSessionSettings()); settings->SetOption("mode", "page"); settings->AddEnabledLanguages("rus:eng:punct:digits"); std::unique_ptr<se::text::TextSession> session(engine->SpawnSession(*settings, <PERSONALIZED_SIGNATURE>)); std::unique_ptr<se::common::Image> image(se::common::Image::FromFile(<PATH_TO_IMAGE>)); session->ProcessImage(*image); const se::text::TextResult& result = session->GetCurrentResult(); const auto& scene = result.GetCurrentScene(); auto iterator = scene.CreateIterator("default"); for (; !iterator->Finished(); iterator->Advance()) { std::string chunk = iterator->GetTextChunk().GetOcrString().GetFirstString().GetCStr(); }
TextEngine engine = TextEngine.Create(<PATH_TO_CONFIGURATION_FILE>); TextSessionSettings settings = engine.CreateSessionSettings(); settings.SetOption("mode", "page"); settings.AddEnabledLanguages("rus:eng:punct:digits"); TextSession session = engine.SpawnSession(settings, <PERSONALIZED_SIGNATURE>); Image image = Image.FromFile(<PATH_TO_IMAGE>); session.ProcessImage(image); TextResult result = session.GetCurrentResult(); TextScene scene = result.GetCurrentScene(); for (TextIterator iterator = scene.CreateIterator("default"); !iterator.Finished(); iterator.Advance()) { String chunk = iterator.GetTextChunk().GetOcrString().GetFirstString().GetCStr()); }
engine = pytextengine.TextEngine.Create(<PATH_TO_CONFIGURATION_FILE>) settings = engine.CreateSessionSettings() settings.SetOption("mode", "page") settings.AddEnabledLanguages("rus:eng:punct:digits") session = engine.SpawnSession(settings, <PERSONALIZED_SIGNATURE>) image = pyidengine.Image.FromFile(<PATH_TO_IMAGE>) session.ProcessImage(image) result = session.GetCurrentResult() scene = result.GetCurrentScene() iterator = scene.CreateIterator("default") while not iterator.Finished(): chunk = iterator.GetTextChunk().GetOcrString().GetFirstString().GetCStr() chunk_iterator.Advance()

Распознавание документов без ущерба экологии

  • Первая в мире система распознавания, построенная на принципах Green AI
  • С 2020 года являемся участниками Глобального договора ООН
  • Пакеты распознаваний с нулевой эмиссией CO2, вся эмиссия в процессе обучения и исполнения ИИ компенсируется компанией
  • Для государственных и муниципальных организаций компенсация эмиссии CO2 включена в предложение

Российское ПО распознавания

Отсутствие риска утечки: работа OCR непосредственно на устройстве пользователя без передачи данных

Smart Engines – не сервис по обработке персональных данных. Мы поставляем решения, которые работают исключительно в информационном контуре Заказчика в полностью автоматическом режиме, без ручной верификации.

 

  • Данные ваших клиентов не передаются на обработку ни нам, ни третьим лицам. Сетевое соединение не требуется
  • Вся обработка ведется в локальной оперативной памяти устройств (100% on-premise)
  • Не используются верификация операторами – HITL (human in the loop), crowdsourcing, mechanical turk

 

ВАЖНО! О репутационных и финансовых рисках работы с сервисами распознавания
ВАЖНО! О репутационных и финансовых рисках работы с сервисами распознавания. Юристы предупреждают: никакие гарантии, сертификаты и прочие документы, предоставляемые сервисами обработки персональных данных и документов, составляющих коммерческую, служебную и государственную тайну, не защищают компании от репутационных рисков и финансовой ответственности при утечке данных.

 

Компании, передающие данные своих клиентов на обработку третьим лицам, в случае утечки лишаются права ссылаться на нарушение ее прав третьими лицами и всю ответственность перед контрагентами принимают на себя.

 

Вы можете ознакомиться с юридическим заключением компании INTELLECT, входящей в группу самых успешных российских юридических компаний по версии международного рейтинга The Chambers Europe.

Попробуйте качество наших технологий

  • Скачайте мобильное демоприложение, в котором все возможности собраны воедино
  • Можно на время отключить интернет, чтобы убедиться, что изображения и ваши данные не передаются
  • Попробуйте нашу IDP платформу в действии на примере счета на оплату, УПД, счетов-фактуры и других документов

Заказать продукт

Для заказа решений, получения подробной информации или триал версий заполните приведенную ниже форму, и мы обязательно с Вами свяжемся.

    Т-Банк

    Smart Engines поставляет мобильные и серверные решения по распознаванию документов Т-Банку

    Альфа-Банк

    Альфа-Банк распознает документы клиентов в мобильном приложении с помощью Smart ID Engine

    ВТБ

    ВТБ перешел на российские технологии для распознавания QR-кодов и банковских карт

    Газпромбанк

    Газпромбанк внедрил решение Smart Engines на основе искусственного интеллекта для распознавания QR-кодов

    Заказать продукт

    Для заказа решений, получения подробной информации или триал версий заполните приведенную ниже форму, и мы обязательно с Вами свяжемся.

      https://smartengines.ru/intelligent-document-recognitionArray ( )