Мгновенное распознавание деловых документов и форм

Smart Document Engine

— быстрая и безопасная система ввода и распознавания документов для мобильных, десктопных и серверных решений.

 

Smart Document Engine (ранее Smart DocumentReader) быстро и надежно решает задачи автоматической классификации и распознавания текстовых и иных реквизитов первичных, деловых, уставных, бухгалтерских, налоговых, нотариальных, юридических, страховых и банковских документов, а также типовых форм и форм строгой отчетности. Система позволяет автоматически вводить и распознавать одно- и многостраничные документы с фиксированным положением реквизитов, документы с плавающим расположением блоков и реквизитов, неструктурированные текстовые документы и блоки, таблицы, надписи или даже отдельные строки и метки. Обеспечивает высочайшее качество и скорость классификации и распознавания в процессе ввода документов, для максимальной оптимизации бизнес-процессов в органах государственного управления и компаниях различных секторов экономики (финансы, телеком, транспорт, промышленность, ритейл, энергетика, медицина, образование и др.).

 

Для обеспечения максимальной безопасности и приватности система НЕ передает данные на сторонние сервисы, НЕ сохраняет данные, НЕ требует доступа в интернет, вся обработка ведется в локальной оперативной памяти вычислительного узла.

 

Smart Document Engine поставляется в виде SDK (software developer kit) который содержит всю необходимую документацию на API (application programmable interface) распознавания и примеры. SDK просто интегрировать в программы на языках программирования Objective-C, Swift, C, C++, Java, C#, PHP, и Python для широкого круга систем: iOS, Android, Sailfish Mobile, МОС «Аврора», Linux, Windows, macOS, Solaris и др.

 

За счет использования state-of-the-art алгоритмов компьютерного зрения, специальными нейросетевыми моделями с преобразованием Хафа в качестве слоев (HoughNet и HoughEncoder) и энергоэффективной технологии распознавания текста GreenOCR второго поколения, разработанных нашими учеными и инженерами, Smart Document Engine позволяет решать на обычных мобильных телефонах задачи распознавания деловых документов, которые раньше были доступны только высокопроизводительным серверам. В Smart Document Engine реализованы последние достижения ИИ в области OCR, ICR и OMR, которые обеспечивают высокую точность и энергоэффективность.

 

В результате современный мобильный телефон позволяет распознавать поток со специализированного документного сканера производительностью до 30 страниц в минуту, что ранее было доступно только высокопроизводительным рабочим станциям или серверам. При этом не принося в жертву качество распознавания, а обеспечивая высочайшую точность распознавания текстовых, цифровых и иных данных документа. Так, распознавание 2НДФЛ на телефоне Galaxy S10 в среднем занимает меньше 3 секунд. При этом система одинаково хорошо и быстро обрабатывает как сканы анкет, так и фотографии, автоматически выполняя все действия, необходимые для классификации, извлечения из них данных и распознавания текста с учетом геометрических искажений, перепадов и неравномерностей освещения характерных для фотографий.

 

Помимо функционала по распознаванию и автоматизированной обработке форм и анкет (заполняемых как машинописным способом — OCR, так и «от руки» — ICR), Smart Document Engine предоставляет следующий функционал интеллектуального анализа данных:

– контроль заполнения документа (включая анализ зон документа, предназначенных для рукописного заполнения)
– контроль отсутствия на документе помарок, исправлений и прочих пометок
– контроль наличия подписи, печати, логотипов и прочих «графических» элементов на документе
– контроль цветности документа (в целом) и отдельных элементов (печать, подпись и т. п.)
– распознавание и анализ атрибутов текстовых символов, включая выделение свойств шрифта (серифность, курсив, жирность), оценку однородности и монотонности
– контроль целостности бланка документа

 

Важным аспектом системы является распознавание текста вне лингвистической модели языка в рамках подхода “Что написано, то и распознано”, что минимизирует число ошибочных подстановок из лингвистических моделей (словарей, справочников, n-грамм).

 

Для повышения безопасности обработки данных и обеспечения программно-аппаратной независимости решения технология распознавания документов Smart Document Engine нативно поддерживает отечественные защищенные аппаратные платформ «Эльбрус», «КОМДИВ» и Байкал. Программные пакеты Smart Document Engine совместимы с операционными системами ОС Эльбрус, РЕД ОС, Astra Linux, ОС Атликс, МОС «Аврора».

 

При необходимости ввода документов, удостоверяющих личность, технология органично дополняется нашим продуктом Smart ID Engine, который с высочайшим качеством и скоростью распознает 1555 различных типа документов. Распознавание кодфицированных объектов доступно за счет использования Smart Code Engine.

 

Заказать продукт

Спецификация

Список поддерживаемых мобильных операционных систем:

 

– Android (версии 5.1 и выше)
– iOS (версии 9 и выше)
– Sailfish Mobile OS (версии 2.2 и выше)
– OC Аврора (версия 3.1.0 и выше)

 

Список поддерживаемых операционных систем для PC:

 

– MS Windows (все официально поддерживаемые правообладателем версии)
– Семейство ОС, основанных на ядре Linux (включая Ubuntu 14.04 и выше, CentOS 6 и выше, SUSE Linux Enterprise Server 12 и выше, Astra Linux 1.6 и выше, РЕД ОС 7 и выше)
– macOS (версии 10.13 High Sierra и выше)
– ОС Эльбрус (версии 8.11 и выше)

 

Список поддерживаемых документов:

 

– Свидетельство о постановке на учёт гражданина РФ (ИНН)
– Справка 2-НДФЛ
– Платежное поручение (форма 0401060)
– Бухгалтерский баланс (форма 0710001)
– Отчет о финансовых результатах (ОКУД 0710002)

 

Список поддерживаемых языков распознавания текста (OCR):

 

  • Кириллица (Русский, Абхазский, Белорусский, Болгарский, Казахский, Киргизский, Монгольский, Осетинский, Сербский, Таджикский, Узбекский, Украинский)
  • Латиница (Английский, Азейбаржанский, Аймара, Албанский, Африкаанс, Берберский, Боснийский, Венгерский, Волеаи, Гаитянский креольский, Датский, Зулу, Индонезийский, Ирландский, Исландский, Испанский, Итальянский, Кантонский, Кастильский, Каталонский, Кечуа, Коморский, Коса, Латышский, Литовский, Люксембургский, Македонский, Малайский, Мальтийский, Мандарин, Маори, Молдавский, Науруанский, Ндау, Ндебеле, Немецкий, Нидерландский, Норвежский, Палауский, Польский, Португальский, Руанда, Румынский, Рунди, Свази, Северный сото, Сейшельский креольский, Сесото, Словацкий, Словенский, Сомалийский, Суахили, Тамазайт, Тетум, Ток-писин, Тонга, Тсвана, Тсонга, Турецкий, Туркменский, Фиджи хинди, Фиджийский, Филиппинский, Финский, Французский, Хорватский, Чева, Чешский, Чибарве, Чичева, Шангани, Шведский, Шона, Эстонский, Южный ндебеле)
  • Китайский (классический, 20 000 иероглифов)
  • Японский (Хирагана, Катакана и Кандзи)
  • Корейский (Хангыль)
  • Сингальский
  • Греческий
  • Грузинский
  • Армянский
  • Иврит
  • Арабский
  • Фарси
  • Урду
  • Тамильский
  • Тайский

Список совместимых языков программирования

 

Smart Document Engine содержит API для следующих языков программирования:

  • C (стандарт С11 и выше)
  • С++ (стандарт С++11 и выше)
  • C# (версия 6.0 и выше)
  • Java (версия 1.7 и выше)
  • Python (версия 3.7.2 и выше)
  • PHP (версия 5 и выше)

Имеется поддержка следующих SDK: React, Flutter

Интеграция с другими языками программирования обеспечивается за счет использования API на языке С.

 

Уникальные возможности API

 

Помимо интерфейса для возврата итогового результата распознавания, программный интерфейс Smart Document Engine обеспечивает следующие возможности:

– возврат всех промежуточных результатов распознавания (результатов работы отдельных модулей)
– вызов внешний по отношению к SDK функций обработки данных
– поддержка распознавания нескольких документов на одном изображении

 

Заказать продукт

Особенности продукта

GreenOCR
Разработанная учеными и инженерами нашей компании в рамках инициативы Green AI технология GreenOCR обеспечивает непревзойденные качество и скорость распознавания при минимальном потреблении энергии и воздействии на окружающую среду. Все вычисления выполняются на CPU, не требуя использования дополнительных акселераторов вычислений типа GPU. Технология позволяет распознавать машинописные тексты (OCR), тексты написанные “от руки” (ICR) и метки (OMR).

 

Точность
Мы создали новое поколение технологий OCR, преодолевшее рубеж качества традиционных подходов за счет использования наших последних достижений в вычислительном интеллекте и глубоком обучении. Точность распознавания реквизитов документов доходит до 99.5% без участия человека.

 

Удобство
Наши передовые алгоритмы сами обнаруживают документ на кадре, автоматически определяют тип документа, находят реквизиты и распознают их. Система устойчива к различным геометрическим искажениям, шумам, перепадам освещения, дефектам печати и низкому разрешению.

 

Продуктовая линейка
В рамках Smart Document Engine возможно использовать все возможности по распознаванию кодифицированных объектов Smart Code Engine, распознаванию и проверки подлинности и живости ДУЛ Smart ID Engine. Клиентам предоставляется возможность использовать преимущества всех продуктов Smart Engines, пользуясь одним интерфейсом SDK, снижая затраты на интеграцию.

Скорость
Оригинальный целочисленный конвейер обработки изображений, включающий 8- и 4-битные глубокие нейросетевые архитектуры, позволяет использовать интеллектуальное распознавание документов даже на бюджетных телефонах за счет максимального использования имеющихся аппаратных ресурсов.

 

Надежность
Для повышения надежности результата мы используем подход «Что вижу, то и распознаю», в котором мы реализовали наши передовые достижения в AI: точное распознавание без словарей и грамматик, ответственные и компактные сети. Помимо результатов распознавания пользователю доступны оценки уверенности и другая информация о процессе распознавания.

 

Охват
Система позволяет распознавать документы на 100 языках: как использующих буквенные кириллические и латинские алфавиты, так и составленные на языках, где используются иероглифы: Корейский, Японский, традиционный и упрощенный Китайский. Кроме того, система ищет таблицы, печати, подписи, рукописные пометки, распознает чекбоксы и баркоды.

 

Поддержка Российских аппаратных платформ
Smart Document Engine - первая система распознавания документов которая нативно (без эмуляции) поддерживает Российские аппаратные платформы “Эльбрус”, “КОМДИВ” и “Байкал”, что позволяет использовать продукт в зонах максимальной ответственности и защищенности. Система Smart Document Engine обеспечивает беспрецедентный уровень безопасности обработки данных и защиту от санкционных рисков.

Безопасность
Благодаря достижениям наших ученых, все вычисления выполняются на конечных устройствах без передачи данных вовне, что подтверждено независимым международным аудитом. Данные НЕ передаются, НЕ сохраняются, НЕ требуется доступ в интернет, вся обработка ведется в оперативной памяти. Это правило «трех НЕ» обеспечивает высочайший уровень безопасности нашим клиентам.

 

Производительность
Высочайшая производительность достигается за счет комбинирования алгоритмов компьютерного зрения и глубокого обучения компактных нейронных сетей. Полный цикл от определения типа до распознавания всех реквизитов занимает от 2 секунд для страницы документа формата А4.

 

Многоплатформеность
Smart Document Engine поддерживает широкий класс операционных систем, включая специализированные операционные системы, предназначенные для работы с персональными данными: ОС Эльбрус, РЕД ОС, ОС Атликс, Astra Linux, Cent OS, Ubuntu, Red Hat Enterprise Linux, SUSE Linux Enterprise Server, Arch Linux и другие дистрибутивы Linux, MS Windows, macOS, ОС Аврора, iOS, Android, Sailfish Mobile OS.

 

Роботизация процессов (RPA)
Поддержка практически всех операционных систем и аппаратных платформ, скорость, качество и широкий круг устройств получения изображений (смартфон, планшет, умная камера, веб-камера, документ-камера, сканер), а также гибкие возможности интеграции оптимально подходят для роботизации бизнес-процессов ввода данных.

Заказать продукт



Возможности Smart Document Engine

Для мобильных приложений

 

Smart Document Engine позволяет создать полноценный Мобильный офис на смартфоне или планшете для ваших сотрудников и предлагает новые возможности для оптимизации взаимодействия с клиентом. Теперь для распознавания документов и заполнения необходимых реквизитов не требуются громоздкие сканеры и персональные компьютеры: технология Smart Document Engine превращает мобильное устройство в мощнейший инструмент интеллектуального распознавания документов.

 

Новые технологии искусственного интеллекта, разрабатываемые нашей компанией, а также непрерывная оптимизация программного обеспечения позволяет выполнять требуемые задачи на смартфонах и планшетах в условиях частичного или полного отсутствия связи. А технология GreenOCR оптимизирует энергопотребление в процессе распознавания, что позволяет продлить работу мобильного устройства без необходимости подзарядки батарей и уменьшить негативное влияние на окружающую среду.

Для мобильных приложений

 

Smart Document Engine сам найдет документ на изображении, определит его тип, выделит и распознает все необходимые данные. При этом пользователю нет необходимости обучаться правильному фотографированию, «прицеливаться», или искать идеальные условия освещения: за счет эффективных алгоритмов вычислительной геометрии и искусственного интеллекта система автоматически выполняет работу по качественному выделению данных даже в сложных условиях съемки, распознавая сотни реквизитов за считанные секунды. При этом система не передает данные и изображения на внешние сервисы, обходясь вычислительными ресурсами устройства, что предотвращает возможную утечку пользовательских данных и делает процесс распознавания безопасным.

Для десктопов и RPA

 

Smart Document Engine позволяет автоматизировать рутинные операции ввода данных из документов в рамках различных корпоративных процессов и рабочих мест. Существенное повышение КПД сотрудника достигается за счет того, что сотрудник решает задачи, неподвластные ИИ, а система занимается рутиной, не уставая и не требуя перерывов.

 

Система принимает изображения с документ-сканеров, документ-камер и вебкамер, автоматически или в кооперации с сотрудником определяет тип документа, выделяет и распознает необходимые данные. В Smart Document Engine реализована работа в режиме ассистирования: ИИ и человек помогают друг другу решить задачу выделения необходимых данных из документов, подсказывая наиболее оптимальные пути.

 

Для упрощения интеграции система объединена с несколькими системами программных роботов (RPA). Это позволяет минимизировать затраты на интеграцию даже для легаси систем.

Для серверов

 

Серверные решения Smart Document Engine эффективны там, где требуется быстро развернуть систему массового ввода документов, в том числе с использованием промышленных сканеров.

 

Высокая степень автоматизации, производительность и совместимость с широким перечнем программно-аппаратных платформ позволяет включать систему в интеграционные шины, бесшовно добавлять новые функции в уже работающие системы без изменения существующих конфигураций.

 

Применяемые технологии на базе ИИ позволяют получить высокую производительность без существенных капитальных затрат на оборудование при одновременном снижении операционных расходов.

 

Постоянно совершенствующаяся технология GreenOCR, лежащая в основе Smart Document Engine, обеспечивает последовательное уменьшение теплового и углеродного следа, делая процессы распознавания более дружественными по отношению к окружающей среде.

Для отечественных платформ

 

Использование Smart Document Engine совместно с Российскими аппаратными платформами (такими как “Эльбрус”, “КОМДИВ” и “Байкал”) позволяет конструировать Отечественные программно-аппаратные комплексы, обеспечивающие беспрецедентный уровень безопасности обработки данных и защиту от санкционных рисков.

 

За счет глубокой оптимизации под Отечественные архитектуры, использование специализированных нативных библиотек (например, высокопроизводительной математической и мультимедийной библиотеки EML от МЦСТ) и особые наборы интринсик, Smart Document Engine обеспечивает непревзойденную скорость распознавания на Отечественных ПК.

 

Интеграция и опыт

 

Технология уже используется для потокового сканирования документов, их автоматической классификации и распознавания государственными службами, страховыми компаниями, банками. Среди наших клиентов, использующих технологию, ГС МИР, АльфаСтрахование, РОСБАНК, Газпромбанк и др.

Заказать продукт

Отправьте нам заявку, и мы с вами свяжемся

    Наши клиенты

    Альфастрахование

    В онлайн-сервисах «АльфаСтрахование» и «АльфаСтрахование Мобайл» в 2018 г. распознано 1,6 млн паспортов РФ, ВУ и СТС

    Банк ДОМ.РФ

    Банк ДОМ.РФ внедрил инновационную систему распознавания документов при кредитовании

    МКБ

    МКБ распознает клиентские данные с помощью искусственного интеллекта от Smart Engines

    МТС

    В терминалах выдачи сим-карт МТС используются технологии Smart Engines

    

      По любым вопросам, предложениям или заказу решений,
      пожалуйста, заполните предлагаемую ниже форму и мы обязательно свяжемся с вами.
      Нажимая на кнопку отправить вы соглашаетесь на обработку данных