Интеллектуальное распознавание документов (IDR)

Smart Document Engine

— безопасная система интеллектуального распознавания документов (IDR) для мобильных, десктопных и серверных решений.

 

Smart Document Engine (ранее Smart DocumentReader) надежно решает задачи автоматической классификации и распознавания документов, и обеспечивает высочайшее качество и скорость в процессе интеллектуальной обработки документов (Intelligent Document Processing) для максимальной оптимизации бизнес-процессов (BPM) в органах государственного управления, компаниях различных секторов экономики (финансы, телеком, транспорт, промышленность, ритейл, энергетика, медицина, образование и др.).

 

Smart Document Engine позволяет выполнять автоматическое извлечение данных из типовых форм, форм строгой отчетности, первичных бухгалтерских, финансовых, налоговых, юридических, нотариальных и других документов, используемых в документообороте, различных тестов и опросников, на сканах и фотографиях, сделанных в естественных условиях. Система позволяет автоматически обрабатывать одно- и многостраничные документы с фиксированным положением реквизитов, документы с плавающим расположением блоков и реквизитов, неструктурированные текстовые документы и блоки, таблицы, надписи или даже отдельные строки и метки.

 

Smart Document Engine позволяет автоматизировать обработку и распознавание стандартных форм и анкет, заполняемых как машиночитаемым способом, так и “от руки”. Важным преимуществом является то, что система одинаково хорошо и быстро обрабатывает как сканы анкет, так и фотографии, автоматически выполняя все действия, необходимые для извлечения из них данных и распознавания текста.

 

Система позволяет не только автоматически извлечь данные из анкет, форм и документов, но и проверить их на соблюдение формальностей. Система проверит, есть ли подпись, печать или логотип, правильного ли они цвета, находятся ли они в нужном месте документа, а те надписи, которые должны быть сделаны от руки, действительно рукописные. Кроме того, система может проверить целостность и неизменность бланка, документа или его части.

 

Для обеспечения максимальной безопасности система НЕ передает данные на сторонние сервисы, НЕ сохраняет данные, НЕ требует доступа в интернет, вся обработка ведется в локальной оперативной памяти вычислительного узла.

 

Smart Document Engine SDK просто интегрировать в программы на языках программирования Objective-C, Swift, C, C++, Java, C#, PHP, и Python для широкого круга систем: МОС «Аврора», iOS, Android, Sailfish Mobile, Linux, Windows, macOS, Solaris и др. Для удобства встраивания разработчикам доступны .NET-обертки для Linux-систем, а также обеспечена поддержка React и Flutter для мобильных SDK.

 

Заказать продукт

Особенности продукта

GreenOCR
Разработанная учеными и инженерами нашей компании в рамках инициативы Green AI технология GreenOCR обеспечивает непревзойденные качество и скорость распознавания при минимальном потреблении энергии и воздействии на окружающую среду. Все вычисления выполняются на CPU, не требуя использования дополнительных акселераторов вычислений типа GPU.

 

Точность
Мы создали новое поколение технологий OCR, преодолевшее рубеж качества традиционных подходов за счет использования наших последних достижений в вычислительном интеллекте и глубоком обучении. Точность распознавания реквизитов документов доходит до 99.5% без участия человека.

 

Удобство
Наши передовые алгоритмы сами обнаруживают документ на кадре, автоматически определяют тип документа, находят реквизиты и распознают их. Система устойчива к различным геометрическим искажениям, шумам, перепадам освещения, дефектам печати и низкому разрешению.

 

Покрытие
Система предназначена для интеллектуального распознавания широкого класса документов: KYC/AML-анкеты, согласие на обработку персональных данных, 2-НДФЛ, больничный лист, договора, счета, счет-фактуры, акты, ТТН, ТОРГ12, УПД, налоговую отчетность, нотариальные доверенности, полисы КАСКО и ОСАГО и другие документы, на сканах и фотографиях, сделанных в естественных условиях.

 

Скорость
Оригинальный целочисленный конвейер обработки изображений, включающий 8- и 4-битные глубокие нейросетевые архитектуры, позволил использовать интеллектуальное распознавание документов (IDR) на бюджетные телефоны за счет максимального использования имеющихся аппаратных ресурсов.

 

Надежность
Для повышения надежности результата мы используем подход «Что вижу, то и распознаю», в котором мы реализовали наши передовые достижения в AI: точное распознавание без словарей и грамматик, ответственные и компактные сети. Помимо результатов распознавания пользователю доступны оценки уверенности и другая информация о процессе распознавания.

Безопасность
Благодаря достижениям наших ученых, все вычисления выполняются на конечных устройствах без передачи данных вовне, что подтверждено независимым международным аудитом. Данные НЕ передаются, НЕ сохраняются, НЕ требуется доступ в интернет, вся обработка ведется в оперативной памяти. Это правило «трех НЕ» обеспечивает высочайший уровень безопасности нашим клиентам.

 

Производительность
Высочайшая производительность достигается за счет комбинирования алгоритмов компьютерного зрения и глубокого обучения компактных нейронных сетей. Полный цикл от определения типа до распознавания всех реквизитов занимает от 2 секунд для страницы документа формата А4.

 

Охват
Система позволяет распознавать документы на практически любых языках: как использующих буквенные кириллические и латинские алфавиты, так и составленные на языках, где используются иероглифы, - Корейском, традиционном Китайском и Японском. Кроме того, система ищет таблицы, печати, подписи, рукописные пометки, распознает чекбоксы и баркоды.

Заказать продукт



Возможности Smart DocumentReader

Для мобильных приложений

 

Smart Document Engine позволяет создать полноценный Мобильный офис на смартфоне или планшете для ваших сотрудников и предлагает новые возможности для оптимизации взаимодействия с клиентом. Теперь для распознавания документов и заполнения необходимых реквизитов не требуются громоздкие сканеры и персональные компьютеры: технология Smart Document Engine превращает мобильное устройство в мощнейший инструмент интеллектуального распознавания документов.

 

Новые технологии искусственного интеллекта, разрабатываемые нашей компанией, а также непрерывная оптимизация программного обеспечения позволяет выполнять требуемые задачи на смартфонах и планшетах в условиях частичного или полного отсутствия связи. А технология GreenOCR оптимизирует энергопотребление в процессе распознавания, что позволяет продлить работу мобильного устройства без необходимости подзарядки батарей и уменьшить негативное влияние на окружающую среду.

Для мобильных приложений

 

Smart Document Engine сам найдет документ на изображении, определит его тип, выделит и распознает все необходимые данные. При этом пользователю нет необходимости обучаться правильному фотографированию, «прицеливаться», или искать идеальные условия освещения: за счет эффективных алгоритмов вычислительной геометрии и искусственного интеллекта система автоматически выполняет работу по качественному выделению данных даже в сложных условиях съемки, распознавая сотни реквизитов за считанные секунды. При этом система не передает данные и изображения на внешние сервисы, обходясь вычислительными ресурсами устройства, что предотвращает возможную утечку пользовательских данных и делает процесс распознавания безопасным.

Для десктопов и RPA

 

Smart Document Engine позволяет автоматизировать рутинные операции ввода данных из документов в рамках различных корпоративных процессов и рабочих мест. Существенное повышение КПД сотрудника достигается за счет того, что сотрудник решает задачи, неподвластные ИИ, а система занимается рутиной, не уставая и не требуя перерывов.

 

Система принимает изображения с документ-сканеров, документ-камер и вебкамер, автоматически или в кооперации с сотрудником определяет тип документа, выделяет и распознает необходимые данные. В Smart Document Engine реализована работа в режиме ассистирования: ИИ и человек помогают друг другу решить задачу выделения необходимых данных из документов, подсказывая наиболее оптимальные пути.

 

Для упрощения интеграции система объединена с несколькими системами программных роботов (RPA). Это позволяет минимизировать затраты на интеграцию даже для легаси систем.

Для серверов

 

Серверные решения Smart Document Engine эффективны там, где требуется быстро развернуть систему массового ввода документов, в том числе с использованием промышленных сканеров.

 

Высокая степень автоматизации, производительность и совместимость с широким перечнем программно-аппаратных платформ позволяет включать систему в интеграционные шины, бесшовно добавлять новые функции в уже работающие системы без изменения существующих конфигураций.

 

Применяемые технологии на базе ИИ позволяют получить высокую производительность без существенных капитальных затрат на оборудование при одновременном снижении операционных расходов.

 

Постоянно совершенствующаяся технология GreenOCR, лежащая в основе Smart Document Engine, обеспечивает последовательное уменьшение теплового и углеродного следа, делая процессы распознавания более дружественными по отношению к окружающей среде.

Интеграция и опыт

 

При необходимости ввода документов, удостоверяющих личность, технология органично дополняется нашим продуктом Smart ID Engine, который с непревзойденным качеством и скоростью распознает 1483 различных типа документов.

 

Технология уже используется для потокового сканирования документов, их автоматической классификации и распознавания государственными службами, страховыми компаниями, банками. Среди наших клиентов, использующих технологию, ГС МИР, АльфаСтрахование, РОСБАНК, Газпромбанк и др.

 

Smart Document Engine поддерживает широкий класс операционных систем, в том числе и специализированные операционные системы, предназначенные для работы с персональными данными: ОС Эльбрус, РЕД ОС, Атликс, Astra Linux, CentOS, Ubuntu, Red Hat Linux, Arch Linux и другие дистрибутивы Linux, QNX, ОС семейства Windows, macOS, МОС “Аврора”, iOS, Android, Sailfish OS. Важной особенностью технологии является поддержка различных процессорных архитектур.

Заказать продукт

Отправьте нам заявку, и мы с вами свяжемся

    Наши клиенты

    Аэроэкспресс

    Компания «Аэроэкспресс» использует решения Smart Engines для оформления билетов

    Альфа-Банк

    Альфа-Банк распознает документы клиентов в мобильном приложении с помощью Smart IDReader

    Туту.ру

    Туту.ру — онлайн-бронирование билетов с помощью технологий распознавания документов

    Росбанк

    Росбанк выбрал технологии распознавания документов Smart Engines