Интеллектуальное распознавание документов (IDR)

Smart DocumentReader

— безопасная система интеллектуального распознавания документов (IDR) для мобильных, десктопных и серверных решений.

 

Smart DocumentReader надежно решает задачи автоматической классификации и распознавания документов, и обеспечивает высочайшее качество и скорость в процессе интеллектуальной обработки документов (Intelligent Document Processing) для максимальной оптимизации бизнес-процессов (BPM) в органах государственного управления, компаниях различных секторов экономики (финансы, телеком, транспорт, промышленность, ритейл, энергетика, медицина, образование и др.).

 

Smart DocumentReader позволяет выполнять автоматическое извлечение данных из типовых форм, форм строгой отчетности, первичных бухгалтерских, финансовых, налоговых, юридических, нотариальных и других документов, используемых в документообороте, различных тестов и опросников, на сканах и фотографиях, сделанных в естественных условиях. Система позволяет автоматически обрабатывать одно- и многостраничные документы с фиксированным положением реквизитов, документы с плавающим расположением блоков и реквизитов, неструктурированные текстовые документы и блоки, таблицы, надписи или даже отдельные строки и метки.

 

Smart DocumentReader позволяет автоматизировать обработку и распознавание стандартных форм и анкет, заполняемых как машиночитаемым способом, так и “от руки”. Важным преимуществом является то, что система одинаково хорошо и быстро обрабатывает как сканы анкет, так и фотографии, автоматически выполняя все действия, необходимые для извлечения из них данных и распознавания текста.

 

Система позволяет не только автоматически извлечь данные из анкет, форм и документов, но и проверить их на соблюдение формальностей. Система проверит, есть ли подпись, печать или логотип, правильного ли они цвета, находятся ли они в нужном месте документа, а те надписи, которые должны быть сделаны от руки, действительно рукописные. Кроме того, система может проверить целостность и неизменность бланка, документа или его части.

 

Для обеспечения максимальной безопасности система НЕ передает данные на сторонние сервисы, НЕ сохраняет данные, НЕ требует доступа в интернет, вся обработка ведется в локальной оперативной памяти вычислительного узла.

 

Наш SDK просто интегрировать в программы на языках программирования Objective-C, Swift, C, C++, Java, C#, PHP, и Python для широкого круга систем: Аврора, iOS, Android, Sailfish Mobile, Linux, Windows, macOS, Solaris и др.

 

Заказать продукт

Особенности продукта

GreenOCR
Разработанная учеными и инженерами нашей компании в рамках инициативы Green AI технология GreenOCR обеспечивает непревзойденные качество и скорость распознавания при минимальном потреблении энергии и воздействии на окружающую среду. Все вычисления выполняются на CPU, не требуя использования дополнительных акселераторов вычислений типа GPU.

 

Точность
Мы создали новое поколение технологий OCR, преодолевшее рубеж качества традиционных подходов за счет использования наших последних достижений в вычислительном интеллекте и глубоком обучении. Точность распознавания реквизитов документов доходит до 99.5% без участия человека.

 

Удобство
Наши передовые алгоритмы сами обнаруживают документ на кадре, автоматически определяют тип документа, находят реквизиты и распознают их. Система устойчива к различным геометрическим искажениям, шумам, перепадам освещения, дефектам печати и низкому разрешению.

 

Покрытие
Система предназначена для интеллектуального распознавания широкого класса документов: KYC/AML-анкеты, согласие на обработку персональных данных, 2-НДФЛ, больничный лист, договора, счета, счет-фактуры, акты, ТТН, ТОРГ12, УПД, налоговую отчетность, нотариальные доверенности, полисы КАСКО и ОСАГО и другие документы, на сканах и фотографиях, сделанных в естественных условиях.

 

Скорость
Оригинальный целочисленный конвейер обработки изображений, включающий 8- и 4-битные глубокие нейросетевые архитектуры, позволил использовать интеллектуальное распознавание документов (IDR) на бюджетные телефоны за счет максимального использования имеющихся аппаратных ресурсов.

 

Надежность
Для повышения надежности результата мы используем подход «Что вижу, то и распознаю», в котором мы реализовали наши передовые достижения в AI: точное распознавание без словарей и грамматик, ответственные и компактные сети. Помимо результатов распознавания пользователю доступны оценки уверенности и другая информация о процессе распознавания.

Безопасность
Благодаря достижениям наших ученых, все вычисления выполняются на конечных устройствах без передачи данных вовне, что подтверждено независимым международным аудитом. Данные НЕ передаются, НЕ сохраняются, НЕ требуется доступ в интернет, вся обработка ведется в оперативной памяти. Это правило «трех НЕ» обеспечивает высочайший уровень безопасности нашим клиентам.

 

Производительность
Высочайшая производительность достигается за счет комбинирования алгоритмов компьютерного зрения и глубокого обучения компактных нейронных сетей. Полный цикл от определения типа до распознавания всех реквизитов занимает от 2 секунд для страницы документа формата А4.

 

Охват
Система позволяет распознавать документы на практически любых языках: как использующих буквенные кириллические и латинские алфавиты, так и составленные на языках, где используются иероглифы, - Корейском, традиционном Китайском и Японском. Кроме того, система ищет таблицы, печати, подписи, рукописные пометки, распознает чекбоксы и баркоды.

Заказать продукт

Возможности Smart DocumentReader

Для мобильных приложений

 

Smart DocumentReader позволяет создать полноценный Мобильный офис на смартфоне или планшете для ваших сотрудников и предлагает новые возможности для оптимизации взаимодействия с клиентом. Теперь для распознавания документов и заполнения необходимых реквизитов не требуются громоздкие сканеры и персональные компьютеры: технология Smart DocumentReader превращает мобильное устройство в мощнейший инструмент интеллектуального распознавания документов.

 

Новые технологии искусственного интеллекта, разрабатываемые нашей компанией, а также непрерывная оптимизация программного обеспечения позволяет выполнять требуемые задачи на смартфонах и планшетах в условиях частичного или полного отсутствия связи. А технология GreenOCR оптимизирует энергопотребление в процессе распознавания, что позволяет продлить работу мобильного устройства без необходимости подзарядки батарей и уменьшить негативное влияние на окружающую среду.

Для мобильных приложений

 

Smart DocumentReader сам найдет документ на изображении, определит его тип, выделит и распознает все необходимые данные. При этом пользователю нет необходимости обучаться правильному фотографированию, «прицеливаться», или искать идеальные условия освещения: за счет эффективных алгоритмов вычислительной геометрии и искусственного интеллекта система автоматически выполняет работу по качественному выделению данных даже в сложных условиях съемки, распознавая сотни реквизитов за считанные секунды. При этом система не передает данные и изображения на внешние сервисы, обходясь вычислительными ресурсами устройства, что предотвращает возможную утечку пользовательских данных и делает процесс распознавания безопасным.

Для десктопов и RPA

 

Smart DocumentReader позволяет автоматизировать рутинные операции ввода данных из документов в рамках различных корпоративных процессов и рабочих мест. Существенное повышение КПД сотрудника достигается за счет того, что сотрудник решает задачи, неподвластные ИИ, а система занимается рутиной, не уставая и не требуя перерывов.

 

Система принимает изображения с документ-сканеров, документ-камер и вебкамер, автоматически или в кооперации с сотрудником определяет тип документа, выделяет и распознает необходимые данные. В Smart DocumentReader реализована работа в режиме ассистирования: ИИ и человек помогают друг другу решить задачу выделения необходимых данных из документов, подсказывая наиболее оптимальные пути.

 

Для упрощения интеграции система объединена с несколькими системами программных роботов (RPA). Это позволяет минимизировать затраты на интеграцию даже для легаси систем.

Для серверов

 

Серверные решения Smart DocumentReader эффективны там, где требуется быстро развернуть систему массового ввода документов, в том числе с использованием промышленных сканеров.

 

Высокая степень автоматизации, производительность и совместимость с широким перечнем программно-аппаратных платформ позволяет включать систему в интеграционные шины, бесшовно добавлять новые функции в уже работающие системы без изменения существующих конфигураций.

 

Применяемые технологии на базе ИИ позволяют получить высокую производительность без существенных капитальных затрат на оборудование при одновременном снижении операционных расходов.

 

Постоянно совершенствующаяся технология GreenOCR, лежащая в основе Smart DocumentReader, обеспечивает последовательное уменьшение теплового и углеродного следа, делая процессы распознавания более дружественными по отношению к окружающей среде.

Интеграция и опыт

 

При необходимости ввода документов, удостоверяющих личность, технология органично дополняется нашим продуктом Smart IDReader, который с непревзойденным качеством и скоростью распознает более 1200 различных типов документов.

 

Технология уже используется для потокового сканирования документов, их автоматической классификации и распознавания государственными службами, страховыми компаниями, банками. Среди наших клиентов, использующих технологию, ГС МИР, АльфаСтрахование, РОСБАНК, Газпромбанк и др.

 

Smart DocumentReader поддерживает широкий класс операционных систем, в том числе и специализированные операционные системы, предназначенные для работы с персональными данными: ОС Эльбрус, РЕД ОС, Атликс, Astra Linux, CentOS, Ubuntu, Red Hat Linux, Arch Linux и другие дистрибутивы Linux, QNX, ОС семейства Windows, macOS, МОС “Аврора”, iOS, Android, Sailfish OS. Важной особенностью технологии является поддержка различных процессорных архитектур.

Заказать продукт

Отправьте нам заявку, и мы с вами свяжемся

Наши клиенты

Аэроэкспресс

Компания «Аэроэкспресс» использует решения Smart Engines для оформления билетов

«Почта Банк»

«Почта Банк» внедрил решение Smart Engines для распознавания паспортных данных клиентов

Мегафон

В сети МегаФон оформляют сим-карты с помощью технологии распознавания Smart IDReader

Альфастрахование

В онлайн-сервисах «АльфаСтрахование» и «АльфаСтрахование Мобайл» в 2018 г. распознано 1,6 млн паспортов РФ, ВУ и СТС

По любым вопросам, предложениям или заказу решений,
пожалуйста, заполните предлагаемую ниже форму и мы обязательно свяжемся с вами.
Нажимая на кнопку отправить вы соглашаетесь на обработку данных