18.11.2020 г.

Smart Engines представила новое поколение систем распознавания с аутентификацией документов и биометрической верификацией

Smart Engines представила новое поколение систем распознавания паспортов, других удостоверений личности, банковских карт, баркодов и документов с возможностью аутентификации и биометрической верификации. Компания стала единым поставщиком технологий для точного, быстрого и безопасного извлечения данных, аутентификации документов с проверкой «живости» (document liveness detection) и признаков компрометации (computational document forensics), распознавания лиц (face matching) для верификации пользователей. Все продукты новой линейки: Smart ID Engine, Smart Code Engine и Smart Document Engine разработаны в соответствии с принципами ответственного ИИ и призваны вывести защиту пользователей и бизнеса от мошеннических действий с документами на принципиально новый уровень.


Smart ID Engine является переосмыслением флагманской технологии компании Smart IDReader, и позволяет распознавать паспорт РФ и еще 1482 удостоверяющих документа 210 юрисдикций мира с поддержкой 99 языков, включая иероглифическую письменность. Smart Code Engine объединяет решения для оптического считывания (сканирования) данных банковских карт, баркодов и машиночитаемой зоны (MRZ). Smart Document Engine – система для автоматической классификации, распознавания и выделения реквизитов из структурированных, слабоструктурированных и неструктурированных документов: справки по форме 2-НДФЛ, бухгалтерского баланса, платежного поручения и других. Новые продукты доступны для интеграции в мобильные, десктопные и серверные приложения и работают автономно, обеспечивая безопасность обработки персональных и чувствительных данных.

«В условиях, когда утечки персональных данных становятся обыденностью, на первый план выходит защита пользователя от последствий компрометации их персональных данных и изображений документов, удостоверяющих личность. Наши усилия при разработке новых продуктов направлены на повышение качества и скорости распознавания, а также на предотвращение различных сценариев использования мошенниками украденных пользовательских данных», – говорит генеральный директор Smart Engines, кандидат технических наук Владимир Арлазаров.

Представленные решения получили обновление фирменной технологии ИИ GreenOCR®, в которой внедрена новая 8-битная модель вычислений глубоких нейронных сетей. Технология создана в рамках подхода Green AI и программы устойчивого развития, реализуемой под эгидой ООН. 2-е поколение GreenOCR® позволяет существенно снизить энергопотребление при распознавании, а также обрабатывать документы быстрее. На мощных современных смартфонах производительность распознавания выросла на 10%, а на бюджетных устройствах с ограниченной вычислительной мощностью – на 30%. Благодаря новой технологии Deep Visual Memory, модульной архитектуре, дополнительной алгоритмической и кодовой оптимизации удалось добиться сокращения размера дистрибутива при увеличении количества новых документов и их шаблонов. Для паспорта РФ дистрибутив сокращен на 35%, для документов США и европейских ID карт – 25%, для паспортов всего мира – 15%, для банковских карт – 35% и для баркодов – 40%. Нововведения обеспечивают снижение углеродного следа и продление срока работы мобильных устройств на одном заряде аккумулятора.

Важной особенностью новинок стала поддержка распознавания арабской письменности и языков индо-иранской группы, что существенно расширяет рынок сбыта в странах Ближнего Востока, Юго-восточной Азии и Африки. Речь идет о 21 юрисдикциях с общим населением 500 миллионов человек, которые не используют надписи на латинице в национальных документах. Распознавание арабского языка внедрено для 73 типов документов, включая паспорта, ID-карты и водительские удостоверения следующих государств: Алжир, Бахрейн, Государство Палестина, Египет, Иордания, Ирак, Иран, Йемен, Катар, Коморы, Кувейт, Ливан, Ливия, Мавритания, Марокко, ОАЭ, Оман, Саудовская Аравия, Сирия, Судан, Тунис.

В настоящее время Smart ID Engine позволяет быстро распознавать документы в видеопотоке, на фотографиях и изображений со сканеров. Время распознавания данных разворота паспорта РФ на iPhone XR составляет 200 мс на 1 кадр, водительских прав США примерно 250 мс на 1 кадр и ID карт Германии около 150 мс. Решение всегда работает автономно на конечном устройстве (смартфоне, умной камере, терминале, компьютере, сервере), не требует сетевого соединения и не передает данные клиентов на обработку в сторонние сервисы и/или третьим лицам для ручного ввода. Smart ID Engine позволяет компаниям соблюдать стандарты безопасности обработки персональных данных (ФЗ-152, GDPR, CCPA) и выполнять требования регуляторов в части KYC/AML.

Пользователям и интеграторам в Smart ID Engine «из коробки» доступно автоматическое определение типа документа и компактные конфигурации SDK (или набора библиотек) для быстрого распознавания данных в режиме автовыбора без указания типа документа для паспортов 211 стран мира, ID карт и водительских прав государств стран Евросоюза и Латинской Америки, водительских прав всех штатов США, всех удостоверяющих документов стран Евросоюза и СНГ.

В процессе распознавания в видеопотоке Smart ID Engine умеет выбирать лучший кадр с изображением документа для сохранения в учетной системе компании и наименее поврежденную (наиболее четкую и без бликов) фотографию лица на документе, которая извлекается как отдельный реквизит. Биометрическая верификация пользователя в новых продуктах реализована на базе разработанной командой исследователей Smart Engines собственной технологии распознавания лиц, которая позволяет провести сверку (face matching) фотографии лица в документе с лицом владельца на другой фотографии, в том числе на сделанном пользователем селфи.

Используемые в Smart ID Engine комплексные методы проверки «живости» (document liveness detection) документов в автоматическом режиме определяют попытки использования муляжей, фотокопий, а также съемку образа документа с экрана монитора компьютера, планшета или смартфона. Алгоритмы ИИ детектируют голографические элементы защиты, специальные визуальные элементы защиты (вензеля, орнаменты и т.д.), проверяют геометрию бланка и контролируют поведение документа в реальных условиях наблюдения в видеопотоке и на отдельных кадрах. Детектор «живости» по принципу работы относится к классу «пассивных», то есть не требует от пользователя выполнения специальных действий. Для распознавания и проверки документа достаточно показать его на несколько секунд камере устройства или просто сфотографировать.

«Развитие online-индустрий и дистанционных сервисов заставили мир по-новому посмотреть на задачу обработки документов с персональными и чувствительными данными через мобильные приложения и веб-сервисы. Проверка liveness для документа по принципу биометрической проверки liveness для лица человека — это важное усовершенствование антифрод-решений, которое отлично дополняет существующие технологии определения скомпрометированных документов и подтверждения их принадлежности пользователю. Это позволяет усилить защиту конечных пользователей от возможного неправомерного использования их документов», – комментирует CEO и сооснователь Sumsub Андрей Северюхин.

Для российского паспорта повышено качество распознавания печатного и рукописного текста, добавлена возможность автоматического детектирования 18-й и 19-й страниц и значительно улучшено качество распознавания печатных штампов о регистрации. При распознавании бланков российского паспорта Smart ID Engine производит не только контроль типа бланка, но и усиленную проверку, включающую поиск и анализ геометрических отношений специфичных элементов, выявление соответствия цветности бланка документа и печати. Также систему обучили распознавать новые типы свидетельств о рождении, улучшили распознавание водительских удостоверений, СНИЛС, СТС и других документов.

Smart Code Engine обеспечивает автоматическое считывание данных банковских карт, машиночитаемой зоны и баркодов в широком классе условий захвата изображений. Система устойчива к перепадам освещения, ракурсу съемки, перекосам, углу поворота, избыточному и недостаточному освещению. Система работает в реальном времени и способна на современных устройствах распознавать банковские карты и другие объекты со скоростью 25 кадров в секунду.

В платежных сервисах Smart Code Engine позволяет сканировать и распознавать банковские дебетовые и кредитные карты платежных систем МИР, VISA, MasterCard, American Express, JCB, Maestro, UnionPay и Diners Club, выпущенные различными странами мира, обеспечивая извлечение не только номера (12-19 цифр), но и срока действия и имени владельца. Поддерживается распознавание любых видов банковских карт: с нанесением данных выдавливанием (embossed), гравировкой (indent) и плоской печатью (flat printed), с горизонтальным и вертикальным расположением идентификационных данных, и тех карт, на которых данные расположены, как на лицевой, так и на обратной стороне. В новом продукте пользователям стало доступно распознавание банковских карт с номером IBAN, которые широко распространены в странах Евросоюза.

Решение Smart Engines обеспечивает автоматический поиск и распознавание данных машиночитаемых зон документов (MRZ), выполненных в соответствии с установленными международными стандартами ISO/ICAO (IEC 7501-1/ICAO Document 9303 ISO) и локальными (Россия, Франция, Швейцария, Болгария, Эквадор) стандартами, на паспортах, идентификационных картах, визах, водительских удостоверениях и других документах. Пользователям Smart Code Engine при распознавании документов с MRZ доступны инструменты проверки «живости» и консистентности данных.

Smart Code Engine обеспечивает качественное распознавание одно- и двумерных штрихкодов из различных счетов и квитанций, включая счета за коммунальные и государственные услуги, налоговых документов и счетов, а также билетов, чеков, счетов-фактур, ценников, плакатов и объявлений. В новом продукте в 1,5 раза улучшено чтение AZTEC символов за счет внедрения новой технологии определения центров модулей баркодов и PDF417 символов, включая их компактную версию, широко используемую в водительских удостоверениях РФ. Модуль чтения QR кодов, разработанный Smart Engines, теперь способен читать инвертированные коды, а также более устойчив к их ориентации. Сегодня продукт поддерживает распознавание QR Code, AZTEC, PDF 417, Data Matrix, CODABAR, CODE_39, CODE_93, CODE_128, EAN_8, EAN_13, ITF, UPC_A, UPC_E.

«Технологии распознавания Smart Engines дают уникальную возможность бизнесу эффективно внедрять новые практики, не предъявляя высоких требований к захвату изображений и оборудованию для исполнения алгоритмов ИИ. Пользователи могут фотографировать или показывать документ, банковскую карточку или баркод камере как им удобно, при этом все вычисления не требуют высокопроизводительных комплексов и занимают секунды даже на бюджетных телефонах», – говорит вице-президент, директор по информационным технологиям «Тинькофф» Вячеслав Цыганов.

Smart Document Engine решает задачи автоматического извлечения данных из типовых форм документов, форм строгой отчетности, первичных бухгалтерских, финансовых, налоговых, юридических, нотариальных и других документов, используемых в документообороте, различных тестов и опросников, на сканах и фотографиях. Система позволяет автоматически обрабатывать одно- и многостраничные документы с фиксированным положением реквизитов, документы с плавающим расположением блоков и реквизитов, неструктурированные текстовые документы и блоки, таблицы, надписи или даже отдельные строки и метки.

Программный продукт позволяет не только быстро распознавать данные из анкет, форм и документов, но и проверять их на соблюдение формальностей. Smart Document Engine может проверить, есть ли подпись, печать или логотип, правильного ли они цвета, находятся ли они в нужном месте документа, и проверить, что надписи, которые должны быть сделаны от руки, действительно рукописные. Кроме того, в процессе обработки возможна проверка целостности и неизменности бланка, документа или его части. За счет применения технологии GreenOCR® второго поколения время обработки 1 страницы документа А4 на AMD Ryzen 7 3700X составляет порядка 2 секунд.
В коробочном варианте поставки Smart Document Engine поддерживает распознавание справки по форме 2-НДФЛ, формы бухгалтерского баланса (ОКУД 0710001), отчет о финансовых результатах (ОКУД 0710002), свидетельства ИНН и платежное поручение (ОКУД 0401060).

«Новые возможности классификации и распознавания бизнес-документов расширяют область применения программных продуктов Smart Engines в различных каналах обслуживания клиентов и бизнес-процессах в финансовом секторе, телекоме, транспорте, промышленности, ритейле, энергетике, медицине и образовании. Интеллектуальное распознавание широкого класса документов, реализованное в Smart Document Engine, органично дополняет решения для ввода данных удостоверяющих документов и предлагает бизнесу качественно новый уровень автоматизации», – отмечает Дмитрий Силуянов, директор практики блока CRM Лиги Цифровой Экономики, которая внедряет продукты Smart Engines.

Для удобства интеграции разработчикам стали доступны .NET-обертки для Linux-систем, новые улучшенные интерфейсы на C++ и Java, а также обеспечена поддержка React и Flutter для мобильных SDK. Вся линейка продуктов оптимизирована для архитектур «Эльбрус», SPARC, MIPS, ARM, x86 и совместима с операционными системами iOS, Android, МОС «Аврора», «Эльбрус», Linux, Windows, macOS и Solaris. Модульная архитектура обеспечивает минимизацию размера программной библиотеки, так как позволяет конфигурировать SDK под конкретного заказчика и включать в него только необходимую ему функциональность.

Программные продукты Smart Engines успешно решают задачи цифровой трансформации в организациях различных отраслей экономики по всему миру. Технологии используют Билайн, МТС, МегаФон, группа Тинькофф, Альфа-Банк, Газпромбанк, Банк ДОМ.РФ, МКБ, Почта Банк, Росбанк, Банк «Санкт-Петербург», Ситибанк, Банк Хоум Кредит, ФПК РЖД, Туту.ру, KUPIBILET, Альфастрахование, BioCollections Worldwide, BlaBlaCar, Blockpass IDN Ltd, Dukascopy Bank SA, Tessi, VerifyMyAge и др.

«Забота об окружающей среде является одним из ключевых приоритетов деятельности Smart Engines. Этому направлению посвящены наши исследования в области малобитных и биполярных архитектур нейронных сетей, использование которых позволяет минимизировать углеродный след наших моделей искусственного интеллекта на этапах обучения и исполнения. Важно отметить, что ученые и инженеры компании при разработке новых продуктов смогли добиться повышения качества распознавания, добавления новой функциональности и улучшения пользовательского опыта, при этом существенно уменьшив энергопотребление», – сказал генеральный директор Smart Engines, кандидат технических наук Владимир Арлазаров.

Наши клиенты

Делимобиль

Делимобиль использует технологию распознавания Smart IDReader для удаленной верификации клиентов

Ситибанк

Smart Engines выбран поставщиком технологий распознавания документов клиентов АО КБ «Ситибанк»

МТС

В терминалах выдачи сим-карт МТС используются технологии Smart Engines

Аэроэкспресс

Компания «Аэроэкспресс» использует решения Smart Engines для оформления билетов