07.12.2017 г.

Российские ученые из Smart Engines победили в международном соревновании по бинаризации документов

Команда Smart Engines заняла первое место в международном конкурсе по бинаризации документов DIBCO 2017 (Document Image Binarization COmpetition). Итоги девятого ежегодного конкурса по бинаризации были объявлены на ведущей научной конференции по распознаванию документов ICDAR (International Conference on Document Analysis and Recognition), прошедшей 9-15 ноября 2017 г. в городе Киото (Япония).


Диплом ICDAR-DIBCO

Второе и третье места заняли научные коллективы Института Автоматики Китайской академии наук и Национального университета Чоннам (Южная Корея) соответственно.

ICDAR — академическое мероприятие, посвященное анализу и распознаванию документов. Конференция проводится один раз в два года в разных городах мира. В рамках конференции организуются различные конкурсы, цель которых показать текущие научные достижения в области технологий компьютерного зрения для обработки документов.

В конкурсе DIBCO 2017 приняли участие 18 команд из Индии, Китая, США, Южной Кореи, Пакистана, Испании, Алжира, Бразилии и Швеции, которые представили 26 различных алгоритмов бинаризации. 12 команд, в том числе и Smart Engines выставили по одному алгоритму, 5 команд по 2 алгоритма и 1 команда – три алгоритма.

Список участников конкурса:

— Brigham Young University, UT, USA
— School of ICT, Griffith University, Australia; CVPR Unit, Indian Statistical Institute, India; School of Software, University of Technology Sydney
— Hubei University of Technology, Wuhan, P.R. China
— Jadavpur University, India
— Document Image and Pattern Analysis (DIPA) Center, Islamabad, Pakistan
— Northwest MinZu University, China
— University of Alicante, Spain
— Institute of Automation, Chinese Academy of Sciences, Beijing, P.R, China
— École nationale supérieure d’informatique (ESI), Algiers, Algeria
— Smart Engines, Moscow, Russia
— Institute of Mathematics and Statistics (IME), University of São Paulo (USP), Brasil
— Chonnam National University, Gwangju, South Korea
— Blekinge Institute of Technology, Karlskrona, Sweden
— Jinling Institute of Technology, Jiangsu Province, P.R. China
— Larbi Tebessi University, Tebessa, Algeria and Ecole nationale Superieure d’Informatique (ESI), Algiers, Algeria
— Aliah University, Kolkata, India
— Institute of Automation, Chinese Academy of Sciences, Beijing, P.R. China
— Uppsala University, Uppsala, Sweden

Особенностью конкурса является то, что ни одно изображение проверочного набора конкурсантам заранее не предоставляется и для настройки алгоритмов доступны лишь данные предыдущих соревнований. Традиционно организаторы разделяют задачу бинаризации на два направления — обработка изображений документов с печатным и рукописным текстом. Для оценки предложенных участниками конкурса методов используются установленные оценочные показатели эффективности.

При этом, данные для проверки алгоритмов каждый раз содержат свою собственную «изюминку», отличающую их от предыдущих конкурсов. Например, это может быть наличие на изображениях тонких «акварельных» текстовых начертаний или просвечивающих с противоположной стороны символов. Методика проведения конкурса DIBCO позволяет показать не только текущее состояние науки, но и возможности современных алгоритмов для решения актуальных практических задач.

Представленный командой Smart Engines алгоритм бинаризации получил максимальную оценку не только в общем зачете, но и в каждой из двух категорий конкурса. В первой оценивались возможности обработки изображений рукописных документов, а во второй — документов с печатным заполнением.

Для конкурса командой Smart Engines была обучена искусственная нейронная сеть архитектуры U-net, чья архитектура изначально разрабатывалась для решения задач интеллектуальной обработки изображений. Ее ключевое преимущество состоит в том, что для обучения сети можно использовать относительно небольшое число исходных изображений. Это связано с тем, что сеть имеет сравнительно малое число весов за счет своей сверточной архитектуры. Важным соображением было и то, что большой класс известных алгоритмов бинаризации явно выразим в такой архитектуре. Реализованная командой подходящая схема аугментации данных позволили существенно повысить релевантность исходных данных, а также построить процесс быстрого пополнения обучающей базы на изображениях, извлеченных из открытых архивных источников.

«Важность конкурсов подобных DIBCO сложно переоценить. Команды со всего мира получают возможность представить свои научные достижения и показать их применимость на реальных задачах компьютерного зрения», — сказал генеральный директор Smart Engines к.т.н. Владимир Арлазаров.

Наши клиенты

Jumio

Ведущий мировой разработчик инструментов идентификации для платежных систем компания Jumio использует решения Smart Engines

Facebook

Решения Smart Engines по распознаванию банковских карт и MRZ-строки документов используются компанией Facebook.

Navicon

Smart Engines является технологическим партнером одного из лидеров российского рынка ИТ-консалтинга компании Navicon

BeepCar

Сервис для поиска попутчиков BeepCar использует Smart IDReader для проверки паспортов пользователей