Семинар для банков и МФО: Мошенничества с поддельными документами: руководство по предотвращению 19 и 22 апреля

22.05.2020 г.

По пути Папы Карло: от деревянного сканера к реальному бизнесу

Сейчас, когда каждый из нас послушно сидит на самоизоляции, мы искренне скучаем по офису, разработке и изобретательству. Помимо софта мы в Smart Engines изобретаем сканирующие программно-аппаратные комплексы. Расскажу о том, как фанерную коробочку с камерой мы довели до полноценного продукта.

Пару слов о том, зачем вообще мы занимаемся изобретением программно-аппаратных комплексов (ПАК). Разве не эффективнее сосредоточить все силы чисто на написании софта? Тут есть несколько соображений. 

Во-первых, распознающие программы часто используются в паре с устройством оцифровки документов. Конечно, в последнее время появляется все больше «цифровых» компаний, которые забыли (а в некоторых случаях даже и не знали) про бумагу. 

Тем не менее, даже если вы разработаете универсальную программу, которая будет совсем неприхотлива и совместима со всеми компьютерами, камерами, сканерами, МФУ, телефонами, планшетами, документными сканерами (прямо как наша Smart IDReader), все равно будьте готовы на презентациях назвать – то есть, извините, – рекомендовать устройства, необходимые для решения задачи ввода паспортных данных.

Во-вторых, по нашему опыту, специальный ПАК зачастую решает задачу намного лучше, а программные и аппаратные части взаимодействуют друг с другом стабильнее, чем если бы это была «сборная солянка». Это легко объяснить на пальцах: за счет ограничения в моделях отладка и тестирование софта и оборудования оказываются проще, что, естественно, повышает общее качество решения. 

Кстати, именно по этой причине софт для iPhone (для которых в каждый момент времени актуальны не более 5–6 моделей) работает стабильнее, чем софт для Android-телефонов. Но это совсем другая история, не будем в нее углубляться. 

И, наконец, в-третьих, ПАК — это что-то физически осязаемое. У ПАК есть физические размеры, масса, цвет и даже запах (кто из нас не любит запах новой техники?). А еще у ПАК, в отличие от того же софта, есть НДС 20%, но про эту неприятную часть бизнеса чуть позже. Давайте переходить к основному содержанию сегодняшней статьи.

Как мы решились делать паспортные сканеры 

Как ни странно, но понимание о необходимости создать устройство сканирования паспортов пришло к нам после того, как мы выпустили свою первую программу распознавания. Пять лет назад мы выпустили первое решение по распознаванию паспорта — Smart PassportReader

Мы безумно гордились достигнутыми ТТХ — распознавание изображения паспорта занимало доли секунды на средненьком ПК. И тут, когда мы начали широким фронтом предлагать решение на рынке, то были ошарашены одним занимательным фактом: «Зачем распознавать так быстро, если сканирование документа длится не меньше 5 секунд?» 

Да-да, это обычная скорость работы типичных планшетных сканеров. Конечно, есть специальные быстрые сканирующие устройства, но и цена у них оказалась «специальной». А как вы понимаете, рынок всегда хочет видеть качественные и недорогие вещи!

Так мы решили сделать свое устройство. Мы щедро выделили на это устройство $100, не уменьшая при этом требований к качеству и скорости получения изображений. Первое (и самое очевидное), что пришло в голову — использование хорошей web-камеры. Тем более распознавать видео мы умеем хорошо. 

Правда, работа с web-камерой требует определенной сноровки: нужно точно позиционировать документ, правильно держать паспорт (не забываем, что паспорт выполнен в виде книжечки), учитывать особенности рабочего место и осветительных приборов (чтобы избежать бликов) и так далее.

Немного поразмыслив, мы решили установить камеру внутрь замкнутого корпуса со стеклянной «крышкой», про который известно все: расстояние от камеры до документа (можно фиксировать фокусное расстояние), параметры освещения всегда одинаковы и не зависят от внешних факторов, паспорт прижимается к стеклянной поверхности, что позволяет легко избежать эффекта книжки.

За длинные холодные зимние каникулы, вооружившись досками и отвертками вместо сноубордов и лыж, мы начали творить устройство. Из дерева.

Несмотря на кажущуюся простоту, получившееся устройство обладает своими нюансами:

– взаимное расположение камеры и светодиодной подсветки должны подбираться исходя из уменьшения возможного отражения от стеклянной рабочей поверхности;
– мощность светодиодной подсветки должна быть достаточной для нормального функционирования камеры, при этом зоны документа не должны быть засвечены;
– расстояние от камеры до рабочей поверхности должно быть подобрано так, чтобы получить документ в максимальном разрешении.

А вот краткая смета стройматериалов, которые пошли на изготовление. Как видите, в заветные 100 долларов мы уложились с запасом.

– Мебельные панели (ЛДСП) 16 мм 200 рублей.
– Стекло оконное 4 мм 100 рублей.
– Фурнитура (саморезы + держатели + планка) 200 рублей.
– Светодиоды, батарейки, провода 500 рублей.
– FullHD web-камера 5000 рублей.

Вот как работал наш деревянный друг на практике:

Буквально сразу же после успешных испытаний получившегося сканера мы поняли, что пустое пространство внутри следует использовать по назначению: расположить вычислительный модуль, чтобы перенести всю нагрузку по распознаванию на плечи сканера. 

Так мы пришли к автономному сканирующему устройству. За счет широкого спектра интерфейсов возврата распознанной информации (наш автономный сканер паспортов умеет даже «притворяться клавиатурой», чтобы возвращать распознанные данные) сканер мог использоваться даже в тех случаях, где присутствуют проблемы с интеграцией сторонних программ.

Демонстрация работы нашего первого автономного паспортного сканера

От поделки к бизнесу 

Достигнутый успех мы решили трансформировать в рабочий бизнес. И сейчас опишем шаги, которые мы сделали ради этого (ведь vc.ru — площадка для описания бизнеса и технологий, а не для инструкций о том, как скручивать два листа ЛДСП).

Итак, первый шаг, который мы сделали, обеспечили себя правовой защитой, подав заявки на регистрацию изобретений и полезных моделей. 

Без какого-либо сарказма заявляем, что наличие честных зарегистрированных результатов интеллектуальной деятельности (РИД) — очень важный элемент бизнеса, который выстреливает несколько раз: обеспечивает правовую защиту продуктов, поднимает стоимость компании, повышает доверие со стороны партнеров и контрагентов. 

С патентами тянуть не стоит, зачастую достаточно рабочего прототипа, а иногда даже четко описанной идеи. Мы зарегистрировали как патент на полезную модель, так и патент на изобретение:

– Патент на полезную модель № 166038 «Автоматизированное рабочее место контроля паспортных документов».
– Патент на изобретение № 2643130 «Автоматизированное рабочее место контроля паспортных документов».

Вторым шагом был выбор организационной формы нашего нового направления. Понимая, что серьезное развитие нового бизнес-направления потребует полного задействования наших административных ресурсов и может нанести серьезный урон нашему основному направлению — разработке распознающего софта, мы приняли решение о создании спин-оффа. 

Точнее, сразу двух: первый должен развивать «простую и дешевую» модификацию паспортного сканера для масс-маркета, а второй — наладить производство «продвинутых и дорогих» устройств, содержащих внутри автономные вычислители для решения задачи распознавания. За собой мы оставили важную роль супервайзера.

Идея разбить бизнес паспортных сканеров на два независимых направления была совсем не случайна. Хотя на тот момент у нас практически не было опыта производства конечного изделия, мы четко видели разницу между двумя классами устройств (и это разница была не только в функциональных характеристиках, но и конструкторских особенностях, организации производственного процесса, рынках сбыта).

Для развития первого класса устройств («дешевых» сканеров для масс-сегмента) мы искали команду, способную быстро организовать малый бизнес и поставить на конвейер первые серийные образцы, выполняя развитие и модернизацию сканера в процессе жизненного цикла. 

К счастью, нам удалось найти ребят, которые взяли на себя всю рутинную работу по разработке нормального корпуса (напомню, в первых образцах он был ил ЛДСП), сертификации, производства и логистики. 

Знали бы вы, сколько термопластика было израсходовано прежде, чем удалось изготовить пригодные для конвейерной сборки и последующей эксплуатации корпуса! В результате вышло надежное устройство, крайне востребованное особенно при организации СКУД и гостиничном бизнесе.

Маленький отступ к бухгалтерской составляющей и способу реализации товара. Несмотря на то, что ПАК является целостным устройством, выполняющим понятную бизнес-функцию (распознавание документов), для конечных клиентов с точки зрения налогов оказывается более выгодна продажа его «по частям»: отдельно сканер паспортов (облагается НДС 20%), отдельно софт (не облагается НДС). 

При такой схеме не происходит «лишней» накрутки налога на распознающий софт (который по факту немало стоит). Несмотря на финансовое преимущество, у этой схемы есть недостаток: в случае возврата ПАК (при поломке аппаратной части или какой-либо другой причине) вернуть удастся только стоимость непосредственно сканера.

Устройства второго класса («дорогие» автономные модели) по нашему замыслу должны были производиться на серьезном российском (лучше — оборонном) предприятии и быть работоспособными в самых непредсказуемых условиях. А еще выглядеть солидно.

Серьезность наших намерений закономерно потребовала от нас большего вложения сил. Выбранный нами оборонный завод не хотел запускать производство по простым «чертежам на клетчатой бумаге». 

Нам пришлось разработать полный комплект конструкторской документации, чтобы хоть как-то приблизиться к заветной цели. Потом мы столкнулись с проблемами поставки комплектующих из-за границы (про это, если вдруг вам интересно, мы напишем отдельный пост с перечислением рабочих лайфхаков). 

Организация линии сборки, обеспечение процедуры тестирования готового изделия, проработка схемы обновления встроенного программного обеспечения — все это новые дисциплины, с которыми нам, разработчикам софта, пришлось в оперативном режиме ознакомиться. Хотя, с другой стороны, это было время частых командировок! Но главное — достойный результат, которым мы гордимся!

А что после наладки производства? 

Прошло уже где-то два года с того момента, как мы закончили организацию производства обоих классов устройств. Наблюдая, как растут объемы продаж, мы понимаем, что наши сканеры нашли свою целевую аудиторию. 

Приятно осознавать, что твое изобретение (в прошлом — фанерный ящик, скрученный на даче шуруповертом) сегодня помогает людям быстрее справляться с рутиной ввода персональных данных. Конечно, пока не все проходные, офисы финансовых организаций и билетные кассы оборудованы нашими сканерами, мы твердо видим вектор в светлое будущее и четко следуем выбранному направлению.

Рубрика «Вопросы и ответы» 

В процессе экспериментальной разработки и производства мы постоянно наталкивались на «критику» и предсказание фейла. В конце нашей статьи хотим «пересказать» эту критику в формате «вопрос-ответ»

1. Паспорта все равно не будут распознаваться качественно. Шрифт в паспортах разный, текст печатается со смещением, нет полных баз фамилий, имен и отчеств, не говоря уже об органах выдачи

Это наш любимый вопрос. Мы разработали свой собственный софт распознавания документов — Smart IDReader, который точно распознает омнифонтовое заполнение и рукопись, делая это без всяких баз, умеет находить и классифицировать документы в условиях разного освещения, ракурсов съемки и много еще чего умеет, даже проверять подлинность документов. 

2. Для качественной работы нужна качественная камера и оптика. Они стоят дорого, никто не будет много платить за такие устройства.

Качество светочувствительной матрицы и линзы должно быть ровно таким, чтобы обеспечивать высокий уровень распознавания с помощью конкретной программы. 

Поэтому в данном случае все зависит только от софта. Мы смогли научить систему качественно распознавать изображения, полученные на китайскую камеру за $50.

3. Ваш прибор — это просто камера в ящике. Что тут хитрого?

Просчитанная оптическая система сканера включает не только выбор модели камеры, но и подбор других элементов (подсветка, светоотражатели, рабочую поверхность), а также взаиморасположение всех перечисленных элементов.

Если пропустить этот важный этап создания сканирующего устройства, а просто тупо засунуть камеру в ящик, то результат будет очень посредственный, даже при использовании хорошей камеры и линзы.

4. Весь распознающий софт и драйвера таких специфических устройств работают только под Windows. А бизнес сейчас смотрит в сторону открытых операционных систем.

Smart IDReader поддерживает целый спектр процессорных архитектур и совместим с огромным количеством операционных систем (см. спецификацию). Мы работаем даже на такой экзотике, как «Эльбрус» и «Комдив».

5. Одним паспортом РФ не ограничится. Надо поддерживать все документы, иначе смысла нет. А сделать это не получится, так как достать шаблоны всех паспортов мира шансов нет.

Насчет шаблонов для других стран, конечно, никто не дает изображения, содержащие персональные данные, — это просто нарушает закон. Но существуют базы данных, в которых есть образцы (изображения) паспортов всех стран. И тут опять вопрос к софту — достаточно ли будет такого общедоступного изображения для качественного решения задачи? Нам — хватает.

Узнайте больше о программном продукте Smart IDReader и его применении
Подробнее о Smart IDReader
Распознавание паспорта РФ
Сканеры паспортов Smart Engines

Скачайте мобильное демоприложение и попробуйте технологию распознавания Smart IDReader в действии

    

Тинькофф Банк

Smart Engines поставляет мобильные и серверные решения по распознаванию документов Тинькофф Банку

Альфа-Банк

Альфа-Банк распознает документы клиентов в мобильном приложении с помощью Smart ID Engine

Банк «Открытие»

Банк «Открытие» увеличит продажи кредитных продуктов за счет внедрения технологии распознавания документов Smart Engines на сайте

Газпромбанк

Газпромбанк внедрил решение Smart Engines на основе искусственного интеллекта для распознавания QR-кодов

Заказать продукт

Для заказа решений, получения подробной информации или триал версий заполните приведенную ниже форму, и мы обязательно с Вами свяжемся.

    Array ( )