Smart Engines 2021: Международная награда в ИТ-инновациях

Система оптического распознавания документов (OCR)

Омнифонтовое (шрифтонезависимое) распознавание текста документов на 102 языках.

Автоматический поиск документа на фотографиях и сканах, даже если он был сложен или помят.

Скорость достигает 15 страниц в секунду на сервере без применения GPU.

Распознавание документа А4 на смартфоне за 2-3 секунды.

On-premise – работает в контуре и автономно на мобильных телефонах. Без риска утечки данных и коммерческой тайны.

Запись в реестре ПО Минцифры РФ №9617 от 15.03.2021

OCR AI для омниканального автоматического ввода текста

  • GreenOCR®экологичный искусственный интеллект распознавания текста
  • OCR система для распознавания текста документа на 102 языках
  • Высокоточное распознавание текста по фото и распознавание текста сканированного документа
  • Система оптического распознавания текста на собственной технологии OCR
  • Распознавание рукописных текстов и пометок
  • OCR документа в мобильном, веб, десктоп и серверном приложении
  • Автоматизация ввода текста документов для СЭД и электронных архивов

Smart Document Engine — российская система полнотекстового распознавания (OCR) для десктопных, серверных и мобильных платформ.

Smart Document Engine OCR использует современные методы искусственного интеллекта для распознавания текста в потоке изображений (фотографии или сканы). Автоматически находит и распознает печатные текстовые данные на 102 языках, включая русский, английский и другие языки с кириллическим и латинским алфавитом, армянский, греческий и др.

 

Разработанная учеными и инженерами нашей компании в рамках инициативы Green AI (“зеленого” искусственного интеллекта) технология оптического распознавания текста GreenOCR® обеспечивает непревзойденное качество и скорость распознавания текста при минимальном потреблении энергии и воздействии на окружающую среду. Скорость достигает до 15 страниц в секунду на сервере без применения GPU и полностью обрабатывает фотографию листа А4 за 3-4 секунды на смартфоне, сохраняя при этом высочайшую точность распознавания текстовых данных. Smart Document Engine распознает текст, даже если документ до этого был сложен или помят.

 

При использовании Smart Document Engine НЕ требуется выполнять дополнительных действий, связанных с получением согласия субъекта на обработку его персональных данных.

 

Юридическое заключение об обработке персональных данных с помощью продуктов Smart Engines »

 

Полная информация о программном продукте Smart Document Engine »

Легкая интеграция без нарушения привычных процессов

Smart Document Engine является уникальным инструментом, позволяющими гибко интегрировать полнотекстовое распознавание в текущую деятельность компании. Программа легко и удобно встраивается в уже существующие бизнес-процессы, не нарушая привычного опыта использования. Решение доступно для интеграции с различными информационными системами, например, ECM, CRM, RPA, АБС и т.д.

Для чего нужно полнотекстовое распознавание Smart Document Engine?

Полнотекстовое распознавание является ключевым элементом ввода документов в системах электронного документооборота, управления бизнес-процессами, электронных архивах и RPA-системах.

 

Высокая скорость и точность извлечения данных системой Smart Document Engine позволяет вывести автоматизацию процессов обработки документов на принципиально новый уровень.

Как работает полнотекстовое распознавание

Исходное изображение
Визуализация найденных текстовых объектов
Результаты распознавания (по строкам)
Исходное изображение Визуализация найденных текстовых объектов 1: ДОВЕРЕННОСТЬ
2: НА ПОЛУЧЕНИЕ ДОКУМЕНТОВ
3: ДВАДЦАТЬ СЕДЬМОЕ МАРТА ДВЕ ТЫСЯЧИ СЕМНАДЦАТОГО ГОДА
4: ГОРОД САНКТ-ПЕТЕРБУРГ
5: Я, ГРАЖДАНКА РОССИЙСКОЙ ФЕДЕРАЦИИ, ИМЯРЕК АННА СЕРГЕЕВНА, ДАТА РОЖДЕНИЯ
6: 01.01.1991 Г., ПРОЖИВАЮЩАЯ ПО АДРЕСУ:
7: ПАСПОРТ 00 00 000000, ВЫДАН 2 АПРЕЛЯ 2012 ГОДА УФМС РОССИИ ПО АЛТАЙСКОМУ

Функциональные особенности
Smart Document Engine OCR

1Система позволяет делать опциональный предварительный поиск и ректификацию изображения документа на исходном изображении (фотографии, скане и т.д.)
2Помимо строковых результатов распознавания, система предоставляет координаты текстовых объектов на исходном изображении и оценки уверенности распознавания на уровне символов, слов или строк
3Система может быть использована для распознавания присутствующего текста как на изображении документа целиком, так и на изображениях отдельных фрагментов документа
4Не требуется связь с внешними сервисами или ресурсами, все вычисления производятся непосредственно на вызывающем устройстве. Smart Document Engine OCR может быть развернута на on-premise сервере, персональном компьютере, в рамках автономного мобильного приложения, а также в веб-приложении.
5Поддерживается распознавание входных изображений в форматах JPG, PNG, TIFF. Распознавание документов в PDF и других форматах выполняется после конвертации в один из поддерживаемых форматов растровых данных.
6Существует возможность упаковки изображения в формат PDF/A с текстовой информацией

Российское ПО распознавания

Конфиденциальность и безопасность

Конфиденциальное и безопасное распознавание паспорта

Программное обеспечение Smart Document Engine:

 

  • НЕ использует код Open Source и иностранные программные компоненты, обеспечивая технологический суверенитет
  • НЕ передает личные данные ваших клиентов на обработку в сторонние сервисы и/или третьим лицам для ручного ввода
  • НЕ сохраняет данные: вся обработка ведется в локальной оперативной памяти устройства – 100% on-premise
  • НЕ требует сетевого соединения
  • НЕ использует технологии: HITL(human in the loop), CrowdSourcing, Mechanical Turk и аналоги, удаленных, облачных или внешних верификаторов
Юристы предупреждают:
вас не защитят лицензии и сертификаты сервисов распознавания при утечке данных
Юристы предупреждают

Никакие гарантии, сертификаты и прочие документы, предоставляемые сервисами обработки персональных данных и документов, составляющих коммерческую, служебную и государственную тайну, не защищают компании от репутационных рисков и финансовой ответственности.

 

“Компании, передающие данные своих клиентов на обработку третьим лицам, в случае утечки лишаются права ссылаться на нарушение ее прав третьими лицами и всю ответственность перед контрагентами принимают на себя.” – заключили юристы компании “INTELLECT”, входящей в группу самых успешных российских юридических компаний по версии международного рейтинга The Chambers Europe.

 

Читать полное юридическое заключение.

Преимущества полнотекстового
распознавания Smart Document Engine

Smart Document Engine — это запатентованная система полнотекстового распознавания. Искусственный интеллект (ИИ) автоматически обрабатывает и вводит текстовые данные документов с высокой скоростью и точностью.
Многозадачность и массовый ввод

Только ИИ и ничего лишнего

ИИ работает автономно: без облачных решений (SaaS), операторов, толоки и сторонних сервисов. Конфиденциально и безопасно. 100% on-device / on-premise

Широкий перечень документов

Точность распознавания данных

Никаких трат времени и средств на ошибки сотрудников с новейшим высокоточным GreenOCR®, разработанным учеными нашей российской компании

Скорость, не имеющая российских аналогов

Скорость без аналогов в России

На 32-х ядерном HPC без применения GPU скорость полнотекстового распознавания достигает 15 страниц в секунду

Для множества платформ и ОС

Для множества платформ и ОС

Windows, Linux, Эльбрус, Альт Линукс, macOS, React Native, Flutter, 1C, Android, iOS, Salfish Mobile, Аврора, Комдив, Baikal и другие

100+ языков и считывание печатей

100+ языков и считывание печатей

Распознает текстовые данные документов на 100+ языках, включая кириллицу, латиницу, армянский, арабский, персидский, урду, японский, китайский, корейский и другие

Точность распознавания данных

Не требует GPU и легко интегрируется

Программа (SDK) легковесна и не требует значительных вычислительных мощностей или больших объемов памяти. Легко интегрируется в уже существующие бизнес-процессы. Сотрудников не придется обучать навыкам работы с ПО.

Комфортное использование

Комфортное использование

Устойчивость к перепаду освещения, ракурсу съемки и перекосам. Без прицеливания в рамку, подготовки качественного фото, картинки, изображения или другой предварительной подготовки документа к распознаванию.

Попробуйте качество наших технологий

  • Скачайте демоприложение, в котором все возможности собраны воедино
  • Можно на время отключить интернет, чтобы убедиться, что изображения и ваши данные не передаются
  • Извлекайте данные паспортов, удостоверений личности, банковских карт, баркодов, СТС, счетов-фактур и других деловых документов. Пробуйте распознавать оригиналы и копии при различных условиях съемки.
  • Обратите внимание на высокую скорость распознавания и на измеримую вероятность точности распознавания для каждого элемента. Если SDK установлено на ваш сервер, скорость распознавания будет еще в десятки раз выше.

Как происходит интеграция полнотекстового распознавания Smart Document Engine

Программа Smart Document Engine поставляется для десктопных, серверных и мобильных приложений в виде автономного SDK (software development kit), содержащего все необходимые прекомпилированные библиотеки, документацию программного интерфейса и примеры интеграции для различных языков программирования.

 

Для разработчиков подготовлен простой, но многофункциональный API (application programming interface), который позволяет внедрить распознавание текста документов (OCR) в решения с использованием языков C++, C#, Java, Python и Objective-C для широкого круга операционных систем: iOS, Android, Linux, Windows, MacOS, в том числе Sailfish Mobile, МОС “Аврора”, ОС Эльбрус, РЕД ОС, Astra Linux и другие. Обеспечивается поддержка следующих аппаратных платформ: x86_64, ARM v7, v8 (Aarch32, Aarch64), MIPS, Эльбрус. Имеется возможность настройки и подключения к популярным фреймворкам RPA и продуктам 1С по запросу.

Больше возможностей в одной интеграции

При необходимости ввода документов, удостоверяющих личность, технология органично дополняется нашим продуктом Smart ID Engine, который с высочайшим качеством и скоростью распознает паспорта РФ и другие удостоверения личности.

 

Распознавание кодифицированных объектов, таких как банковские карты и баркоды, доступно за счет использования Smart Code Engine.

 

Важным аспектом Smart Document Engine является возможность создания специализированных решений для конкретных заказчиков, позволяющих производить автоматическую обработку, классификацию, распознавание и анализ бумажных документов, форм и отсканированных pdf (пдф) файлов любой сложности.

 

Заказные решения позволят вашей организации снизить издержки и нагрузку на персонал, внедрив высокоэффективное и высокоточное поточное сканирование и распознавание документации, оптимизированное под конкретный поток данных и под существующие бизнес-процессы, при этом исключив передачу каких-либо данных сторонним онлайн-сервисам или третьим лицам.

Спецификация

  • Android (версии 5.1 и выше)
  • iOS (версии 9 и выше)
  • Sailfish Mobile OS (версии 2.2 и выше)
  • OC Аврора (версия 3.1.0 и выше)
  • MS Windows (все официально поддерживаемые правообладателем версии)
  • Семейство ОС, основанных на ядре Linux (включая Ubuntu 14.04 и выше, CentOS 6 и выше, SUSE Linux Enterprise Server 12 и выше, Astra Linux 1.6 и выше, РЕД ОС 7 и выше)
  • macOS (версии 10.13 High Sierra и выше)
  • ОС Эльбрус (версии 8.11 и выше)
  • x8,
  • x86_64
  • ARMv7-v8 (AArch32 и AArch64)
  • MIPS (MIPS32 и MIPS64)
  • Elbrus
  • Эльбрус-4С
  • Эльбрус-8С
  • Эльбрус-8СВ
  • Эльбрус-1C+
  • Эльбрус-2С+
  • Эльбрус-16C
  • КОМДИВ-32 (1890ВМ2Т, 5890ВЕ1Т, 1900ВМ2Т)
  • КОМДИВ-64 (1890ВМ5Ф, 1890ВМ6Я, 1890ВМ8Я)
  • КОМДИВ-128 (1890ВМ7Я, 1890ВМ9Я)
  • Baikal-T1
  • Baikal-M
  • Кириллица (Русский, Абхазский, Белорусский, Болгарский, Казахский, Киргизский, Монгольский, Осетинский, Сербский, Таджикский, Узбекский, Украинский)
  • латиница (Английский, Азербайджанский, Аймара, албанский, африкаанс , Берберский, Боснийский, Венгерский, Волеаи, гаитянский креольский, датский, зулу, Индонезийский, Ирландский, Исландский, Испанский, Итальянский, Кантонский, Кастильский, Каталонский, Кечуа, коморский, Коса, Латышский, Литовский, Люксембургский, Македонский, Малайский, Мальтийский, Мандарин, Маори, молдавский, науруанский, ндау, ндебеле, Немецкий, Нидерландский, Норвежский, палауский, Польский, Португальский, Руанда, румынский, рунди, свази, северный сото, Сейшельский креольский, сесото, Словацкий, Словенский, Сомалийский, суахили, тамазайт, тетум, ток-писин, Тонга, тсвана, тсонга, Турецкий, Туркменский, Фиджи хинди, Фиджийский, Филиппинский, Финский, Французский, Хорватский, чева, чешский, чибарве, чичева, шангани, шведский, Шона, Эстонский, Южный ндебеле)
  • Китайский (классический, 20 000 иероглифов)
  • Японский (Хирагана, Катакана и Кандзи)
  • Корейский (Хангыль)
  • Сингальский
  • Греческий
  • Грузинский
  • Армянский
  • Иврит
  • Арабский
  • Фарси
  • Урду
  • Тамильский
  • Тайский

Smart Document Engine содержит API для следующих языков программирования:

  • C (стандарт С11 и выше)
  • С++ (стандарт С++11 и выше)
  • C# (версия 6.0 и выше)
  • Java (версия 1.7 и выше)
  • Python (версия 3.7.2 и выше)

Интеграция с использованием других языков программирование обсуждается отдельно.

По любым вопросам просим написать на почту sales@smartengines.com.

Заказать продукт

Для заказа решений, получения подробной информации или триал версий заполните приведенную ниже форму, и мы обязательно с Вами свяжемся.

    Тинькофф Банк

    Smart Engines поставляет мобильные и серверные решения по распознаванию документов Тинькофф Банку

    Альфа-Банк

    Альфа-Банк распознает документы клиентов в мобильном приложении с помощью Smart ID Engine

    Банк «Открытие»

    Банк «Открытие» увеличит продажи кредитных продуктов за счет внедрения технологии распознавания документов Smart Engines на сайте

    Газпромбанк

    Газпромбанк внедрил решение Smart Engines на основе искусственного интеллекта для распознавания QR-кодов

    Заказать продукт

    Для заказа решений, получения подробной информации или триал версий заполните приведенную ниже форму, и мы обязательно с Вами свяжемся.

      https://kikonline.ru/Array ( )