Разделы

Бизнес Цифровизация Документооборот Облака

Владимир Арлазаров, Smart Engines: Мы создали ИИ, который за 1 минуту помогает оформить 100 новых сотрудников

В России кадровые процессы стремительно уходят от бумаги: с 2020 года введены электронные трудовые книжки, а документы можно подписывать с сотрудником в рамках кадрового электронного документооборота (КЭДО). «Последним бастионом» бюрократии оставался ручной ввод данных из бумажных документов кандидата в систему учёта. Именно эту болевую точку закрывает новый программный продукт Smart Engines: за одну минуту ИИ на серверном CPU автоматически распознает и вводит 100 комплектов кадровых документов. О том, как искусственный интеллект окончательно побеждает бюрократию в кадрах и повышает эффективность работы кадровой службы, в интервью CNews рассказал генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.

CNews: Сегодня на рынке HR — десятки ИИ-инструментов, которые анализируют резюме и проводят первичные интервью. А ваше решение — про что? Какую задачу оно берёт на себя в процессе найма?

Владимир Арлазаров: Сейчас действительно как никогда много HR-разработок для подбора персонала. Но после выбора кандидата кадровая служба сталкивается с не менее важной задачей — оформлением нового сотрудника. Необходимо обработать десятки документов: паспорта, дипломы, трудовые книжки, военные билеты и другие бумаги. Ручной ввод данных отнимает часы работы — и у кадровика, и у самого кандидата.

Именно эту проблему и решает Smart Document Engine. Он автоматически распознает и извлекает данные из любых кадровых документов, даже сканов и фотографий низкого качества, и с рукописным заполнением. В отличие от классических OCR-систем, мы не ограничиваемся простым распознаванием. Наш ИИ понимает структуру документа, а не просто текст, и потому выдает готовые к загрузке в систему КДО данные. Система за доли секунды обрабатывает полный комплект документов и моментально возвращает извлеченное и структурированное содержимое.

Smart Document Engine автоматически распознает и извлекает данные из любых кадровых документов

CNews: Какие типы и форматы документов уже умеет распознавать ИИ-система Smart Engines и приходилось ли оперативно добавлять принципиально новые виды?

Владимир Арлазаров: На сегодняшний день наша система умеет распознавать порядка 4,5 тысяч шаблонов документов всех стран мира. В первую очередь это документы, удостоверяющие личность граждан Россиипаспорт РФ, СНИЛС, ИНН, свидетельства ЗАГС, а также широкий набор документов об образовании — от школьных аттестатов и дипломов до ученых степеней советского и российского образцов, включая документы ближайших стран, откуда идут миграционные потоки.

Система также работает с бумажными трудовыми книжками и СТД-Р, другими электронными документами, которые часто все равно приходится печатать. Фактически весь набор, необходимый для трудоустройства и регулирования, покрыт: от стандартных удостоверений и дипломов до специфических документов для отдельных профессий, например, врачей, учителей, сварщиков или трактористов.

При необходимости можно настроить распознавание и собственных типовых форм — например, согласия на обработку персональных данных или корпоративных анкет и заявлений. Такие «кастомные» документы часто требуется заполнять новым сотрудникам, и для решения этой задачи мы создали дизайнер форм. С ним настроить распознавание нового типа документов сможет сотрудник без навыков программирования и не обращаясь к нам.

CNews: Какие плюсы дает бизнесу внедрение вашего решения? Для каких отраслей оно актуально прежде всего?

Владимир Арлазаров: Мы работаем с заказчиками из самых разных сфер. В первую очередь это банки, страховые компании, ритейл, телеком, крупное производство и другие сферы с большим объемом документов и штатом на сотни человек. Экономически наш ИИ интересен для всех средних и крупных компаний, но чаще всего клиенты обращаются к нам в момент быстрого роста. Когда, например, требуется большое количество сотрудников, а кадровая служба не справляется с нагрузкой. В такие моменты проблема оперативного ввода данных стоит особенно остро — именно ее призван решать Smart Document Engine.

Владимир Арлазаров, Smart Engines: Экономически наш ИИ интересен для всех средних и крупных компаний

После внедрения системы все необходимые сведения о соискателе вводятся в учетную систему. В результате эффективность кадровой службы существенно повышается, и компания может поддерживать рост без задержек и организационных проблем. Если же говорить об экономическом эффекте, то его наши клиенты отмечают сразу: затраты снижаются, при этом уровень удобства и надежности работы существенно растет.

CNews: Какая производительность у вашего решения? Если у сотрудника кадровой службы на ввод данных уходит, к примеру, полчаса, то сколько времени потребуется вашей системе?

Владимир Арлазаров: Наши исследователи проводили замеры на базовых комплектах документов, которые требуются при трудоустройстве в классических сценариях. Такой набор включает 12 документов: основной разворот паспорта, страницу с пропиской, СНИЛС, водительское удостоверение, свидетельства о браке и рождении, ИНН, трудовая книжка и СТД-Р, военный билет, загранпаспорт и диплом магистра. И наша ИИ-система отлично себя показала: 100 таких комплектов ИИ распознает за 1 минуту без GPU. Время отклика составляет пару секунд при пиковой нагрузке.

CNews: За счет чего достигается такая производительность системы? На какой технологической основе построена платформа?

Владимир Арлазаров: Мы никогда не использовали и не используем сторонние решения при разработке системы. Вся математика и алгоритмы распознавания разработаны нашей командой от начала и до конца. Это залог нашего успеха. За каждым элементом технологии стоят серьезные научные исследования в области ИИ, передовые методы обработки изображений. Наши ученые — авторы научных статей, патентов, среди них 5 докторов и 15 кандидатов наук. Именно эта глубокая экспертиза позволила нам выйти на новый уровень и задать стандарты в индустрии.

CNews: Справляется ли система с распознаванием документов, содержащих рукописное заполнение?

Владимир Арлазаров: В 2020 году, пять лет назад, представили первую версию системы, которая распознавала паспорта с рукописным заполнением. Пришлось решать серьезные научные задачи, и мы гордимся достигнутыми результатами. Нами был разработана нейросетевая архитектура «Да Винчи», которая сегодня распознает все страницы с рукописью, в том числе со штампами о прописке. В отрасли шутят, что ужас любого распознавателя — это рукописное слово «шиншилла»: в отличие от печатного текста в беглой рукописи не ясно даже, какие крючки относятся к какой букве. Напишите слитно слово «шиш», и вы поймете, о чем речь. Но мы научились устойчиво решать и эту проблему.

Сейчас мы распознаем рукопись в любых документах. Система распознает именно то, что написано. В отличие от методов, которые используют лингвистический контекст, мы не «угадываем» и не додумываем, а фиксируем точное содержимое документа. В работу должно уйти ровно то, что было на бумаге, и наша задача — обеспечить максимально точное и надежное чтение даже самых сложных экземпляров.

CNews: Может ли решение помочь при трудоустройстве зарубежных сотрудников?

Владимир Арлазаров: Разумеется, причем речь не только о гражданах СНГ. Наш ИИ умеет сканировать документы Китая, Индии, Пакистана и любых других регионов мира. Smart Document Engine поддерживает более ста языков, включая сложные письменности — грузинский, армянский, греческий алфавиты, иврит, а также ряд азиатских систем письма — хинди, иероглифические системы Китая, Японии.

ИИ умеет сканировать документы Китая, Индии, Пакистана и любых других регионов мира

Это особенно важно при вводе и проверке документов, выданных в других странах: именно здесь у бизнеса серьезная «боль». Для человека незнакомая структура, язык и формат полей — серьезный барьер: где номер документа, где дата выдачи, как различить имя и фамилию, что из этого серия, а что код подразделения? Система снимает эту нагрузку: она «знает», где и какой реквизит находится в конкретном типе документа, автоматически извлекает нужные данные.

CNews: Сейчас наблюдается рост мошенничества с поддельными документами — подделывают как документы, удостоверяющие личность, так и документы формата А4, например, дипломы и аттестаты. Помогает ли ваше решение справиться с этими угрозами?

Владимир Арлазаров: Да, такие случаи действительно выявляются. Наша система оснащена специальной мультимодальной ИИ-моделью «Шерлок 2o». Он способен одновременно работать с изображениями документов из оптического, ультрафиолетового и инфракрасного спектров, видео-последовательностями с документом, текстовыми полями, данными с бесконтактной RFID микросхемы, штрих-кодами, метаданными и сигнатурами. В общей сложности модель проверяет документы по 600 параметрам и фиксирует попытки мошенничества с минимальным количеством ложных срабатываний.

Мультимодальная ИИ-модель «Шерлок 2o» сумеет отличить поддельный диплом от настоящего

«Шерлок 2о» с мультиспектральным сканером паспортов уже применяется, например, в аэропортах Шереметьево, Внуково и Кольцово и работает на уровне, соответствующем государственным стандартам. Эти же системы мы предлагаем кадровым агентствам и организациям, где требуется особенно высокий уровень проверки кандидатов.

CNews: Насколько сложно интегрировать вашу систему с системами кадрового документооборота и КЭДО? Сколько времени занимает интеграция в среднем?

Владимир Арлазаров: Интеграция нашего продукта с системами кадрового документооборота или КДО обычно не вызывает сложностей: мы изначально разработали библиотеку, которая работает автономно и поддерживает различные способы подключения — от низкоуровневых интерфейсов до веб-сервисов. Например, систему можно развернуть в ИТ-контуре компании и интегрировать в веб-приложение для кадровика. Вариантов интеграции достаточно, чтобы быстро встроиться в любую существующую инфраструктуру.

Для быстрого запуска мы предоставляем кроссплатформенный веб-сервер с REST API; Для полноценного использования нашего API доступны программные обертки для Java, Swift/Objective C, Python, C#, JavaScript (WebAssembly),PHP, а также C/C++. Есть Mobile SDK для iOS/Android с распознаванием on-device, WebAssembly SDK для работы в мобильном браузере без передачи изображений на сервер. Так же мы предоставляем пакеты для React-Native и Flutter.

Мы поддерживаем все основные российские операционные системымобильные и серверные — и совместимы с отечественными аппаратно-программными платформами, включая «Эльбрус».

CNews: Почему заказчик должен выбрать ваше on-premise решение с локальной обработкой данных, ведь сейчас на рынке прослеживается другой тренд — на использование облаков. Что правильнее с точки зрения вопросов безопасности и соблюдения закона о персональных данных?

Владимир Арлазаров: Локальная обработка данных выигрывает у облачных сервисов прежде всего с юридической точки зрения. Закон прямо требует получения согласия человека на передачу его персональных данных стороннему сервису, и право отказаться от такой передачи всегда остается за человеком. Особенно сейчас, в эпоху утечек, ваш соискатель может просто не согласиться на передачу своих данных третьей стороне.

При передаче информации в облако вся ответственность за возможные утечки ложится на вас — на работодателя: вы фактически отдаете данные неизвестному третьему лицу. В условиях ужесточения законодательства и обсуждения уголовной ответственности такие риски стали особенно ощутимы. Внутри компании данные и так обязаны храниться и защищаться, и у большинства клиентов уже выстроены системы обеспечения безопасности. А подключение внешней стороны фактически означает разрыв контура защиты.

Кроме того, в сервисах распознавания зачастую работают люди, которые вручную перепроверяют результаты работы ИИ — и это еще один риск-фактор. Их необходимость продиктована низким качеством автоматического распознавания. Наше решение тем временем построено в соответствии с принципом «Только ИИ — и никого лишнего».

CNews: Ваша система нацелена на уничтожение бюрократии. Как с вашей точки зрения должен выглядеть идеальный процесс трудоустройства?

Владимир Арлазаров: Идеальное трудоустройство должно быть максимально быстрым и комфортным — без рутинной перепечатки данных из бумажных документов, бюрократических проволочек и прочих раздражающих факторов. Для этого и нужен Smart Document Engine. Процесс потоковой обработки документов у нас организован таким образом, что ограничивающим техническим фактором становится не сама система, а скорость загрузки изображений.

На практике это означает, что как только документ сфотографирован, данные мгновенно становятся доступными, что значительно ускоряет работу HR-отдела и одновременно снижает вероятность ошибок. При таком сценарии обеспечивается бесперебойное функционирование HR-отделов, а специалисты кадровой службы работают максимально эффективно и могут сосредоточиться на содержательной работе — взаимодействии с кандидатами, онбординге. Если же ваши кадровые специалисты по-прежнему вручную вносят данные в систему КДО и перепечатывают документы при трудоустройстве, вы безвозвратно теряете время и ресурсы.

Рекламаerid:2W5zFGnJXuiРекламодатель: ООО "СМАРТ ЭНДЖИНС СЕРВИС"ИНН/ОГРН: 7728328449/1167746085297Сайт: https://smartengines.com/