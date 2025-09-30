Российский разработчик ИИ выходит на рынок Ирана и Пакистана

Отечественный разработчик ИИ-решений Smart Engines выходит на рынок Ирана и Пакистана. Компания будет предоставлять свое решение «Шерлок» для распознавания и проверки документов.

Новые рынки

Как стало известно CNews, российский разработчик ИИ-решений Smart Engines выходит на рынки Ирана и Пакистана. Об этом CNews рассказал гендиректор компании Владимир Арлазаров.

Компания будет продавать на новые рынки собственную ИИ-систему «Шерлок» для распознавания и проверки документов. Решение работает с удостоверениями личности на урду и персидском языках.

«Это стало возможным благодаря первому в мире специализированному датасету MIDV-UP, созданному учеными компании и включающему более 9000 изображений документов Пакистана и Ирана», — рассказал Арлазаров. Он отметил, что совокупное население стран составляет 330 млн человек.

Обучение ИИ новым языкам

На сегодняшний день языковые технологии искусственного интеллекта поддерживают лишь небольшую часть из более чем 7 тыс. языков мира. Алфавиты на основе латиницы уже давно освоены системами ИИ, в то время как обучение систем распознавания языкам с другими системами письменности происходит значительно медленнее. Особенно остро проблема обстоит с урду и персидским (фарси) – государственными языками Пакистана и Ирана. Оба языка используют модифицированный арабский алфавит и отличаются сложными лигатурами, отмечают в Smart Engines.

Smart Engines Smart Engines вышли на рынок Ирана и Пакистана

До настоящего времени существующие датасеты документов оставляли практически без внимания удостоверения личности на урду и персидском, отметил Арлазаров.

«Представленный Smart Engines датасет MIDV-UP впервые изменил эту ситуацию, обеспечив разработчиков качественными данными для обучения ИИ», — утверждают в компании. В состав MIDV-UP вошли 1 тыс. уникальных образцов удостоверений нескольких типов документов – ID-карт, водительских удостоверений и свидетельств о рождении Ирана, а также ID-карт Пакистана. В общей сложности в датасете содержится 9 тыс. полностью аннотированных изображений, полученных безопасным методом синтеза (новым способом создания обучающих данных без использования документов реальных людей).

Работа с бликами и дипфейками

MIDV-UP охватывает широкий спектр сценариев предъявления документов: от сканов до фотографий и видеоклипов с естественными помехами: тенями, бликами и искаженной перспективой, отмечают разработчики.

По их словам, «Шерлок» способен работать одновременно в видимом, ультрафиолетовом и инфракрасном диапазонах, анализировать голограммы и другие защитные элементы, осуществляя в общей сложности более 600 проверок.

«Это дает возможность детектировать подделки любой сложности и качества, начиная с паспортов с измененными и переклееными фотографиями и заканчивая муляжами и дипфейками», — отметил Владимир Арлазаров.

Решение было разработано при финансовой поддержке Фонда содействия инновациям и используется в пунктах автоматического паспортного контроля в аэропортах «Шереметьево», «Внуково» и «Кольцово», а также в РЖД, ФНС и банковском секторе.

Чем известна Smart Engines

Smart Engines — российская компания-разработчик искусственного интеллекта. Основана в 2016 г. учеными в сфере распознавания символов, изображений и обработки документов. Технологиями распознавания Smart Engines пользуются 70% жителей России и больше 275 млн человек по всему миру.

По итогам 2024 г. компания заработала 830 млн руб., что на 80% выше, чем по итогам 2023 г.