Спецпроекты

Abbyy рассекретила код своей библиотеки машинного обучения

ПО Свободное ПО Бизнес Интеграция Бизнес-приложения
Исходный код библиотеки машинного обучения Abbyy открыт под свободной лицензией. Фирменная библиотека компании под названием NeoML отличается поддержкой методов классического и глубокого МО, кроссплатформенностью и высокой скоростью работы.

Abbyy открывает NeoML

Компания Abbyy открыла доступ к NeoML – собственной библиотеке машинного обучения. Об этом CNews сообщила представитель компании. Все исходные тексты опубликованы в Сети на платформе Github, принадлежащей Microsoft, на условиях лицензии Apache 2.0. Там же можно найти документацию и примеры программ, написанных с использованием библиотеки.

С помощью NeoML разработчики смогут дополнять свои приложения различными возможностями на основе технологий искусственного интеллекта. В самой Abbyy, например, библиотеку применяют в задачах компьютерного зрения и обработки естественного языка при работе со структурированными и неструктурированными документами.

Благодаря поддержке открытого стандарта ONNX библиотека может использовать модели из других фреймворков, позволяя разработчикам задействовать оптимальную комбинацию инструментов. Стандарт создан и поддерживается совместно Microsoft, Facebook и другими партнерами как проект с открытым исходным кодом.

Исходный код библиотеки машинного обучения Abbyy открыт под свободной лицензией

«NeoML откроет целый ряд возможностей по использованию нейросетей в бизнес-сценариях, – считает Константин Гольдштейн, ведущий эксперт по стратегическим технологиям Microsoft в России. – Поддержка стандарта ONNX и размещение проекта на Github позволят сделать библиотеку глобально доступной и создать вокруг нее обширную экосистему разработчиков».

Особенности библиотеки

NeoML поддерживает современные методы как глубокого, так и классического машинного обучения, которые работают в облачной среде, на десктопах и мобильных платформах, подчеркивают разработчики. Модели, созданные с помощью алгоритмов NeoML позволяют решать задачи идентификации, классификации, семантической сегментации, прогнозирования. К примеру, банки могут разрабатывать, обучать и применять модели для предсказания спроса на кредиты.

Нейросети библиотеки поддерживают до 100 слоев, а для классического машинного обучения доступны более 20 алгоритмов.

Библиотека отличается кроссплатформенностью. Ее можно использовать в Windows, Linux, macOS, iOS и Android. Библиотека поддерживает использование как центральных процессоров (CPU), так и графических (GPU).

Согласно документации к библиотеке, работа с GPU возможна в Windows при использовании видеокарты с поддержкой архитектуры параллельных вычислений CUDA версии 10.2; в iOS на процессорах A7+; на Android-устройствах с поддержкой API Vulkan 1.0. Поддержка библиотекой GPU в macOS и Linux пока не реализована.

На сегодняшний день NeoML поддерживает языки программирования С++, Java, Objective C и Swift. В ближайшее время разработчики обещают добавить поддержку Python. Разработка фреймворка ведется в Microsoft Visual Studio.

Внутренние тесты Abbyy показали, что скорость библиотеки на задачах обработки изображений превышает аналоги на 15-20%.

Несколько слов об Abbyy

Abbyy – международная компания с российскими корнями, занимающаяся разработкой решений в сферах интеллектуальной обработки информации и анализа бизнес-процессов, распознавания текстов и лингвистики.

В числе наиболее известных продуктов компании можно отметить ПО для распознавания документов Finereader, интеллектуальной обработки информации Flexiсapture, а также электронные словари Lingvo.

В марте 2020 г. Abbyy объявила о двузначном росте доходов в долларовом выражении по итогам 2019 г. Подобные темпы прироста выручки в компании отмечают три года подряд. Количество проектов компании в российском корпоративном сегменте выросло на 19%. Увеличение спроса на свои решения в Abbyy связывают с ростом инвестиций компаний в технологии искусственного интеллекта.

По состоянию на 2020 г. решения Abbyy используют более 50 млн пользователей и десятки тысяч организаций в 200 странах и регионах мира. В частности, Райффайзенбанк применяет технологии Abbyy при заключении кредитных договоров. ВТБ использует автоматическое распознавание и ввод паспортных данных на базе Flexicapture при обслуживании физических лиц. Клиентам банка для предпринимателей «Точка» технологии искусственного интеллекта Abbyy помогают автоматически заполнять реквизиты для оплаты счетов.

В начале июня 2020 г. CNews сообщил о масштабном международном проекте по оцифровке коллекции музея Большого театра. В рамках проекта «Открой историю Большого» искусственный интеллект Abbyy и более 7,8 тыс. волонтеров помогли преобразовать в электронную форму информацию из 48 тыс. афиш, 120 тыс. программок и 100 тыс. фотографий.