OTC.RU интегрировала в систему поиска тендеров технологии на базе машинного обучения

Бизнес Тендеры Интернет Веб-сервисы Интеграция Внедрения
мобильная версия
, Текст: Татьяна Короткова

Группа компаний OTC.RU интегрировала в систему поиска на собственной электронной площадке новейший алгоритм и целый спектр современных поисковых технологий на базе машинного обучения. Об этом CNews сообщили в OTC.RU.

Электронные торги, электронные сервисы, тендерные аналитические системы, публикация планов закупок в электронной форме, автоматическая отправка данных на государственные ресурсы, интеграционные процессы — все эти технологии и функции уже не удивляют участников рынка. Площадки, которые с свое время были призваны оцифровать бумагу, сегодня перепрофилировались в полноценные ИТ-холдинги, отметили в компании. В конкуренцию между торговыми площадками вклинилась новая «тяжелая артиллерия», а именно — технологическое превосходство, факторы скорости и качества предоставляемых данных о тендерах и услугах, которых стало в разы больше за последние пару лет.

«Получив за предыдущие годы опыт организации взаимодействия между контрагентами и изучив требования рынка, теперь все площадки столкнулись с одной проблемой — поиском торгов и работой с поисковыми запросами пользователей, — рассказали в OTC.RU. — Эта проблема нарастала с самого начала практики размещения тендеров онлайн, и ее можно разбить на три составляющие».

Первая — растущее в геометрической прогрессии количество торгов. По словам представителей OTC.RU, огромный приток обещает 2017 г. и большое количество источников данных, агрегаторов, которые компании используют в качестве точек входа для формирования собственных баз для поисковых систем.

Вторая составляющая связана с тем, что из-за огромного количества агрегаторов и при наличии государственного портала ЕИС качество предоставляемых данных нередко играет злую шутку с поисковыми машинами на площадках, что напрямую отражается на качестве выводимых данных конечному участнику рынка, пояснили в компании. Зачастую информация корректна, но предоставляется по-разному — от названия проводимого тендера до наличия заявленной документации.

Третья проблема вытекает из второй и заключается в том, что качество предоставляемой информации оставляет желать лучшего. Из-за растущего числа проводимых тендеров увеличивается количество агрегаторов, что, в свою очередь, вызывает рост объемов некорректной или дублируемой информации, которая, по сути, является мусором.

Для получения качественной информации из всех доступных тендеров поисковой системе требуется наличие мощных синтаксических, морфологических и математических алгоритмов для системы поисковых запросов. Таким образом, в систему поисков тендеров OTC.RU интегрировали новейший алгоритм и целый спектр современных поисковых технологий.

В компании за последние 4 месяца удалось разработать и внедрить систему машинного обучения для поисковых систем. Обучение синтезировало в себе сбор данных из более чем 100 ЭТП, индексирование карточек тендеров и приложенной документации. По информации OTC.RU, был применен собственный алгоритм поиска в виде цепочки: просмотр карточки тендера, изучение закупочной документации, подача заявок, заключение договора. Это, в свою очередь, обеспечило целый ряд возможностей: мгновенный поиск по тендерам, всевозможные варианты фильтрации результатов с учетом релевантности (по номенклатуре, регионам и федеральным округам, ценам и датам, типу торгов и пр.), полностью релевантный результат поиска, отсеивание ранее выводимых данных не по запросу, а по синтаксическому совпадению отдельных слов в запросе, морфологический поиск с учетом словоформ, в том числе в приложенной документации, и дополнительный блок коллаборативной фильтрации для поиска похожих тендеров. Отдельно в компании отметили наличие такой важной поисковой опции, как слова-исключения. Использование слов-исключений дает возможность получить релевантный результат в сочетании с новыми алгоритмами поиска.

«Таким образом система лишается недостатков в плане быстрого поиска и предоставления конечному пользователю качественных данных и отсеиванию мусорной информации. Мы не боремся за количество страниц в форме поиска, мы боремся за качество поискового запроса. Пусть это будет лучше одна страница с двумя карточками тендеров, зато согласно запросу участника, — считает Дмитрий Пангин, генеральный директор OTC.RU. — Подобного рода разработки и решения обходятся компаниям в немалые денежные средства, но о монетизации таких проектов говорить не приходится. Сейчас наступила новая эра конкуренции, технического превосходства в части предоставления данных очень быстро и на качественно новом уровне. К сожалению, наши вынужденные затраты и подобного рода проекты напрямую связаны с огромным и интенсивно растущим рынком агрегаторов и количества торгов, из-за которых становится все труднее получать необходимый результат, и от этого страдают наши клиенты. Любому бизнесу жизненно необходимо удовлетворять потребности клиентов и делать сервисы быстрей, умней и практичней. В любом случае, мы будем продолжать совершенствовать наши алгоритмы поисковых машин».