Спецпроекты

Как мониторинг бизнес-процессов помогает крупному ритейлу избежать многомиллионных потерь

Бизнес Интеграция Ритейл

Цифровые гиганты вроде Amazon и AliExpress задали всему миру очень высокую планку качества сервисов. На их фоне другим компаниям ничего не остается, как подтягиваться к заданному эталону. Потребители тоже «льют воду на эту мельницу», ожидая идеального сервиса в мелочах: онлайн-магазин должен работать четко и быстро. Иначе покупатель просто уйдет — несколько мгновений простоя, и он уже на сайте конкурента.

Трехзначные миллионы

Сколько стоит минута простоя информационной системы для ритейлового бизнеса? По данным компании IDC, которая опросила игроков из топ-1000 на западном рынке, стоимость одного часа простоя бизнес-приложений в сумме доходит до $1 млн. За год суммарно потери от сбоев бизнес-приложений обходятся бизнесу в $2,5 млрд. Если рассматривать конкретные примеры, то стоимость 1 минуты простоя в Amazon равна $165 тыс.

Как дела обстоят в России? Алексей Акопян, руководитель направления мониторинга компании «Инфосистемы Джет» приводит следующие цифры: «Мы опросили топ-10 компаний из сферы ритейла и выяснили, что средняя стоимость одного часа простоя составляет от 20 млн до 50 млн. В среднем, потери компании от сбоев работы бизнес-приложений составляют от 300 млн до 800 млн в год».

Петр Асратян, руководитель управления автоматизации внутренних процессов компании «Яндекс» отмечает: «Мы классифицируем инциденты по степени принесенных убытков, выясняя, к каким именно финансовым потерям привел конкретный инцидент. Например, банковский шлюз дал сбой и 2 минуты не принимал карточные платежи. Мы смотрим сумму прошедших транзакций за то же время в другие дни и четко оцениваем потерю. Но нужно отметить важный момент: для некоторых сервисов случившиеся потери не безвозвратные. Скажем, клиент размещает рекламу. Даже если в тот момент сервис был недоступен, человек в 95% случаев вернется обратно. Но есть и другие примеры: если покупатель приобретает билеты в кино и у него что-то не получается, он уйдет к нашим конкурентам. Вот это уже безвозвратная потеря. Мы приняли для себя принципиальное решение: сразу будем считать, что в период сбоя потеряли деньги. Даже если клиент вернулся обратно, наша репутация пострадала, поэтому любой инцидент требует пристального изучения».

Cредняя стоимость одного часа простоя в российском ритейле составляет от ₽20 млн до ₽50 млн. Источник: ru.depositphotos.com

Владислав Алмазов, директор по сопровождению информационных технологий компании Lamoda рассказывает: «Мы отслеживаем много разных метрик, но самая важная — работа кнопки «оформить заказ» в нашем интернет-магазине. Если клиент не смог сделать заказ, мы теряем лояльность покупателя и сам заказ. Поэтому любые ошибки на этапе покупки для нас являются критичными инцидентами. Мы обязательно ведем учет, сколько потеряно заказов».

Далеко не везде принята практика оценки стоимости инцидентов. Кроме того, это не всегда является непререкаемой необходимостью. Евгений Комаров, руководитель управления развития ИТ ЦУМ объясняет: «Мы учитываем простои, но не считаем их стоимость. Наша политика в отношении сбоев крайне проста: в бизнес-критичных приложениях их вообще быть не должно».

От мониторинга ИТ к мониторингу бизнес-процессов

Сбои невозможно свести к нулю, но можно хотя бы приблизиться к этому. Именно поэтому бизнес внедряет системы мониторинга. Отслеживать работу инфраструктуры — золотой стандарт ритейла. В тоже время мониторинг ИТ-инфраструктуры не отвечает на все вопросы. Тоже самое касается и мониторинга приложений, который позволяет держать руку на пульсе по ключевым параметрам, но не дает картины по бизнес-процессу в целом. Кроме того, работающие компоненты ИТ не гарантируют приемлемого клиентского опыта. А обеспечение этого, по мнению экспертов из ритейла, сверхцель любой системы мониторинга.

Крупные компании зачастую имеют в своем распоряжении несколько систем мониторинга, порой их число превосходит десяток. В тоже время и они остаются далеки от мониторинга того или иного критичного для себя бизнес-процесса.

«Сервисный подход в мониторинге как раз и позволяет перейти от контроля работы отдельных компонентов ИТ к мониторингу состояния бизнес-процесса. Это эталон, к которому многие компании стремятся сейчас, — объясняет Алексей Акопян. — Реализовать у себя сервисный подход в мониторинге еще несколько лет назад было крайне сложно. Теперь же есть решения основанные на методах машинного обучения и аналитики больших данных для обнаружения аномалий в технологическом стеке приложений и ИТ-инфраструктуры в режиме реального времени».

Эталонный мониторинг приложений включает в себя четыре блока. Во-первых, это мониторинг пользовательского опыта — как приложение работает со стороны клиента, как производительность соотносится с доступностью и временем отклика. Во-вторых, это автоматическое построение топологии обнаружения сервисов, которое контролирует все транзакции на уровне приложений до уровня кода. В-третьих, это элементы ИИ, позволяющие находить аномалии в производительности в контексте топологии приложения. И четвертый блок — блок аналитики, который сможет наглядно продемонстрировать как коррелируют между собой технические и бизнес-показатели. В такой функциональности система мониторинга способна стать частью контроля бизнес-процесса и улучшить клиентский опыт.

Минус системы, плюс для бизнеса

С точки зрения устройства мониторинга мало кто из ритейлеров может похвастаться идеальной системой. Как правило, компании имеют несколько ИТ-решений. Появляясь однажды под разные задачи, теперь он образуют причудливый ИТ-узор. В отдельных случаях их число даже переваливает десяток. При таком подходе затруднительно получить единую и достоверную картину по работе ИТ-систем и приложений. Алексей Акопян делится своим наблюдением на этот счет: «Многие компании сейчас подошли к тому, чтобы оптимизировать свой мониторинг. У них нет цели перейти на одну систему, но хотя бы сократить число ИТ-решений до 3-5, проработать элементарные интеграции, сделать удобным их управление и получить наконец общую картину по предприятию — это возможно».

Какое же конкретное ПО выбрать? Вопрос логичный. Решения по мониторингу производительности приложений от AppDynamics (входит в состав компании Cisco) несколько лет подряд называются одними из лучших. Так считают аналитики Gartner. Это программное обеспечение позволяет контролировать распределенную инфраструктуру приложения, сервера, сети, базы данных, веб-сервера и другие программные компоненты.

Неважно, где именно возникает проблема. Время на ее поиски существенно сокращается благодаря комплексному подходу. «Мы хотели, чтобы наша e-com команда тратила меньше времени на устранение проблем и сосредоточилась на задачах развития и повышения качества кода. Спустя шесть месяцев после внедрения AppDynamics, мы уже наблюдаем значительные успехи на оперативном уровне», — говорит Бернард Тьерри, ИТ-директор компании Kiabi.

Системы мониторинга приложения держат руку на пульсе бизнеса и, подобно хорошему доктору, предлагают профилактику вместо лечения, то есть дают возможность проактивного реагирования в случаях замедления тех или иных транзакций.

Система задает динамические пороговые значения как технических параметров, так и бизнес-метрик. Помимо этого, компонент встроенной аналитики Business IQ от AppDynamics помогает отслеживать клиентский опыт. Вы сами видите, какое влияние оказывает работа приложения на опыт пользователя. Таким образом, компании получают полное представление о том, как работа ИТ влияет на главные бизнес-показатели. «Одним из ключевых преимуществ, которые мы получили при использовании Business IQ, является то, что система предоставляет возможность как бизнес-подразделению, так и ИТ-командам сотрудничать вместе, имея в своем распоряжении единый источник истинных фактов», — говорит Джон Хилл, ИТ-директор компании Carhatt.

Материал создан на основе круглого стола Business Critical: мониторинг бизнес-процессов в условиях неопределенности, организованного Digital Академией.

Остались вопросы по теме материала? Пишите на monitoring@jet.su!