Год российских платформ: как техногиганты толкают ИИ в финсекторе
Российский финансовый сектор движется от экспериментального внедрения LLM к промышленным решениям, опираясь на облачные платформы ключевых российских вендоров. Это заметно отличает российских игроков от западных коллег, предпочитающих гибридные схемы с развертыванием собственных или кастомизированных моделей в периметре.
Две ведущие экосистемы
Выбор в пользу централизованных поставщиков моделей в России объясняется прагматикой: сокращение времени вывода в продакшн, предсказуемость затрат и решения проблем дефицита вычислительных ресурсов и специалистов делают модель «LLM-as-a-Service» оптимальной для большинства игроков.
При этом незакрытые риски моделей (галлюцинации, безопасность) и отсутствие масштабных возвратов на инвестиции, соизмеримых с амбициями отрасли, добавляют риски внедрений и масштабных инвестиций.
На стороне платформ сегодня доминируют решения от двух ведущих экосистемных игроков, которые лежат в основе корпоративных пилотов и продуктов.
В 2025 году обе экосистемы резко нарастили функциональность для бизнеса: ведущий ИТ-игрок открыл доступ к флагманской модели и одновременно снизил цену в три раза — до 0,40 ₽ за 1000 токенов. С учетом современных трендов масштабирования LLM через цепочки рассуждений (reasoning) и параллелизацию (parallel test-time scaling), что приводит к более быстрой трате токенов, цена становится критичным фактором TCO, при этом падение в цене токена, скорее всего, будет компенсироваться ростом объема, что сократит реальный финансовый эффект от снижения цены.
Другой экосистемный игрок, в свою очередь, добавил в свой чат голосовые диалоги в веб‑версии и на Android, а также внедрил поддержку chain-of-thought в свой пользовательский интерфейс в июле этого года. Их уже используют порядка 15 000 российских компаний, в то время как конкурент отчитался о 25 000 корпоративных клиентов по итогам первого полугодия, а сервисы распознавания и синтеза речи достигли 77 млн минут за тот же период.
Опыт рынка: кейсы внедрений
Поверх базовых LLM от ИТ-гигантов другие компании строят более высокоуровневые платформы, непосредственно направленные на решение задач бизнеса.
Так, контакт‑центр российского банка из топ-3 мигрировал на вендорское платформенное решение, которое теперь обрабатывает свыше 7 млн звонков в месяц, как часть своего решения вендор предлагает интеллектуального ассистента и ИИ-инструменты помощи сотрудникам.
Ведущая ИТ-компания представила кастомизируемое платформенное решение, которое обещает сократить среднее время обслуживания за счёт контекстных подсказок, а также анонсировал агента для построения голосового взаимодействия.
Другой банк интегрировал модель для массового анализа разговоров, что позволило ускорить анализ клиентских диалогов в 30 раз, анализируя свыше 29 000 диалогов в неделю, а внедренный ими агент поддержки обработал порядка 60 000 клиентских запросов с минимумом ошибок, автоматизировав до 8% обращений и нарастив CSI на 0,2 пункта.
Другие компании разрабатывают собственные комплексные решения там, где имеющиеся платформы не обеспечивают достаточной производительности.
Российская биржа внедрила собственное ИИ-решение в офисных приложениях и веб‑интерфейсах, а также RAG для поиска по внутренним документам. Время поиска сократилось с 18 минут до 15 секунд, обеспечивая потенциальную экономию более 1 млрд руб. в год.
Крупный частный банк запустил нейроассистента в веб‑банке для юрлиц и отдельно ассистента по госзакупкам (который является первым продуктом этого класса в России для предпринимателей).
Из практики видно, что большой интерес пока вызывают системы автоматизации поддержки, а также системы семантического поиска и анализа внутренних документов, в то время как более продвинутые агентские сценарии использования, позволяющие взять на себя более полный спектр автоматизации клиентских операций, пока находятся, скорее, на стадии пилотирования и апробации, упираясь в регуляторную неопределенность, контроль качества и прозрачность.
Самая частая модель внедрения строится как тонкая настройка на стороне вендора с последующей интеграция у банка или через платформенных партнеров. Внутри банков формируются компактные центры компетенций (prompt/product/eval/governance), которые работают «над» платформами ИТ-гигантов.
В такой схеме важны в первую продуктовые (владелец сценария и бизнес-метрик, архитектор RAG, методолог комплаенса и инженер по безопасности) и интеграционные роли, а также функция обучения сотрудников грамотному использованию значительно отличающегося инструментария и адаптации бизнес-процессов: например, операторам нужны не столько инструкции по ИИ, сколько переформатированные KPI и понятное разделение ответственности между моделью и человеком.
Четыре класса рисков сдерживают внедрение более сложных сценариев
Во‑первых, качество: галлюцинации, что частично устраняется ограничением доменов, цитированием источников (grounding), системой контроля качества (evals) и наличием человека на наиболее чувствительных и рискованных шагах.
Во‑вторых, данные: необходимость очищать персональные данные и находить эффективный баланс между приватностью и достаточной полнотой контекста и действий для агентов.
В‑третьих, безопасность: RBAC на function calling, аудит промпты, воспроизводимость выдачи, защита от внедрений вредоносных промптов — инструменты безопасности LLM пока еще активно развиваются.
Наконец, опасения вызывают сомнения в возврате на инвестиции, который пока ограничен как в России, так и за рубежом, что создает риски создания пузыря и последующего финансового удара при необходимости резко сокращать инвестиции: технологии техногигантов толкают отрасль, но пока толкают в гору. Эти риски создают опасения как для компаний, внедряющих решения, так и для регуляторов.
Регулирование пока находится на раннем уровне, что, с одной стороны позволяет отрасли динамично и быстро развиваться, с другой открывает ее рискам. Но ситуация постепенно меняется с более структурированным и детальным подходом к отрасли со стороны государства.
Банк России в июле опубликовал Кодекс этики ИИ для финансового рынка: принципы человекоцентричности, справедливости, прозрачности, безопасности и управления рисками, а также обязанность информировать клиентов об использовании ИИ.
С того же месяца становятся жестче требования по локализации персональных данных: первичный сбор должен производиться на серверах в России, что впрямую влияет на архитектуру RAG и логов, затрудняя использование внешних моделей, например, в рамках sovereign cloud близлежащих стран. Параллельно регулятор повышает планку защиты клиентов от мошеннических переводов и обращает внимание на угрозы дипфейков, что усиливает акцент на обеспечении безопасности моделей (например, наличии механизмов обнаружение синтетической речи) и поднимает вопросы степени ответственности в случае атак на ИИ.
Подход к хостингу моделей отличается между российскими и западными игроками
Западные финансовые организации часто используют гибридные решения, совмещая вендорские и кастомизированные модели (обычно на базе открытых), что позволяет обеспечивать больший контроль за хранением и обработкой чувствительных данных, без необходимости доверять их внешним контрагентам, и выводит модели на уровень не только продукта Platform/LLM-as-a-Service, но и компонента, который может использоваться и кастомизироваться внутри организации.
В России более распространено привлечение ключевых ИТ‑компаний как партнеров; собственные решения пока остаются более редкими случаями.
Часть причин лежит в дефиците вычислительных мощностей и кадров, а часть в исторически более глубокой интегрированности ИТ-ландшафта компаний в России. Для финансовых организаций эти сложности являются дополнительным аргументом в пользу работы с ИТ-гигантами, которые могут консолидировать поставки и настройку сложной инфраструктуры, оптимизировать аллокацию кадров и обеспечить разделение ресурсов между игроками, оптимизируя утилизацию (а значит и стоимость).
К концу 2025 года подход к ИИ в российских финансах стал прагматичным и ориентированным на измеримые результаты. В ближайшей перспективе можно ожидать дальнейшего развития более сложных конструкций: мультиагентских систем, где центральная модель-диспетчер координирует узкоспециализированные агенты, организуя полное покрытие процесса, усиление голосовых интерфейсов (не только в контакт‑центрах, но и в фронт‑офисах) и их интеграция с агентами, «вертикализация» ассистентов со специализированными помощники для комплаенса, кредитного анализа, закупок и других доменов.
По мере расширения опыта применения и зрелости российских моделей можно ожидать растущего эффекта на экономику, который будет перекладываться в дальнейший рост инвестиций в инфраструктуру и энергетику, где банки будут выступать не только потребителями экономики, но и важными партнерами по обеспечению фондирования.




