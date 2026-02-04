ГК InfoWatch запатентовала технологию распознавания текста на сложных изображениях

ГК InfoWatch получила от Федеральной службы по интеллектуальной собственности патент на изобретение «Способ подготовки текстовых зон, выявленных из изображений нейронной сетью, к распознаванию текста технологией OCR». Разработанная технология кратно повышает точность и полноту автоматического распознавания текста на сложных изображениях и применима в DLP-системах. Об этом CNews сообщил представитель компании.

Технология использует комбинацию нейросетей и эвристического алгоритма. Нейросети формируют «карту вероятности» для выявления пикселей, относящихся к тексту, и «карту связности» для определения связанных между собой символов. На основе полученных данных формируются надежные текстовые блоки, а алгоритм последовательно объединяет близко расположенные и схожие по характеристикам блоки в логические текстовые строки и колонки, правильно определяя структуру документа. Результат передается на финальное распознавание в OCR-движок.

Разработка применима в DLP-системе InfoWatch Traffic Monitor, которая способна обрабатывать широкий спектр изображений: сканы документов, скриншоты со множеством окон различных приложений и фотографии. Глубина и качество распознавания текста на изображениях помогут снизить риски утечек данных.

«InfoWatch системно работает над развитием функционала продуктов из линейки по защите данных. Разработанный механизм предварительного анализа изображений позволяют OCR-системе распознавать текст полнее и точнее — особенно на сложных, зашумленных посторонней графикой изображениях, содержащих произвольно расположенные текстовые блоки со шрифтами разного размера», — сказал старший разработчик-исследователь ГК InfoWatch и один из авторов технологии Зайнулла Жумаев.

«Кейсы патентования технологий, дополняющих и обновляющих существующие и известные решения, — это особый случай. Именно здесь проявляются знания и компетенции команды НИР и патентной команды, которым необходимо выявить и описать скрытый и не всегда очевидный изобретательский шаг», — отметила главный юрист ГК InfoWatch и патентный поверенный Екатерина Антонова.