Спецпроекты

Cognitive Pilot создает первую в мире открытую БД изображений для обучения беспилотной сельхозтехники

Бизнес Big Data

Cognitive Pilot (дочерняя компания Сбербанка и Cognitive Technologies) и агрохолдинг «Песчанокопская аграрная группа» объявили о создании опытного полигона по тестированию и эксплуатации систем управления на основе искусственного интеллекта на различных видах сельхозтехники (помимо комбайнов, планируется использование тракторов, опрыскивающих и других транспортных средств), а также реализации проекта по созданию первой в мире открытой базы данных изображений (датасетов) для обучения нейронных сетей для беспилотной сельхозтехники Cognitive Agro Dataset.

Генеральный директор Cognitive Pilot Ольга Ускова сказала: «Целью нашего проекта является формирование уникального инструмента, позволяющего разработчикам систем управления беспилотной сельхозтехникой со всего мира эффективно решать задачи обучения нейронных сетей на реальных данных и создавать свои автопилоты. Сотрудничество с "Песчанокопской аграрной группой", открытие полигона, позволит нам воссоздать широкий класс ситуаций, в том числе и крайне редко встречающихся в условиях реальных сельхоз-работ, в разных погодных условиях при разной освещенности, имеющих высочайшую ценность для подготовки базы данных, и в итоге, обеспечения безопасной работы автономной системы управления сельхозтехникой».

«Мы готовы предоставить лидеру рынка решений в области искусственного интеллекта наши компетенции, знания, тонкости ведения сельхоз-бизнес-процессов, а также наши ресурсы для решения важнейшей задачи отрасли, создания инфраструктурного объекта для тестирования и сбора данных, необходимых для проведения испытаний и создания совершенной системы управления сельхозтехникой. Фактически мы говорим о создании первого в России полигона для агробеспилотников», – сказал главный акционер и член совета директоров «Песчанокопской аграрной группы» Владимир Яловенко.

«Песчанокопская аграрная группа» является одним из крупнейших агрохозяйств Ростовской области с объемом землепользования более 35 тыс. Га. В его состав входят три предприятия, основным направлением деятельности которых является выращивание зерновых и технических культур. Парк техники агрохолдинга насчитывает более 200 единиц. «Это один из наиболее продвинутых в плане использования и внедрения инноваций агрохолдингов в стране», – сказала Ольга Ускова.

Наличие баз датасетов, собранных в реальных условиях, является ключевым инструментом в разработке системы управления любым беспилотным транспортом. «Без репрезентативных обучающих выборок создать систему управления каким-либо беспилотником невозможно», – отметил руководитель департамента разработки беспилотных транспортных средств Юрий Минкин.

«Датасеты позволяют организовать процесс обучения нейронных сетей, которые, в свою очередь, обеспечивают качественную работу всей системы управления беспилотником. Кроме того, как показала практика, синтетические датасеты – данные смоделированные или дополненные искусственным путем, являются менее эффективными, чем реальные данные. Поэтому разработчики так высоко ценят датасеты, полученные в реальных условиях, – отметил Минкин. – В этом смысле наличие полигона для тестирования сельхозтехники в реальных условиях является бесценным инструментом для создания такой базы данных».

Если в направлении создания беспилотных автомобилей открытые базы данных датасетов уже существуют (известны базы, подготовленные Waymo, Lyft, университетом Карнеги, Baidu и другими разработчиками) и активно используются, то в сфере сельского хозяйства до настоящего времени в наличии имелись лишь единичные базы датасетов для локальных задач, таких как опрыскивание сорняков. Проект Cognitive Pilot – фактически это первая попытка создания комплексного механизма для отраслевых разработчиков в мире.

«Мы ставим задачу создать самую большую и репрезентативную базу данных для задач умного сельского хозяйства в мире», – сказала Ольга Ускова.

Разработчики Cognitive Pilot включают в Cognitive Agro Dataset изображения с видеокамер, данные с датчиков одометрии и инерциальных сенсоров, установленных на беспилотной сельхозтехнике, полученные в различных погодных условиях, времени суток, включая ночь, на полях с различной геометрией, учитывающих многообразие сельхозкультур. На этих данных размечаются основные объекты полевой сцены: транспортные средства и их рабочие агрегаты, скошенная и нескошенная часть сельхозкультур, рядки, валки, люди и другие элементы.

Сбор информации для Cognitive Agro Dataset производится компанией Cognitive Pilot уже порядка пяти лет. До последнего времени основной площадкой для решения задачи была Россия – все регионы, где компания внедряет и испытывает беспилотные технологии. Это и юг, и север страны, и ее центральная часть. В прошлом году к объектам сбора информации добавились зарубежные страны. Первой в их числе стала Бразилия. В этом году, предполагается, что список пополнят США, Канада, Китай, Аргентина и Южная Корея. «Основные циклы работ намечены на уборочный цикл, и мы надеемся, что пандемия коронавируса нам не помешает осуществить эти задачи», – отметили разработчики.

Следует заметить, среднее число объектов в полевой сцене значительно меньше, чем в дорожной (в аналогичных задачах для беспилотных автомобилей), что, в свою очередь, требует большего количества времени для сбора данных.

Участники проекта планируют завершить работы и опубликовать свои результаты в начале следующего года. К информации о многообразии зерновых культур, подсолнечника и сои им предстоит добавить в базу данные о новых видах, таких, как бобовые, рапс и других. Также будут добавлены данные, полученные со стереокамер, закончена разметка датасетов. Объем базы при этом предполагается довести до 80 тыс. десятисекундных видеозаписей. Такую продолжительность записей разработчики объясняют спецификой полевой сцены и, просто удобством в работе.

Необходимо отметить, что в среднем, разработчики тратят до $2 млн на сбор и приобретение репрезентативных датасетов для обучения нейронной сети в одной географической локации.

Вся информация, содержащаяся в Cognitive Agro Dataset, для российских пользователей будет бесплатна.



Тема месяца

Что делать ИТ-директору во время пандемии

Перед ИТ-руководителями встают задачи, связанные с обеспечением удаленной работы сотрудников.

Стратегия месяца

LegalTech грозит заменить юристов

Средства искусственного интеллекта все чаще используются для обработки обращений за юридической помощью.