Автоматизированное дешифрирование на основе нейронных сетей
Элешкевич А.Д., Еременко М.С., Сайбель Е.Г., Христолюбов И.А., Чернов А.Г.


АО «ТомскНИПИнефть»

В данной статье рассматривается опыт создания и применения методов автоматизированного дешифрирования с использованием алгоритма машинного обучения для решения задач выявления зон антропогенного воздействия на территориях нефтегазовых месторождений. Описываются варианты использования различных исходных данных дистанционного зондирования Земли для выявления таких зон на примере лесных вырубок, анализируются их преимущества и недостатки. Предлагается оригинальный подход на основе нейронных сетей для дешифрирования аэрокосмических снимков и рассматриваются перспективы его использования.
Введение
Нефтяная индустрия, как одна из ведущих отраслей мировой экономики, обеспечивает глобальное энергетическое потребление и является ключевым фактором в формировании современного облика мировой инфраструктуры. Однако вместе с этими значительными выгодами важно оценивать возможные экологические и социальные проблемы, связанные с антропогенным воздействием на окружающую среду. Антропогенное воздействие в нефтяной сфере подразумевает загрязнение окружающей среды выбросами парниковых газов, нефтяными разливами, а также изменение природного ландшафта. Снизить воздействие возможно при его обнаружении на ранней стадии. В частности, современные технологии, процессы цифровизации и пространственный анализ (например, анализ аэрокосмических снимков) могут играть важную роль в распознавании и классификации антропогенных зон.
По мере расширения своей деятельности нефтегазовые компании часто вынуждены вырубать лесные массивы для создания необходимой инфраструктуры, в том числе для бурения скважин и строительства коммуникаций.
Одним из инструментов для контроля и наблюдения за состоянием окружающей среды является использование данных дистанционного зондирования Земли (ДЗЗ), которые при использовании геоинформационных систем наряду с методами автоматизированного дешифрирования данных ДЗЗ позволяют реализовать эффективный инструмент для контроля и борьбы с антропогенными угрозами экологии.
Однако распознавание образов по данным ДЗЗ представляет собой сложную и ресурсоемкую задачу. Необходимо учитывать различные факторы, такие как сезонные особенности (весенние поводки, временные обмеления), параметры съемки (процент облачности, число спектров в изображении, пространственное разрешение). Важным аспектом такой задачи является точность и скорость обработки больших объемов данных.
Актуальной задачей является то, что в условиях санкций коммерческие продукты (Erdas imagine, ArcGIS и другие) по автоматизированному дешифрированию стали недоступны, а это значит, что есть необходимость в создании импортонезависимой системы автоматизированного дешифрирования объектов на территориях нефтегазовых месторождений. Она позволит снизить трудозатраты сотрудников, так как в данный момент определение антропогенных зон происходит вручную. Кроме того, возрастает скорость обработки данных.
В АО «ТомскНИПИнефть» сотрудниками управления экологии и специализированного института по геоинформационным системам совместно была поставлена задача по автоматизации процесса распознавания лесных вырубок как одного из факторов антропогенного воздействия на основании
аэрокосмических снимков.
В рамках статьи приводится начальный этап работы по созданию системы автоматизированного дешифрирования зон антропогенного воздействия с примером в виде вырубок, а именно рассмотрены различные варианты данных ДЗЗ, а также построен один из алгоритмов для решения поставленной задачи.
О возможности применения различных данных ДЗЗ
В последние годы подход по распознаванию образов по результатам съемки беспилотных летательных аппаратов (БПЛА) активно развивается и масштабируется. Несмотря на это, исторически используемый подход по дешифрированию по космическим снимкам сохраняет ряд преимуществ, в том числе позволяет охватить большие территории и получить общий вид состояния лесных массивов на глобальном уровне. По космическим снимкам можно систематически наблюдать изменения в массиве лесов, а также анализировать динамику и воздействие на экосистему.
Определение области вырубок по космическим снимкам представляет собой сложную задачу, которая требует тщательного анализа при обработке данных. Основные сложности состоят в том, что вырубки, как правило, сопровождаются негативными факторами, такими как укрытие растительностью или недостаточное пространственное разрешение снимков. Космические снимки обладают ограничением на допустимое пространственное разрешение, что ярко выражено при работе с отдаленными участками. Это может затруднять точную идентификацию вырубки и оценку соответствующих параметров, таких как размеры и форма.
Кроме того, сезонные изменения в растительности, уровень осадков или процент облачности влияют на качество и доступность космических снимков. Для получения достоверных результатов необходимо проводить анализ нескольких снимков, сделанных в разные временные периоды, например, в разные сезоны года. Это позволит учесть негативные факторы и получить более точные оценки.
БПЛА, как сравнительно новая технология, также предлагает ряд преимуществ для определения вырубок. Полученные снимки обладают высоким разрешением и позволют определить не только границы вырубки, но и состояние, степень повреждения и тип вырубки. Это может быть полезно для небольших участков или труднодоступных районов, которые затруднительно определить с помощью космических снимков.
Кроме того, использование БПЛА обеспечивает возможность проведения детального анализа и дополнительных исследований, таких как сбор дополнительных данных о типах деревьев, структуре древостоя и здоровье леса. Это позволяет получать подробный вид вырубки и сделать анализ последствий для окружающей среды.
Однако, несмотря на преимущества БПЛА, использование данных аэрофотосъемки для распознавания области вырубок пока имеет существенный недостаток — высокую стоимости съемки. Для использования снимков БПЛА необходим ряд условий: средства БПЛА, подготовленные сотрудники, необходимое оборудование для разных видов съемки, командирование на места съемки. В итоге стоимость получается в разы выше, чем покупка космических снимков, что делает их ограниченными в использовании для некоторых организаций и исследователей. Кроме того, есть ограничения законодательства и требования в области безопасности, что снижает возможность их использования на некоторых территориях.
Использование методов машинного обучения
Определение антропогенных зон относится к классу задач по распознаванию образов. Для решения таких задач используются математические методы, например, методы пороговой обработки изображений, а также методы наращивания областей, методы машинного обучения [1, 2]. Последнее получило применение в области распознавания изображений благодаря способности обрабатывать большие объемы данных и находить сложные закономерности. Применение нейронных сетей для распознавания антропогенных зон может повысить точность и скорость выполнения этого процесса.
Преимуществом такого подхода является способность работать с неструктурированными данными, такими как космические снимки. Нейронные сети могут использовать пиксельные данные изображений и находить в них закономерности. Это способствует нахождению скрытых признаков или шаблонов, которые могут быть невидимы при анализе другими методами.
Одной из возможных структур нейронных сетей для распознавания являются сверточные нейронные сети (CNN — Convolutional Neural Networks) [3], изначально разработанные для обработки изображений и применяемые в анализе и классификации объектов. Сверточные слои нейронной сети извлекают базовые признаки, такие как линии, углы и текстуры, а потом распознают сложные уровни признаков, например, формы деревьев или границы вырубок. Это делает их подходящим выбором для обработки данных ДЗЗ.
Другой тип нейронных сетей, который может использоваться, — это рекуррентные нейронные сети (RNN — Recurrent Neural Networks) [4]. Они подходят для анализа последовательностей данных и могут использоваться для определения динамики вырубок. Например, могут предсказывать, как изменяются антропогенные зоны со временем или выявлять повторяющиеся закономерности в рассматриваемой области.
Использование нейронных сетей и машинного обучения в распознавании вырубок по данным ДЗЗ дает ряд преимуществ. Во-первых, автоматизирует процесс и повышает скорость обработки больших объемов данных, что позволяет сократить трудозатраты сотрудников на ручное распознавание, тем самым высвобождая время для других задач. Во-вторых, обнаруживает сложные закономерности и шаблоны, которые могут быть пропущены человеком, что может позволить достичь более высоких показателей точности, а также извлечь новую информацию для дальнейшего исследования. Наконец, нейронные сети и машинное обучение предполагают создание моделей, которые могут адаптироваться и улучшаться по мере получения новых данных, что положительно скажется на преимуществе такого подхода.
Описание построенного алгоритма дешифрирования
В рамках статьи рассматривается использование космических снимков для распознавания вырубок в силу большей практической применимости. Такое решение обуславливается вышеописанными преимуществами и недостатками различных данных ДЗЗ.
Ключевым моментом для распознавания вырубок является качество исходных данных (параметры разрешения, зашумленность изображения, точность разметки и масок), на основе которых будет происходить обучение и валидация модели. Для исследовательских целей в обучении модели обычно используются данные из открытых источников, однако для решения производственных задач было принято решение использовать более качественные ранее закупленные и предварительно распознанные оператором космические снимки. Спутниковые снимки имеют разрешение до 2-х метров с 4-мя каналами и 16-битной цветовой гаммой. Данные космические снимки были предварительно подготовлены для обучения модели: размечены с учетом сезонности, растительности и других факторов. Примеры исходных данных и их маски можно увидеть на рисунках 1 и 2.
Рис. 1. Площадные объекты и их маски, как вырубки

Рис. 2. Транспортная инфраструктура и ее маска

Стоит отметить, что показанные вырубки в виде транспортной инфраструктуры и площадных объектов составляют основную часть имеющегося набора данных. В обучающей выборке, необходимой для обучения нейронной сети, использовались космические снимки общей площадью 22,89 км2, из которой вырубки составляют 2,94 км2.
Задача распознавания вырубок по космическим снимкам в нашей постановке относится к классу задач семантической сегментации, когда каждому пикселю входного изображения должен быть подобран свой класс. В данном случае речь о бинарной классификации.
В рамках исследуемой задачи нами было принято решение использовать базовую структуру нейронной сети с многослойным перцептроном. Решение поставленной задачи было начато с рассмотрения его возможностей. Несмотря на то, что перцептрон не способен учесть сложные взаимосвязи между данными, такие как геометрическое расположение пикселей относительно друг друга, у него есть некоторые преимущества, обусловленные простой структурой и небольшим числом параметров:
• перцептрон обладает высокой скоростью обучения;
• перцептрон обладает возможностью интерпретации влияния параметров на конечный результат;
• перцептрон требует меньше вычислительных ресурсов для обучения и сохранения модели;
• перцептрон справляется с задачами, где данные содержат простую структуру.
Для передачи данных для обучения в перцептрон применялся подход на основе конвертации многомерного массива данных космического снимка в двухмерный массив, чтобы значения каналов одного пикселя содержались в одной строке, а сами номера строк представляли собой номера исходных пикселей (рис. 3).
Рис. 3. Принцип конвертации массивов данных

Для обучения представленных данных была построена полносвязная нейронная сеть с двумя скрытыми слоями 32 и 64 нейрона в каждом. Входным слоем служило число нейронов, соответствующее числу каналов входного изображения, в нашем случае 4. Выходной слой представлял собой два нейрона для бинарной классификации (рис. 4.). Функция активации для скрытых слоев была выбрана ReLu, а для выходного слоя Softmax [5].

Рис. 4. Схема нейронной сети

В качестве метода оптимизации был выбран алгоритм Adam [6], в качестве функции потерь была принята кроснэнтропийная разница между маской и прогнозами модели, а в качестве метрики при обучении использовалась точность. Обучение прекращалось, если точность модели при прохождении эпохи не увеличилась больше, чем 0,001.
Текущие результаты
Модель показала существенную зависимость от входных данных для обучения и валидации. Ввиду самостоятельного выбора порога значения вероятности для бинарной классификации можно говорить только об интервальном оценивании характеристик модели. При применении обученной нейронной сети на данных, полученных с тех же космических аппаратов и того же сезона съемки, что и в обучающей выборке, результаты по точности и полноте находятся в диапазоне 71–78 %. В то время как для существенно отличающихся по характеристикам разрешения или сезону съемки космических снимков результаты распознавания являются низкими и находятся в диапазоне 18–26 % точности и полноты. Эту проблему можно решить путем увеличения выборки данных или использования более сложных нейронных сетей.
На рисунке 6 представлен результат работы нейронной сети для предложенных космоснимков (рис. 5). Чем ближе цвет к черному, тем выше вероятность, что это вырубка.
Рис. 5. Участок космоснимка для распознавания

Рис. 6. Результат работы алгоритма

Элешкевич А.Д., Еременко М.С., Сайбель Е.Г., Христолюбов И.А., Чернов А.Г.

АО «ТомскНИПИнефть», Томск, Россия

nipineft@tomsknipi.ru
Метод численного моделирования с использованием данных дистанционного зондирования Земли.
распознавание образов, данные ДЗЗ, антропогенные зоны, компьютерное зрение, машинное обучение, лесные вырубки, экологический мониторинг, нейронные сети
Элешкевич А.Д., Еременко М.С., Сайбель Е.Г., Христолюбов И.А., Чернов А.Г. Применение методов автоматизированного дешифрирования в задачах распознавания зон антропогенного воздействия на нефтегазовых месторождениях // Экспозиция Нефть Газ. 2023. № 7. С. 127–131. DOI: 10.24412/2076-6785-2023-7-127-131
14.11.2023
УДК 528.77
DOI: 10.24412/2076-6785-2023-7-127-131

Рекомендуемые статьи
© Экспозиция Нефть Газ. Научно-технический журнал. Входит в перечень ВАК
+7 (495) 414-34-88