DOI QR코드

DOI QR Code

Sea Ice Type Classification with Optical Remote Sensing Data

광학영상에서의 해빙종류 분류 연구

  • Chi, Junhwa (Unit of Arctic Sea-Ice Prediction, Korea Polar Research Institute) ;
  • Kim, Hyun-cheol (Unit of Arctic Sea-Ice Prediction, Korea Polar Research Institute)
  • 지준화 (극지연구소 북극해빙예측사업단) ;
  • 김현철 (극지연구소 북극해빙예측사업단)
  • Received : 2018.11.27
  • Accepted : 2018.12.17
  • Published : 2018.12.31

Abstract

Optical remote sensing sensors provide visually more familiar images than radar images. However, it is difficult to discriminate sea ice types in optical images using spectral information based machine learning algorithms. This study addresses two topics. First, we propose a semantic segmentation which is a part of the state-of-the-art deep learning algorithms to identify ice types by learning hierarchical and spatial features of sea ice. Second, we propose a new approach by combining of semi-supervised and active learning to obtain accurate and meaningful labels from unlabeled or unseen images to improve the performance of supervised classification for multiple images. Therefore, we successfully added new labels from unlabeled data to automatically update the semantic segmentation model. This should be noted that an operational system to generate ice type products from optical remote sensing data may be possible in the near future.

광학 위성영상은 레이더 영상에 비해 시각적으로 친숙한 영상을 제공한다. 하지만해빙종류에 대한 구분은 분광학적으로 쉽지 않아 기존 기계학습에서 주로 사용하는 분광정보를 이용한 분류기법을 이용했을 경우 광학영상에서 해빙종류의 구분은 매우 어렵다. 본 연구에서는 분광정보 기반의 분류모델이 아닌 딥러닝 기반 분류기법인 semantic segmentation을 이용하여 계층적, 공간적 패턴을 학습하여 해빙종류 분류를 수행하였다. 또한 주기적으로 획득되는 광학위성자료에 비해 감독분류에서 매우 중요한 양질의 레이블 자료는 수집하는데 있어 높은 시간 및 노동 비용이 소모된다. 본 연구에서는 부족한 레이블 자료로 인해 어려운 다중영상에 대한 감독분류 문제를 준지도학습과 능동학습의 결합을 통해 해결을 시도 하였다. 이를 통해 레이블 되지 않은 새로운 영상자료로부터 추가적인 레이블을 스스로 학습하여 분류모델을 강화할 수 있었으며, 이는 향후 광학영상 기반의 운영 가능한 해빙종류 산출물 개발에도 적용될 수 있을 것으로 기대된다.

Keywords

요약

광학 위성영상은 레이더 영상에 비해 시각적으로 친숙한 영상을 제공한다. 하지만해빙종류에 대한 구분은 분광학적으로 쉽지 않아 기존 기계학습에서 주로 사용하는 분광정보를 이용한 분류기법을 이용했을 경우 광학영상에서 해빙종류의 구분은 매우 어렵다. 본 연구에서는 분광정보 기반의 분류모델이 아닌 딥러닝 기반 분류기법인 semantic segmentation을 이용하여 계층적, 공간적 패턴을 학습하여 해빙종류 분류를 수행하였다. 또한 주기적으로 획득되는 광학위성자료에 비해 감독분류에서 매우 중요한 양질의 레이블 자료는 수집하는데 있어 높은 시간 및 노동 비용이 소모된다. 본 연구에서는 부족한 레이블 자료로 인해 어려운 다중영상에 대한 감독분류 문제를 준지도학습과 능동학습의 결합을 통해 해결을 시도 하였다. 이를 통해 레이블 되지 않은 새로운 영상자료로부터 추가적인 레이블을 스스로 학습하여 분류모델을 강화할 수 있었으며, 이는 향후 광학영상 기반의 운영 가능한 해빙종류 산출물 개발에도 적용될 수 있을 것으로 기대된다.

1. 서론

얼음과 눈의 높은 알베도는 태양 에너지의 가장 큰 반사체로 바다와 대기간 열 교환을 줄여주며, 극지역의해빙은 기후 시스템에 있어 중요한 지시자 역할을 한다. 극지역의 얼음이 얇아지는 현상은 지구 온난화를 가속화하며, 이는 우리가 직면한 가장 심각한 문제 중 하나이다. 그러나 기후 연구에 있어 중요한 입력인자인 해빙의 시공간적인 높은 변동성과 불확실성에 의해 각종 해빙 특성의 정확한 산출이 어렵다(Aagaard and Carmack,1989; Cho and NaoAki, 2015; Ivanova et al., 2014; Liu et al.,2004; Spreen et al., 2008; Vavrus and Harrison, 2003).

극지역의 해빙은 일반적으로 형성 및 환경에 따라 다양한 유형으로 구분되는데, 일반적으로 연령, 형태 및 두께에 따라 크게 단년생(First-year)과 다년생(Multi-year) 해빙으로 구분할 수 있다. 단년생 해빙은 겨울에 생겼다가 여름에 사라지는 두께가 30 cm – 2 m의 해빙을 말하며, 다년생 해빙은 여름에도 녹지 않고 2년 이상 살아있는 두께 2 m 이상의 해빙을 말한다. 또한 두께 30cm 이하의 해빙은 닐라스(Nilas)라 하며, 이는 10 – 30 cm의유년빙(Young ice)과 10cm 이하의 신생빙(New ice)으로 세분화할 수 있다. 단년생과 다년생 해빙은 일반적으로 두께와 거칠기, 알베도 등에 의해 구분할 수 있는데, 이는 수동마이크로파나 SAR 영상에서 밝기온도 값이나 표면 거칠기 등으로 구분이 가능하다. 수동마이크로파와 SAR 영상은 날씨와 관계없이 영상 획득이 가능하다. 하지만 수동마이크로파 영상은 수 km에 달하는 낮은 공간해상도, SAR 영상은 관측 범위가 제한적인 단점이 존재한다. 표면 반사율을 기록하는 같은 광학영상은 구름에 의한 영상 획득에 제한이 있지만, MODIS(Moderate Resolution Imaging Spectroradiometer)와 VIIRS(Visible Infrared Imaging Radiometer Suite) 등의 중저해상도 센서는 매일 전 지구 관측이 가능하며, 수동마이크로파나 SAR 영상에 비해 일반인에게도 친숙한 컬러 영상을 제공할 수 있다는 장점이 있다. Cavalieri et al.(2006)과Cavalieri et al.(2010) 에서는 광학영상에서 알베도(ρ)를 이용하여 해빙의 종류를 신생빙 (0.1≤ρ≤0.4), 유년빙(0.4≤ρ≤0.6), 단년생 해빙 (0.6≤ρ)으로 정의하였으나,광학영상의 표면 반사율 정보를 이용한 해빙종류의 구분은 매우 제한적이다.

딥러닝(Deep learning)은 최근 관심도가 크게 증가하고 있는 기계학습(Machine learning)의 한 분야로 층(Layer)을 겹겹이 쌓아 올린 인공신경망(Artificial neural network)을 사용하여 이터로부터 의미있는 표현을 점진적으로 학습하는 방식이다(LeCun et al., 2015; Zhang et al., 2016). 딥러닝은 컴퓨터비전을 비롯하여 생물학, 경제학 등 다양한 학문 분야에서 활발한 연구가 진행되어오고 있고, 원격탐사 분야에서도 관심이 급증하고 있다(Chi and Kim, 2017). 기계학습 또는 딥러닝을 이용한 위성영상으로부터의 해빙종류는 매우 제한적으로 수행되었다. Ressel et al.(2015)은 TerraSAR-X 자료로부터 gray-level co-occurrence matrix를 이용한 텍스처를 추출,이를 인공신경망의 입력자료로 사용하여 바렌츠해에서 네 종류의 해빙을 최소 70%이상의 정확도로 분류하였다. Shen et al.(2017)은 CryoSat-2의 웨이브폼 데이터와 random forest 기계학습 분류기법을 이용, 단년생, 다년생 해빙종류를 약 84%의 정확도로 분류하는 연구를 수행하였다.

본 연구에서는 광학영상으로부터 운영 가능한 해빙 종류 산출물 개발을 위해 두 가지 연구내용을 포함한다. 첫째, 기존 기계학습 기반 분류기법에 의해 광학영상에서 분광학적으로 분류가 힘든 단년생, 다년생 해빙종류의 분류 문제를 딥러닝 기반 분류 기법을 통해 해결하였다. 둘째, 레이블 되지 않은 영상으로부터 추가적인 레이블 자료를 생성하여 기존 분류기를 강화학습 시킬 수 있는 준지도학습(Semi-supervised learning)과 능동학습(Active learning) 기법을 이용하여 다중영상 분류에 적합한 분류기 개발 기법을 제안하였다. 본 연구에서 제안하는 딥러닝 기반 분류 기법은 레이블 데이터를 이용한 감독분류 기반의 분류기로 다중영상 분류시 양질의 레이블 자료 확보가 매우 중요하다. 특히 레이블 자료가 충분하지 않은 경우 분류기 훈련에 개입되지 않은 새로운 영상에서 기존에 훈련된 분류기를 그대로 사용하기 어렵다. 따라서 본 연구는 딥러닝 기반 분류기법을 통해 해빙종류에 대한 분류 정확도를 우선적으로 향상시키고, 준지도 및 능동학습을 통해 다중영상 분류에도 대응할 수 있는 분류기를 제안하여 향후 운영 가능한 해빙종류 산출물 개발을 목표로 한다.

2. 연구방법

1) Sematic segmentation

딥러닝은 수십 개, 수백 개의 연속된 계층적 층을 가지고 데이터로부터 모델을 학습시키는데, 각 층은 추상적인 특징부터 복잡한 특징까지 특정 문제 해결에 있어 유용하게 사용되는 다단계 정보 추출 방식이다. 딥러닝의 기본인 인공신경망은 네트워크(모델)를 구성하는 층,네트워크를 훈련 시키기 위한 입력 데이터(X)와 타겟데이터(y), 학습의 성공 여부를 결정하는 손실 또는 목적함수(loss or objective function), 네트워크의 가중치 업데이트를 결정하기 위한 옵티마이저로 구성되며, Fig. 1과 같이 이들 요소의 상호 작용에 의해 네트워크를 훈련 시킨다(Chollet, 2018).

Fig. 1. basic framework of deep learning network.

많은 딥러닝 기법 중 합성곱신경망(Convolutional eural network, 이하 CNN)은 이미지 분류 문제 해결을 위해 가장 일반적으로 사용되는 기법이다. 하지만 CNN은 하나의 이미지가 입력되었을 때 해당 이미지가 나타내는 객체를 식별하는데 주로 사용된다. 예를 들어 비행기를 식별하기 위해 여러 장의 비행기 이미지를 이용하여 CNN 모델을 훈련 시켰을 때 분류 모델은 해당 객체가 비행기인지 아닌지 또는 비행기의 기종을 구분할 뿐, 이미지 내에서 비행기와 활주로, 땅 등을 구분하지는 못한다. 반면 semantic segmentation은 이미지의 모든 픽셀에 레이블을 하여 이미지를 여러 개의 클래스의 집합으로 표현하는 딥러닝 알고리즘이다. Semantic segmentation은 자율주행, 로봇비전, 의료영상 등 정밀한 이미지 분류 지도가 필요한 다양한 산업분야에서 사용되고 있으며, 원격탐사 영상의 피복 분류에도 적합한 딥러닝 분류 기법이다(Noh et al., 2015; Shelhamer et al., 2017).

Fig. 2(a)는 전형적인 CNN의 아키텍처이다. CNN은 입력 이미지의 차원을 연속된 필터를 통과하면서 각 층마다 다양한 공간적 계층 정보를 단계적으로 학습하는 기법이다(Krizhevsky et al., 2012). CNN의 각 층은 필터와 풀링 레이어를 통과하면서 입력이미지의 높이와 넓이가 작아지는 경향을 보이는데 얕은 층에서는 작은 지역 패턴을 학습하고 깊은 층에서는 이전 층들의 특징으로 구성된 더 큰 패턴을 학습하여 최종적으로 사전에 정의된 여러 개의 카테고리 중 하나로 분류된다. CNN은 복잡하고 추상적인 시각적 개념을 효과적으로 학습할 수 있다는 장점이 있으나, 이미지의 각 픽셀에 대한 분류를 수행할 수 없다. 반면 본 연구에서 제안하는 semantic segmentation으로 네트워크 아키텍처는 Fig.2(b)와 같다. Semantic segmentation은 CNN처럼 우선 각층에서 풀링 레이어를 사용하여 이미지를 다운샘플링하고, 그 이후 동일한 개수의 언풀링 레이어를 사용하여 업샘플링을 하여 입력 이미지와 동일한 크기의 출력 이미지를 생성한다(Noh et al., 2015; Shelhamer et al., 2017). 이를 통해 최종적으로 이미지의 각 픽셀에 대한 분류 결과 지도를 생성할 수 있다.

OGCSBN_2018_v34n6_2_1239_f0002.png 이미지

Fig. 2. Comparison of (a) convolutional neural network and (b) semantic segmentation.

2) 준지도학습과 능동학습

원격탐사 자료의 피복 분류는 대부분 감독분류에 의해 이루어지는데, 딥러닝 기반 분류 기법 역시 대부분 감독분류의 한 종류이다. 감독분류를 위해서는 각각의 클래스를 구분할 수 있는 충분한 양과 정확도 높은 레이블 자료가 필수적이다 적은 양과 정확도가 낮은 레이블 자료는 원격사자료의 피복 분류를 적절히 수행하기 힘들게 하고, 또 지나치게 많은 레이블 자료는 분류기 훈련 속도를 크게 저하시키거나 과적합 문제를 발생시켜 새로운 자료에서의 분류 정확도가 떨어지는 현상을 보이게 된다. 이러한 감독분류에서 중요한 역할을 하는 레이블 자료의 구축은 현장조사 또는 전문가에 의해 수행되는데 그 시간과 비용이 많이 소모되어 감독분류 문제에서 가장 큰 어려움으로 남아 있다(Bruzzone and Prieto, 2001; Crawford et al., 2013; Foody et al., 2006; Yang and Crawford, 2016). 이를 보완하기 위해 준지도학습과 능동합습과 같은 여러가지 연구가 제안되었는데, 준지도학습은 적은 레이블 자료로 훈련된 초기 모델에 의해 분류된 레이블이 없는 자료 중 분류결과의 불확실성이 낮은 자료를 새로운 훈련자료로 사용하는 방법이고(Bruzzone et al., 2006; Ma et al., 2016; Zhu, 2006), 능동학습은 레이블되지 않은 자료로부터 어떤 샘플링 기법에 의해 선정된 후보군들이 분석자(oracle)에 의해 레이블이 할당되는 방식이다(Crawford et al., 2013; Tuia et al., 2009; Tuia et al., 2011). 준지도학습은 어떤 개입 없이 비접근 지역에서 새로운 레이블 자료를 추가할 수 있다는 장점이 있지만, 클래스간 분광학적 혼재가 있는 경우 후보군 추출이 어렵고, 잘못 선택된 레이블 후보군으로 인해 최종적으로 분류에 실패할 수 있다는 단점이 있다. 능동학습은 비지도학습과 반대로 새로운 레이블 후보군으로 선정된(일반적으로 불확실성이 높은 자료) 자료를 분석자나 전문가의 개입에 의해 정확한 클래스를 할당함으로써 크기는 작지만 가지고 있는 정보는 풍부한 새로운 레이블 자료를 선정하는 방법이다. 하지만 능동학습은 분석자나 전문가에 의해 정확한 클래스 정보 할당이 필수적이어서 비접근 지역이나 분석자가 없는 경우 정확한 레이블링이 어렵다.

해빙종류에 대한 정보는 러시아남북극연구소(Arctic and Antarctic Research Institute; www.aari.ru)에서 광학/레이더영상과 해안관측소/선박에서 얻은 정보를 이용하여 분석된 해빙종류에 관한 벡터자료를 일주일 간격으로 제공되고 있고, OSISAF(Ocean and Sea Ice Satellite Application Facility; www.osi-saf.org)에서는 수동마이크로파 위성자료로부터 단년생, 다년생 해빙에 대한 일간정보를 제공하고 있다. 벡터자료의 경우 1:10,000,000의 축척을 가지는데 이는 수십~수백미터 해상도의 광학 영상과 비교하기에는 해상도가 매우 낮으며, 수동마이크로파 기반 해빙종류 산출물 역시 정량적으로 분석되어 제공되나 10 km라는 낮은 공간해상도의 한계가 존재다.

본 연구에서는 OSISAF 해빙종류 산출물을 이용하여 얻은 적은 레이블 자료를 이용하여 훈련된 분류델을 다른 시기, 다른 지역의 자료 분류시 재사용하면서 낮아지는 분류 정확도 문제를 해결하기 위해 준지도학습과 능동학습을 융합하여 작은 레이블셋이지만 다중시기 영상 분류에 적합한 추가적인 레이블 자료(D′L, 2)를 획득하고, 이를 이용하여 분류모델 업데이트를 Fig. 3과같이 수행하였다.

OGCSBN_2018_v34n6_2_1239_f0003.png 이미지

Fig. 3. Illustration of semi-supervised learning and active learning.

Fig. 3의 제안된 방법론의 준지도학습 부분 중 DL, 1,DU, 2, DL, 2은 각각 데이터셋1의 레이블자료, 데이터셋2의 레이블되지 않은 자료, 준지도학습에 의해 최종적으로 추가된 데이터셋2의 레이블자료를 뜻하며, XL, 2는 준 지도학습에 의해 추가되는 확실성 높은 레이블 후보군이다. 능동학습은 분석자의 개입이 필요한데, 본 연구에서는 준지도학습에 의해 추가된 레이블자료인 DL, 2가 레이블 후보군과 분석자 역할을 동시에 하였고, DL, 2에서 불확실성이 높은 자료부터 샘플링을 시도(X′L, 2), 최적화된 레이블자료(D′L, 2)를 데이터셋2로부터 얻었다. 따라서 본 연구는 궁극적으로 Fig. 4와 같이 불확실성이 낮은 자료로부터 새로운 레이블을 만드는 준지도학습의 반복 학습에 의해 커지는 잉여 레이블 자료 중 분류기의 클래스간 경계 결정에 중요한 역할을 하는 양질의 레이블자료를 능동학습을 이용하여 선택하여 크기는 작지만 비슷한 수준의 분류정확도를 가진 레이블셋을 획득하는 것이 궁극적인 목표이다.

OGCSBN_2018_v34n6_2_1239_f0004.png 이미지

Fig. 4. Comparison of learning curves

3. 실험 및 결과

1) 데이터셋 설명

본 연구에서 해빙종류 분류를 위해 사용하는 자료는 높은 촬영빈도와 분광해상도로 원격탐사 활용연구에서 많이 사용되는 MODIS영상이다. 얼음은 SWIR(Shortwave Infrared)에서 반사율이 낮은 반면 구름은 높은 반사율을 지니는데 SWIR 밴드가 없는 KOMPSAT(Korea Multi-Purpose Satellite)과 같은 고해상도 영상에 비해 MODIS영상을 이용하면 분광학적으로 얼음과 구름의 구분이 쉽다. Terra와 Aqua 위성에 탑재된 MODIS 센서는 다양한 형태로 자료가 제공되는데 본 연구에서는 Terra 위성에서 획득된 Level2 자료 중 대기보정된 반사율 자료인 MOD09GA중 500 m 공간해상도를 지닌 7개의 밴드(620-670 nm; 841-876 nm; 459-479 nm; 545-565 nm; 1230-1250 nm; 1628-1652 nm; 2105-2115 nm)를 사용하였다. OSISAF는 다양한 해빙정보 산출물을 제공하는데, 그 중 해종류 산출물은 수동마이크로파 자료, 능동마이크로파 산란계 자료, 기상자료 등을 입력인자로 하여 베이지안 다중 센서 방법론(Bayesian multi sensor approach)을 이용하여 산출되며(Breivik et al., 2012),극지역 해빙종류를 크게 단년생과 다년생 해빙으로 분류하여 제공되고 있다. Fig. 5는 2016년 4월 19일에 Terra MODIS에서 획득된 북극 컬러 모자이크 영상(R/G/B: 1/6/7)과 OSISAF에서 제공되는 해빙종류 영상이다.

OGCSBN_2018_v34n6_2_1239_f0005.png 이미지

Fig. 5. Remote sensing datasets: (a) MODIS false color composite (D1: dataset 1; D2: dataset 2); (b) OSISAF sea ice type.

본 연구에서는 북극의 일부 지역만을 이용하여 본 연구에서 제시한 분류기법의 가능성을 검증하였으며, 사용된 분류모델의 훈련 및 검증을 위해 사용된 MODIS 영상과 OSISAF 해빙종류 영상은 Fig. 6과 같으며, 10 km 해상도의 OSISAF 해빙종류 자료는 MODIS의 500 m 해상도에 맞게 조정되었다. 단, MODIS 픽셀과 가장 근접한 OSISAF 해빙종류 자료의 픽셀과의 거리가 10 km이상인 경우 ambiguous 클래스로 정하여 분류모델 훈련 및 검증에 사용하지 않았다. 데이터셋 1 (76°9′4.07″N,146°6′9.56″W)과 데이터셋2 (78°9′20.19″N, 165°7′55.97″W)는 보퍼트해와 척치해 주변의 영상으로 봄철 단년생 해빙과 다년생 해빙이 동시에 관측되는 지역이며, 각각 약 300 km×300 km 크기를 가지고 있다.

OGCSBN_2018_v34n6_2_1239_f0006.png 이미지

Fig. 6. MODIS datasets with corresponding labels from OSISAF ice type product.

2) 분류모델 비교

본 연구의 첫번째 실험에서는 기존에 많이 사용되는 분류기와 본 연구에서 제안한 semantic segmentation을 이용하여 정성적, 정량적인 분류결과 비교를 통해 광학 영상에서의 해빙종류 분류에 적합한 분류모델을 선정하였다. 비교할 분류 모델은 간단하지만 실용적인 knearest neighbor(k-NN)와 높은 분류 정확도로 원격탐사자료 분류에 많이 사용되는 support vector machine(SVM)이다. 세가지 분류모델 모두 데이터셋1에 대해 전체 자료의 80%를 모델 훈련을 위해, 나머지 20%는 모델의 정량적 검증을 위해 사용하였고 훈련자료 중 30%는 분류모델의 파라미터를 최적화하는데 사용하였다. k-NN은10개의 인접 화소를 이용하였고, SVM은 RBF(Radial basis function) 커널을 이용하였다. Semantic segmentation은 좀 많은 파라미터를 요구하는데 본 연구에서는 Fig. 7과 같은 구조의 네트워크 구성을 사용하다.

OGCSBN_2018_v34n6_2_1239_f0007.png 이미지

Fig. 7. Network topology of semantic segmentation

Table 1에서는 데이터셋 1에 대한 세가지 분류모델에 대해 단년생/다년생 해빙 분류 정확도를 overall accuracy와 kappa 상관계수로 보여주며, Fig. 8은 훈련된 분류기를 데이터셋1 전체에 적용했을 때 얻어진 분류모델별 정성적 분류 결과이다. Table 1에서 보듯 semantic segmentation의 경우 k-NN과 SVM에 비해 월등히 높은 통계적 정확도를 보여주고 있다. Fig. 8의 생성된 해빙종류 분류 지도를 통한 결과와 Fig. 6의 OSISAF해빙종류 자료와 비교시에도 k-NN과 SVM은 분광학적으로 구분이 어려운 단년생과 다년생 해빙을 적절히 구분하지 못하였고, 특히 많은 다년생 해빙을 단년생 해빙으로 오분류하는 결과를 얻었다. 반면 수 백개의 계층적 필터를 이용하여 영상의 공간적 특징 등을 이용한semantic segmentation은 광학영상에서 해빙의 종류를 적절히 분류하였다. 이는 분광정보로는 해빙종류의 구분이 쉽지 않음을 보여주고 있으며, 공간적 특징이나 질감 정보 등이 더 효과적으로 해빙종류를 구분할 수 있다는 것을 보여주었다.

OGCSBN_2018_v34n6_2_1239_f0008.png 이미지

Fig. 8. Sea ice type maps generated from dataset 1: (a) k-NN; (b) SVM (RBF); (c) semantic segmentation.

Table 1. Statistical accuracy comparisons of k-NN, SVM and semantic segmentation

OGCSBN_2018_v34n6_2_1239_t0001.png 이미지

3) 준지도학습과 능동학습을 통한 다중영상 분류

앞의 실험 결과에서 semantic segmentation이 광학영상에서 해빙종류를 구분하는데 적합한 분류모델이라는 것을 확인했다. 하지만 semantic segmentation과 같은 감독분류에서는 다양한 지역과 시기의 영상 분류 수행을 위해 필요한 양질의 레이블자료 획득이 매우 어렵다. 본 연구에서 제안된 분류모델 역시 모델 훈련에 사용된 데이터셋1에서는 높은 정확도로 분류가 수행 되지만,분류모델 훈련에 사용되지 않은 데이터셋2에 적용을 하게 되면 분류 정확도가 약 63% (kappa: 0.06)로 크게 낮아지는 것을 볼 수 있다. 본 실험은 준지도 학습을 이용하여 레이블 되지 않은 데이터셋2로부터 레이블 자료를 추가적으로 학습하여, 데이터셋1과 데이터셋2 모두에 적합한 분류모델을 훈련하고, 능동학습을 통해 준지도 학습에서 추가된 레이블 자료 중 분류에 꼭 필요한 자료를 샘플링하여 그 결과를 비교하였다. Fig. 9(a)는 데이터셋 2를 OSISAF 해빙종류 자료로부터 획득한 레이블 자료를 이용하여 분류를 수행했을 때 결과이고,Fig.9(b)는 데이터셋2에 대한 레이블이 없다는 가정하에 데이터셋1에서 훈련된 분류모델을 데이터셋2에 재사용했을 때 분류 결과이다. Fig. 9(c)는 준지도학습에 의해 학습된 레이블을 이용하여 훈련된 모델의 결과, Fig. 9(d)는 불확실성 샘플링을 이용한 능동학습의 결과이고,Fig. 9(e)는 준지도학습과 능동학습의 학습 단계(학습당 200개의 레이블 추가) kappa값의 변화 그래프이다. 단,능동학습의 경우 불확실성이 높은 레이블에 대해 클래스를 결정해주어야 하는 분석자가 필요한데, 본 실험에서는 분석자의 역할을 준지도학습에서 얻어진 해빙종류 레이블 자료를 이용하였다.

OGCSBN_2018_v34n6_2_1239_f0009.png 이미지

Fig. 9. Sea ice type classification results of dataset 2 using (a) supervised learning trained on true labels; (b) supervised learning trained on dataset 1; (c) semi-supervised learning; (d) active learning, and (e) kappa coefficient curves.

Fig. 9(c)에서 보는것과 같이 준지도학습의 경우 레이블 자료가 없는 데이터셋2로부터 적절한 레이블 자료를 자동으로 찾아 추가함으로써 데이터셋2의 실제 레이블을 이용하여 분류모델을 훈련, 수행한 결과인 Fig.9(a)와 매우 유사한 분류 결과를 보여주었다. 하지만 불확실성이 낮은 자료로부터 추가 레이블을 획득하는 준지도학습 특성상 Fig. 9(e)에서 보는 것처럼 학습 초반에는 분류정확도의 상승이 매우 늦었고, 100회 이상 학습했을 때 0.9 이상의 kappa값을 보여주었으며, 약150회의 반복 학습 후에 레이블 자료를 이용한 분류모델과 비슷한 통계적 성능을 볼 수 있었다. 이는 초반에 학습된 데이터의 경우 기존 데이터셋1의 레이블 자료의 특성과 크게 다르지 않은 잉여자료로 분류모델 개선에 크게 도움이 되지 않았다고 판단할 수 있다. 반면 100회 이상의 학습부터는 단년생 해빙과 다년생 해빙의 결정 경계를 좀 더 명확하게 해줄 수 있는 자료가 레이블로 추가되기 시작되었다고 판단된다.

불확실성이 높은 자료에 대해 준지도학습 결과를 분석자로 이용한 능동학습은 Fig. 9(e)에서 보듯이 학습이 빠르게 이루어졌다. 약 30회의 학습으로 0.9 이상의 kappa값을 달성하였고, 준지도학습과 비교했을 시 절반 정도의 약 70회 학습으로 실제 레이블 자료를 이용한 감독분류 결과에 준하는 정확도를 얻을 수 있었다. 또한 Fig. 9(d)에서와 같이 정성적인 해빙종류 분류지도 역시 감독분류 결과(Fig. 9(a))와 OSISAF 해빙종류 산출물(Fig. 6)과 유사한 결과를 얻었다. 능동학습은 분석자의 개입이 필요하다는 점에서 비접근 지역에 대한 추가 레이블 획득이 어렵지만 준지도학습 결과를 분석자로 사용한다면 비접근 지역에 대해서도 추가 레이블 자료의 획득이 가능할 것으 판단된다. 또한 준지도학습에서 추가되는 분류모델 학습에 크게 기여를 하지 않는 잉여자료를 제외시키고 분류 결정경계 결정에 크게 기여하는 레이블을 우선적으로 선별함으로써 전체적이 레이블 자료의 크기를 줄일 수 있어 향후 자료가 많아질 경우 연산에 있어서도 유리할 것으로 판단된다.

4. 결론 및 향후 연구

본 연구에서는 semantic segmentation을 이용하여 광학 영상에서 해빙종류를 분류하였고, 준지도학습과 능동학습의 결합을 통해 적은 레이블 자료를 이용하여 새로운(레이블되지 않은) 영상으로부터 추가적인 레이블을 학습, 다중영상 분류에 적합한 분류방법을 제안하였다. 분광정보를 통해 구분이 힘든 단년생/다년생 해빙 구분에 있어 공간적, 계층적 패턴을 학습하는 semantic segmentation은 기존 기계학습 분류모델에 비해 월등히 좋은 분류 성능을 보여주었고, 준지도 및 능동학습의 결합을 통해 레이블 획득이 어려운 자료로부터 분석자의 개입 없이 추가적인 레이블을 학습 할 수 있었다. 비록 본 연구에서는 제한적인 지역과 시기의 영상만을 이용하여 실험과 검증을 수행하였지만, 향후 북극 전체 지역 영상에 대해 적용했을 경우 광학영상으로부터 운영 가능한 해빙종류 산출물 개발이 가능할 것으로 판단된다. 또한 방법론적인 측면에서도 본 연구에서는 준지도학습과 능동학습에서의 후보군 샘플링을 불확실성을 이용하여 수행하였지만, 향후 연구에서는 극지 해빙종류분류에 더 효과적인 샘플링 기법 개발을 통해 학습 속도 및 분류성능 개선이 가능할 것으로 판단된다.

사사

본 연구는 극지연구소의 “북극 해빙 위성관측을 위한 분석 기술 개발(PE18120)”의 지원에 의해 수행되었습니다.

References

  1. Aagaard, K. and E. C. Carmack, 1989. The Role of Sea Ice and Other Fresh-Water in the Arctic Circulation, Journal of Geophysical Research-Oceans, 94: 14485-14498. https://doi.org/10.1029/JC094iC10p14485
  2. Breivik, L. A., S. Eastwood, and T. Lavergne, 2012. Use of C-Band Scatterometer for Sea Ice Edge Identification, IEEE Transactions on Geoscience and Remote Sensing, 50(7): 2669-2677. https://doi.org/10.1109/TGRS.2012.2188898
  3. Bruzzone, L. and D. F. Prieto, 2001. Unsupervised retraining of a maximum likelihood classifier for the analysis of multitemporal remote sensing images, IEEE Transactions on Geoscience and Remote Sensing, 39(2): 456-460. https://doi.org/10.1109/36.905255
  4. Bruzzone, L., M. M. Chi, and M. Marconcini, 2006. A novel transductive SVM for semisupervised classification of remote-sensing images, IEEE Transactions on Geoscience and Remote Sensing, 44(11): 3363-3373. https://doi.org/10.1109/TGRS.2006.877950
  5. Cavalieri, D. J., T. Markus, D. K. Hall, A. Ivanoff, and E. Glick, 2010. Assessment of AMSR-E Antarctic Winter Sea-Ice Concentrations Using Aqua MODIS, IEEE Transactions on Geoscience and Remote Sensing, 48(9): 3331-3339. https://doi.org/10.1109/TGRS.2010.2046495
  6. Cavalieri, D. J., T. Markus, D. K. Hall, A. J. Gasiewski, M. Klein, and A. Ivanoff, 2006. Assessment of EOS aqua AMSR-E Arctic Sea ice concentrations using Landsat-7 and airborne microwave imagery, IEEE Transactions on Geoscience and Remote Sensing, 44(11): 3057-3069. https://doi.org/10.1109/TGRS.2006.878445
  7. Chi, J. and H. Kim, 2017. Prediction of Arctic Sea Ice Concentration Using a Fully Data Driven Deep Neural Network, Remote Sensing, 9(12): 1305. https://doi.org/10.3390/rs9121305
  8. Cho, K. and K. Naoki, 2015. Advantages of AMSR2 for Monitoring Sea Ice from Space, Proc. of Asian Conference on Remote Sensing, Manila, Philippines, Oct. 19-23.
  9. Chollet, F., 2018. Deep Learning with Python, Manning Publications Co., NY, USA.
  10. Crawford, M. M., D. Tuia, and H. L. Yang, 2013. Active learning: Any value for classification of remotely sensed data?, Proceedings of the IEEE, 101(3): 593-608. https://doi.org/10.1109/JPROC.2012.2231951
  11. Foody, G. M., A. Mathur, C. Sanchez-Hernandez, and D. S. Boyd, 2006. Training set size requirements for the classification of a specific class, Remote Sensing of Environment, 104(1): 1-14. https://doi.org/10.1016/j.rse.2006.03.004
  12. Ivanova, N., O. M. Johannessen, L. T. Pedersen, and R. T. Tonboe, 2014. Retrieval of Arctic Sea Ice Parameters by Satellite Passive Microwave Sensors: A Comparison of Eleven Sea Ice Concentration Algorithms, IEEE Transactions on Geoscience and Remote Sensing, 52(11): 7233-7246. https://doi.org/10.1109/TGRS.2014.2310136
  13. Krizhevsky, A., I. Sutskever, and G. E. Hinton, 2012. ImageNet Classification with Deep Convolutional Neural Networks, Proc. of the 25th International Conference on Neural Information Processing Systems, Lake Tahoe, NV, Dec. 3-6, vol. 1, pp. 1097-1105.
  14. LeCun, Y., Y. Bengio, and G. Hinton, 2015. Deep learning, Nature, 521(7553): 436-444. https://doi.org/10.1038/nature14539
  15. Liu, J. P., J. A. Curry, and D. G. Martinson, 2004. Interpretation of recent Antarctic sea ice variability, Geophysical Research Letters, 31(2).
  16. Ma, X. R., H. Y. Wang, and J. Wang, 2016. Semisupervised classification for hyperspectral image based on multi-decision labeling and deep feature learning, ISPRS Journal of Photogrammetry and Remote Sensing, 120: 99-107. https://doi.org/10.1016/j.isprsjprs.2016.09.001
  17. Noh, H., S. Hong, and B. Han, 2015. Learning deconvolution network for semantic segmentation, Proc. of the IEEE international conference on computer vision, Santiago, Chile, Dec. 11-18, pp. 1520-1528.
  18. Ressel, R., A. Frost, and S. Lehner, 2015. A Neural Network-Based Classification for Sea Ice Types on X-Band SAR Images, IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 8(7): 3672-3680. https://doi.org/10.1109/JSTARS.2015.2436993
  19. Shelhamer, E., J. Long, and T. Darrell, 2017. Fully Convolutional Networks for Semantic Segmentation, IEEE Transactions on Pattern Analysis and Machine Intelligence, 39(4): 640-651. https://doi.org/10.1109/TPAMI.2016.2572683
  20. Shen, X., J. Zhang, J. Meng, J. Zhang, and C. Ke, 2017. Sea ice type classification based on random forest machine learning with Cryosat-2 altimeter data, Proc. of 2017 International Workshop on Remote Sensing with Intelligent Processing, Shanghai, China, May 19-21.
  21. Spreen, G., L. Kaleschke, and G. Heygster, 2008. Sea ice remote sensing using AMSR-E 89-GHz channels, Journal of Geophysical Research-Oceans, 113(C2).
  22. Tuia, D., E. Pasolli, and W. J. Emery, 2011. Using active learning to adapt remote sensing image classifiers, Remote Sensing of Environment, 115(9): 2232-2242. https://doi.org/10.1016/j.rse.2011.04.022
  23. Tuia, D., F. Ratle, F. Pacifici, M. F. Kanevski, and W. J. Emery, 2009. Active Learning Methods for Remote Sensing Image Classification, IEEE Transactions on Geoscience and Remote Sensing, 47(7): 2218-2232. https://doi.org/10.1109/TGRS.2008.2010404
  24. Vavrus, S. and S. P. Harrison, 2003. The impact of sea-ice dynamics on the Arctic climate system, Climate Dynamics, 20(7-8): 741-757. https://doi.org/10.1007/s00382-003-0309-5
  25. Yang, H. L. and M. M. Crawford, 2016. Spectral and Spatial Proximity-Based Manifold Alignment for Multitemporal Hyperspectral Image Classification, IEEE Transactions on Geoscience and Remote Sensing, 54(1): 51-64. https://doi.org/10.1109/TGRS.2015.2449736
  26. Zhang, L. P., L. F. Zhang, and B. Du, 2016. Deep Learning for Remote Sensing Data A technical tutorial on the state of the art, IEEE Geoscience and Remote Sensing Magazine, 4(2): 22-40. https://doi.org/10.1109/MGRS.2016.2540798
  27. Zhu, X., 2006. Semi-supervised learning literature survey, Computer Science, University of Wisconsin-Madison, Madison, WI, USA.