DOI QR코드

DOI QR Code

Estimation of Fractional Urban Tree Canopy Cover through Machine Learning Using Optical Satellite Images

기계학습을 이용한 광학 위성 영상 기반의 도시 내 수목 피복률 추정

  • Sejeong Bae (Department of Civil, Urban, Earth, and Environmental Engineering, Ulsan National Institute of Science and Technology) ;
  • Bokyung Son (Department of Civil, Urban, Earth, and Environmental Engineering, Ulsan National Institute of Science and Technology) ;
  • Taejun Sung (Department of Civil, Urban, Earth, and Environmental Engineering, Ulsan National Institute of Science and Technology) ;
  • Yeonsu Lee (Department of Civil, Urban, Earth, and Environmental Engineering, Ulsan National Institute of Science and Technology) ;
  • Jungho Im (Department of Civil, Urban, Earth, and Environmental Engineering, Ulsan National Institute of Science and Technology) ;
  • Yoojin Kang (Department of Civil, Urban, Earth, and Environmental Engineering, Ulsan National Institute of Science and Technology)
  • 배세정 (울산과학기술원 지구환경도시건설공학과 ) ;
  • 손보경 (울산과학기술원 지구환경도시건설공학과) ;
  • 성태준 (울산과학기술원 지구환경도시건설공학과 ) ;
  • 이연수 (울산과학기술원 지구환경도시건설공학과 ) ;
  • 임정호 (울산과학기술원 지구환경도시건설공학과) ;
  • 강유진 (울산과학기술원 지구환경도시건설공학과 )
  • Received : 2023.09.30
  • Accepted : 2023.10.20
  • Published : 2023.10.31

Abstract

Urban trees play a vital role in urban ecosystems,significantly reducing impervious surfaces and impacting carbon cycling within the city. Although previous research has demonstrated the efficacy of employing artificial intelligence in conjunction with airborne light detection and ranging (LiDAR) data to generate urban tree information, the availability and cost constraints associated with LiDAR data pose limitations. Consequently, this study employed freely accessible, high-resolution multispectral satellite imagery (i.e., Sentinel-2 data) to estimate fractional tree canopy cover (FTC) within the urban confines of Suwon, South Korea, employing machine learning techniques. This study leveraged a median composite image derived from a time series of Sentinel-2 images. In order to account for the diverse land cover found in urban areas, the model incorporated three types of input variables: average (mean) and standard deviation (std) values within a 30-meter grid from 10 m resolution of optical indices from Sentinel-2, and fractional coverage for distinct land cover classes within 30 m grids from the existing level 3 land cover map. Four schemes with different combinations of input variables were compared. Notably, when all three factors (i.e., mean, std, and fractional cover) were used to consider the variation of landcover in urban areas(Scheme 4, S4), the machine learning model exhibited improved performance compared to using only the mean of optical indices (Scheme 1). Of the various models proposed, the random forest (RF) model with S4 demonstrated the most remarkable performance, achieving R2 of 0.8196, and mean absolute error (MAE) of 0.0749, and a root mean squared error (RMSE) of 0.1022. The std variable exhibited the highest impact on model outputs within the heterogeneous land covers based on the variable importance analysis. This trained RF model with S4 was then applied to the entire Suwon region, consistently delivering robust results with an R2 of 0.8702, MAE of 0.0873, and RMSE of 0.1335. The FTC estimation method developed in this study is expected to offer advantages for application in various regions, providing fundamental data for a better understanding of carbon dynamics in urban ecosystems in the future.

도시 수목은 탄소를 저장하고 불투수면적을 감소시키는 도시 생태계의 중요 요소이며, 탄소 저장량 및 순환량 산정 시 주요 정보로 활용될 수 있다. 많은 선행 연구에서 항공 라이다 자료 및 인공지능 기법을 활용하여 고해상도 수목 정보를 산출하고 있으나, 항공 라이다 영상은 제공하는 플랫폼이 제한되어 있으며 비용적인 면에서도 한계가 다수 존재한다. 따라서 본 연구에서는 수원시를 대상으로 자료 취득이 용이한 고해상도 위성 영상인 Sentinel-2를 활용하여 기계학습 기반의 도시 내 수목 피복률(fractional tree canopy cover, FTC)을 추정하고자 하였다. Sentinel-2 시계열 영상으로부터 중앙값 합성을 수행하여 수원시 전역에 대한 단일 영상을 제작하여 활용하였다. 도시 내 토지 피복의 이질성을 반영하기 위하여, 30 m 격자내 10 m 해상도의 광학 지수의 평균 및 표준편차 값과 환경부 세분류 토지 피복 지도 기반 항목별 피복률을 계산하여 기계학습 모델의 입력 변수로 활용하였다. 총 4가지의 입력 변수 조합을 설정하여, 입력 변수 구성에 따른 FTC 추정 정확도를 비교 및 평가하였다. 광학 영상의 평균 정보만을 활용(Scheme 1)했을 때 보다 도시 내 이질적인 특성을 반영할 수 있는 표준 편차 및 피복률 정보를 모두 함께 고려(Scheme 4, S4)했을 때 향상된 성능을 나타낼 수 있었다. 검증용 자료에 대해 S4의 Random Forest (RF) 모델이 0.8196의 R2, 0.0749의 mean absolute error (MAE), 및 0.1022의 root mean squared error (RMSE)로 전체 기계학습 모델 중에서 성능이 가장 높게 나타났다. 변수 기여도 분석 결과 광학 지수의 표준 편차 정보는 도시 내 복잡한 토지 피복 지역에 대해 높은 기여도를 나타내었다. 훈련된 S4 구성의 RF 모델을 수원시 전역에 대해 확장 적용하였을 때, 참조 FTC 자료에 대해 0.8702의 R2, 0.0873의 MAE, 및 0.1335의 RMSE의 우수한 성능을 나타냈다. 본 연구의 FTC 추정 기법은 향후 다른 지역에 대한 적용성이 우수할 것으로 판단되며, 도시 생태계 탄소순환 파악의 기초자료로 활용될 수 있을 것으로 기대된다.

Keywords

1. 서론

산업화의 영향으로 대기 중 온실가스의 양이 지속적으로 증가함에 따라 전세계적으로 이상기후가 발생하고 있으며(Lee et al., 2023), 특히 도시 지역의 경우, 열섬현상과 인구밀집 현상이 동반되어 그 피해가 더욱 크게 나타나고 있다(Lemonsu et al., 2015). 최근 세계 각지에서는 기후변화에 대한 도시 차원의 통합적 적응 방안을 마련하기 위해 에너지 저감 및 재생 가능 에너지원의 사용을 장려하고, 바람길과 도시 녹지를 조성하는 등의 노력을 수행해오고 있다(Kim, 2012). 그 중에서도 도시 녹지는 공원, 숲, 가로수 등의 도심 내 식생 공간을 지칭하며, 태양복사를 차단 또는 흡수하여 인공 구조물의 열 축적 및 방출을 감소시키고, 증발산을 통해 현열을 잠열로 전환하여 대기온도를 낮추는 효과가 있다(Thaiutsa et al., 2008). 이러한 도심 내 녹지 공간을 효율적으로 관리하고 그 영향을 평가하기 위해서는 토지 피복 지도 등과 같은 도시 녹지의 공간 현황 조사가 필요하다(Lee and Lee, 2018; Je and Jung, 2018).

환경부에서는 우리나라 전국 지역에 대해 2019년부터 1 m급의 공간해상도로 41개의 토지 피복 분류 항목을 구분하는 세분류 토지 피복 지도를 제공해오고 있으나(https://egis. me.go.kr/main.do), 공원 및 가로수 등의 도시 녹지 정보는 기타 초지로 분류되거나 누락되어 오고 있다. Son et al. (2021)은 기존 세분류 토지 피복 지도에서 누락된 도시 내 녹지 정보를 파악하기 위해 1 m급 이하의 항공 light detection and ranging (LiDAR) 영상 및 정사영상을 사용하여 딥러닝 기반의 도시 녹지 분류 모델을 제안하였다. 항공 LiDAR 영상은 고해상도의 점군(point cloud) 자료를 바탕으로 정밀한 수치표면모델(digital surface model)이나 수치지형모델(digital terrain model)을 구축할 수 있으며, 이러한 3차원 공간 정보는 다양한 고해상도 토지 피복 분류 연구에 활발히 사용되어 오고 있다(Jung et al., 2008; Cho and Kim, 2010; Cetin and Yastikli, 2022). 그러나 항공 LiDAR 자료는 위성 영상과 비교하여 자료를 제공하는 플랫폼이 제한되어 있고, 특정 시공간 자료의 취득과 비용적인 면에서도 한계가 존재하는 어려움이 있다(Pearse et al., 2018).

광학 위성 자료는 전 지구 지역에 대해 영상 수집이 용이하여 다양한 시공간 해상도를 바탕으로 전 지구적인 식생 모니터링 연구에 활용되어 오고 있다(Zhang et al., 2003; Schultz et al., 2016; Kim et al., 2021). 그 중에서도 유럽우주국(European Space Agency, ESA)이 제공하는 Sentinel-2 위성 영상은 10–60 m 급의 고해상도 광학 영상 정보를 제공하여 다양한 도시 내 식생 모니터링 연구에 활발히 사용되어 오고 있다(Chen et al., 2021; Ju and Delclòs-Alió, 2022). Hu et al. (2021)Ju and Delclòs-Alió (2022)은 지표 반사도 혹은 정규식생지수(normalized difference vegetation index, NDVI)와 같은 광학지수 정보를 바탕으로 기계학습 기반의 고해상도 토지 피복 분류를 수행하였다. 또한, Priem et al. (2019)Cai et al. (2020)은 혼합 분광(spectral unmixing) 분석을 통해 화소(pixel) 내 식생 피복률(fractional vegetation cover, FVC) 추정을 수행하였다. 그러나 이러한 대부분의 선행 연구에서는 수목과 초지 정보를 별도로 구분하지 않고 전체 식생 정보에 대해 결과를 산정하고 있다. 수목과 초지는 미세먼지 저감이나 온도 및 습도의 변화에 있어 도시 생태계에 미치는 영향의 차이가 크고(Choi et al., 2017; Yoon, 2001; Jeanjean et al., 2016), 특히 수목 피복률(fractional tree canopy cover, FTC)과 같은 고해상도 수목정보는 도시 내 수목의 탄소 저장량 및 바이오매스 산정 등에 활용되어 추가적인 고부가가치 산출물을 제공할 수 있다(McGovern and Pasher, 2016; Kim et al., 2011). 따라서 도시 내 세부적인 녹지 영향 평가와 관리를 위해서는 추가적인 고해상도 수목 정보 산출 기술이 필요하다. 이때, 혼합 분광 분석 기법은 각 화소 마다 도시 내 이질적인 피복 분포 정보를 고려할 수 있다는 장점이 있으나(Xu and Somers, 2021), 한 화소에 존재하는 순수 대상물(endmember)의 종류 설정 문제와 비슷한 특성의 순수 대상물이 존재할 경우 화소 내 각 순수 대상물의 점유 비율이 혼재되는 어려움이 존재한다(Choi et al., 2005; Lee and Lathrop, 2005; Xu et al., 2018). 도시 내 수목정보를 모니터링 하기 위해서는 도시 내 이질적인 토지 피복 정보를 반영할 수 있는 추가적인 방안에 대한 고찰이 필요한 실정이다.

본 연구에서는 고해상도 광학 위성인 Sentinel-2 영상으로부터 다양한 광학 지수를 산정한 후, 기존 고해상도 토지 피복 지도 정보와 융합 활용하여 최종적으로 기계학습 기반의 30 m급 도시 내 FTC를 추정하고자 하였다. 도시 내 이질적인 토지 피복 정보를 대변할 수 있는 변수 구성에 대한 고찰을 수행하고자 광학 위성 자료와 기존 토지 피복 지도 자료 융합에 따른 여러 변수의 조합을 제안하고, 각 조합에 따라 추정된 모델의 성능을 비교하였다. 또한, 훈련된 모델을 훈련 지역 외 영역에 대해 적용하여 훈련된 기계학습 모델의 확장성에 대한 정확도 평가를 진행하였다.

2. 연구 지역 및 자료

2.1. 연구 지역

본 연구는 경기도 수원시를 연구 지역으로 선정하였다(Fig. 1). 경기도 중남부에 위치한 수원시는 삼면이 광교산맥에 에워싸인 주형 분지로 이루어져 있다. ‘2030년 수원시 도시기본계획’(Suwon City, 2019)에 의하면, 수원시의 녹지 면적은 68.16 km2로 전체 행정구역 면적인 121.14 km2의 56.3%를 차지하고, 그 중 자연 녹지 면적이 58.9 km2로 전체 면적에서 녹지 지역이 큰 부분을 차지하는 도시이다. 또한, 수원시는 지난 2011년에 환경 수도를 선포하였으며(Suwon City, 2016), 탄소 중립 및 온실가스 감축 등을 목표로 하는 「수원시 기후변화대응 종합계획」(Suwon City, 2022) 등을 수행하고 있어 도시 내 상세한 FTC 추정 연구 수행에 적합한 대상지라고 할 수 있다.

OGCSBN_2023_v39n5_3_1009_f0001.png 이미지

Fig. 1. Study area and regions for reference data used in this research. Red boxes indicate training areas for machine learning models, and white boxes represent test areas. (a)–(j) The RGB imagery for training areas and (k)–(m) those for test areas. The background images are RGB ortho imagery in 2020 provided by the National Geographic Information Institute (https://map.ngii.go.kr/mn/mainPage.do).

수원시 내에 존재하는 다양한 토지 피복과 공간 유형을 바탕으로 총 10개의 훈련 지역과 3개의 검증 지역을 설정하여 향후 기계학습 모델의 훈련 및 검증 평가를 수행하였다. 총 13개의 지역은 모두 각 600 m 격자 범위를 나타내며, Fig. 1에 표기되어 있다.

2.2. 연구 자료

본 연구에서는 수원시 지역에 대한 FTC 추정 모델을 설계하고자 위성 자료, 환경부 세분류 토지 피복 지도 및 FTC 참조 자료 구축을 수행하였다. 수원시 지역에 대해 확보가능한 FTC 참조 자료 유무에 따라 연구 기간은 2020년으로 설정되었으며, 해당 기간과 상응하는 각 자료원에 대한 정보는 Table 1에 요약되어 있다. 각 자료에 대한 구체적인 설명 및 처리 과정은 각 하위 항목에 기재되어 있다.

Table 1. List of the datasets used in this study

OGCSBN_2023_v39n5_3_1009_t0001.png 이미지

NIR: near-infrared, SWIR:shortwave infrared, DSM: digitalsurface model, DTM: digital terrain model, LiDAR: light detection and ranging.

2.2.1. Sentinel-2

도시 내 고해상도 FTC 추정을 위하여 Sentinel-2 위성영상을 사용하였다. Sentinel-2는 ESA에서 제작된 쌍둥이 위성으로 Sentinel-2A 및 Sentinel-2B (각 2015년 6월 23일, 2017년 3월 7일 발사) 위성이 존재하며, 각 10일의 촬영 주기를 갖고 있어 함께 사용할 경우 약 5일의 재방문 주기를 갖는다. Sentinel-2 위성은 각 가시(visible), 근적외(near-infrared, NIR), 단파적외(shortwave infrared, SWIR) 및 red edge 영역 등에 대해서 10–60 m의 공간 해상도로 정보를 제공하고 있으며, 본 연구에서 사용한 지표 반사도 정보는 Table 1에 기재되어 있다.

본 연구에서는 2020년 3월 1일부터 2020년 11월 30일까지 촬영된 Sentinel-2의 지표 반사도 영상을 Google Earth Engine 플랫폼을 통해 처리하였다. 식생 성장 기간을 고려하기 위해 겨울철(1~2월 및 12월)을 제외하였으며, 각 시기별 영상에 대해 Sentinel-2 산출물에서 구름정보를 나타내는 ‘QA60’ 및 ‘MSK_CLDPRB’ 영상을 이용하여 반사도 영상 내 구름 영역을 제거하였다. 이후, 기존 국내외 선행 연구에서 도시 지역 모니터링에 널리 활용되고 있는 6가지 광학 지수를 산정하였다(Table 2). 본 연구에서 산정한 지수는 NDVI, 식생비율지수(ratio vegetation index, RVI), 정규수분지수(normalized difference waterindex, NDWI), 정규시가화지수(normalized difference built-up index, NDBI), 시가화지수(built-up index, BUI), 및 도시지수(urban index, UI)이며 모든 광학 지수의 공간 해상도는 10 m로 산정되었다.

Table 2. Spectral indices with formulas used in this study

OGCSBN_2023_v39n5_3_1009_t0002.png 이미지

광학지수의 시계열 영상으로부터 각 화소 위치 별로 중앙값 합성(median value composite)을 수행하여 최종적으로 수원시 지역에 대해 각 광학지수별 단일 영상을 구축하였다. 통계량을 이용한 시계열 합성 방식은 기존 광학 위성이 겪는 구름 오염 문제를 해소할 수 있으며, 비교적 간단한 계산으로 넓은 지역에 대한 적용이 용이하다는 장점이 있다(Qiu et al., 2023). 특히 중앙값 합성방식은 영상 내 잔여 구름의 영향 및 그림자 영역의 영향을 추가적으로 제거할 수 있는 장점을 보여 다양한 식생 및 토지 피복 모니터링 연구에 활용되어 오고 있다(Ruefenacht, 2016; Azzari and Lobell, 2017; Phan et al., 2020; Ju et al., 2022). 구축된 광학지수의 중앙값 영상은 FTC 추정을 위한 기계학습 모델의 입력변수 구축에 사용되었다(Section 3.1).

2.2.2. 세분류 토지 피복 지도

환경부에서는 환경공간정보서비스를 통해 총 41개의 분류 항목을 나타내는 세분류 토지 피복 지도(1 m급)를 벡터(vector) 파일 형식으로 2019년부터 제공하고 있으며(https://egis.me.go.kr/intro/land.do), 본 연구에서는 2020년 수원시 지역에 대한 세분류 토지 피복 지도를 취득하였다. 환경부의 2020년 세분류 토지 피복 지도는 2018 및 2019년에 촬영된 항공 정사 영상과 2019년에 촬영된 아리랑 위성영상을 통해 제작되었다. 기존 41개의 토지 피복 항목 정보를 총 10개의 토지 피복 항목(시가화 지역, 교통 지역, 농경지, 활엽수림, 침엽수림, 혼합림, 초지, 습지, 나지, 및 수역)으로 합병하였다. 이후 병합된 토지 피복 지도를 0.25 m의 공간해상도를 갖는 래스터(raster) 파일로 변환한 뒤, 각 합병된 항목에 대해 0.25 m 해상도의 이진 분류 지도를 구축하였다. 해당 이진 분류 지도를 바탕으로 각 토지 피복 항목별 30 m 격자 내피복률을 계산하여 기계학습 모델의 입력 변수로 활용하였다.

2.2.3. 도시 내 고해상도 수목 지도

FTC의 참조 자료를 구축하기 위하여, Son et al. (2021)에서 제작한 수원시 지역의 항공 LiDAR 기반 수고 모델(canopy height model, CHM) 영상을 활용하였다. 해당 CHM 영상은 2020년 9월 27~28일에 촬영된 항공 LiDAR의 점군 자료로부터 제작되어 0.25 m의 해상도를 갖는다. Fig. 1 내 훈련 및 검증 지역에 대하여, CHM 영상 및 네이버(Naver) 사의 로드뷰를 참고하여 육안으로 수목 여부를 판단한 후, 영상 편집 프로그램(Adobe Photoshop 2021)을 활용하여 수목 여부에 대한 0.25 m 해상도의 이진 분류 영상을 생성하였다. 이후, 30 m 격자 내 FTC를 산정하여 향후 기계학습 모델의 종속변수(Observed FTC)로 활용하였다.

한편, 훈련된 기계학습 모델로부터 수원시 전역에 대한 FTC 추정 성능을 평가하기 위하여, Son et al. (2021)에서 생성한 0.25 m 해상도의 도시녹지 분류 지도를 활용하였다. 해당 분류 지도는 항공 LiDAR 및 RGB 정사영상을 입력으로 받는 합성곱 신경망 기반 U-Net 구조의 모델로부터 제작되었으며, 훈련되지 않은 지역을 대상으로 총 5개의 분류 항목(수목, 관목, 초지, 건물, 및 기타)에 관하여 약 89.44%의 전체 정확도를 보였다(Son et al., 2021). 특히, 수목 항목에 대한 이진 분류 관점에서의 전체 정확도는 96.29%로 나타났다. 본 연구에서는 도시 녹지 분류 지도로부터 수목 항목에 대한 정보만을 활용하였다. 추가적으로 세분류 토지 피복 지도의 산림 항목으로부터 0.25 m 해상도의 수목 이진 분류 지도를 구축하고, 이를 도시녹지 분류 지도 기반의 수목 이진 지도와 병합하여 수원시 전역에 대한 수목 이진 분류 지도를 제작하였다. 이후, 30 m 격자 내 FTC를 산정하여 수원시 전역에 대한 FTC 참조 자료(Reference FTC)를 구축하였다.

3. 연구방법

본 연구는 기계학습 기법을 이용하여 광학 위성 기반의 도시 내 고해상도(30 m급) FTC 추정을 수행하고자 하였다(Fig. 2). 이때, 도시 내 이질적인 토지 피복 정보를 반영할 수 있는 변수에 대해 논의하기 위하여, 다양한 입력 변수 조합에 따른 FTC 추정 성능을 비교하고자 하였다. 가장 우수한 성능을 나타낸 기계학습 모델에 대해 설명 가능한 인공지능(eXplainableArtificialIntelligence, XAI) 기법을 적용하여 기계학습 모델 내에서 각 입력변수의 기여도 패턴을 분석하였다. 또한, 해당 모델을 바탕으로 수원시 전역에 대한 FTC를 추정하여 모델의 확장성에 대한 평가를 진행하고자 하였다.

OGCSBN_2023_v39n5_3_1009_f0002.png 이미지

Fig. 2. The overall flowchart proposed in this study to estimate fractional tree coverage.

3.1. 입력 자료 구축

기계학습 모델의 훈련에 사용될 30 m 해상도의 입력변수를 구축하기 위하여, Sentinel-2 기반 광학지수(Table 2)의 중앙값 영상을 추가적으로 처리하였다. 각 30 m 격자에 해당하는 10 m 격자의 광학지수 값(총 9개)을 바탕으로 평균(mean)과 표준편차(standard deviation, std)를 계산하여, 각 광학지수별 30 m 격자 내 mean과 std 영상을 구축하였다. 각 30 m 격자 내 토지 피복(건물 및 식생 등)의 이질성에 따라 광학 지수 관측 값의 std 값 변동이 존재할 수 있음을 바탕으로, 본 연구에서는 광학 지수의 std 영상이 광학 영상 기반의 토지 피복 다양성을 나타낼 수 있는 변수라고 가정하였다. 세분류 토지 피복 지도 기반의 30 m 격자 내 토지 항목별 피복률 정보 또한 토지 피복 다양성을 나타낼 수 있는 변수라고 가정하였다. 구축된 입력 변수의 정보와 약어는 Table 3과 같다.

Table 3. Summary of the independent variable candidates used in this study

OGCSBN_2023_v39n5_3_1009_t0003.png 이미지

각 입력 변수 구성(scheme)에 따른 도시 내 FTC 추정 정확도를 비교하기 위하여, Table 4와 같이 총 4개의 입력변수 조합 scheme (S1-S4)을 설정하여 모델을 구축하였다. 이때, 입력변수 사이의 다중 공산성(multicollinearity)을 제거하기 위하여 분산 팽창 계수(variance inflation factor, VIF)를 바탕으로 최종 변수 선정을 진행하였다. 일반적으로 VIF의 값이 10 이상 일 때, 다중 공산성이 있다고 판단한다(Shafizadeh-Moghadam et al., 2020; Mtengwana et al., 2021). 각 변수 조합에 대해 VIF 계산을 수행했을 때, 모든 변수의 VIF의 값이 10 미만을 달성할 때까지 가장 큰 VIF 값을 갖는 변수를 하나씩 소거하는 과정을 반복하여 최종 변수 조합을 선정하였다. 모든 변수는 각 변수의 최솟값과 최댓값을 이용하여 0과 1 사이의 값으로 선형 변환(linear stretch)한 후 모델 훈련에 사용되었다. 훈련 지역과 검증 지역(Fig. 1)에 대해 각 4,000개 및 1,200개의 샘플을 구축하였다.

Table 4. Modeling schemes with different combinations of independent variables through feature selection

OGCSBN_2023_v39n5_3_1009_t0004.png 이미지

3.2. 기계학습 기법

본 연구에서는 여러 기계학습 기법을 바탕으로 FTC 추정 모델을 구축하여, 검증 지역에 대한 정확도 비교를 통해 최적의 모델을 선정하고자 하였다. Random forest (RF), light gradient boosting machine (LGBM), support vector regressor (SVR) 및 multi-layered perceptron (MLP)의 총 4가지 기법에 대하여 모델을 구축하고 성능을 비교하였다.

RF는 다수의 의사결정나무(decision tree, DT)를 학습하는 배깅(bagging) 기반의 앙상블 모형이다(Breiman, 2001). RF는 부트스트랩(bootstrap) 기법을 통해 훈련 자료와 입력 변수를 무작위로 선정하여 기초 분류기를 학습시키고, 각 기초 분류기의 결과들을 다수결, 혹은 평균을 통해 결합(aggregation)한다(Biau and Scornet, 2016). RF는 단순하지만 비선형적 문제의 해결에 높은 성능을 보이고 기존 의사결정나무에서 발생하는 과적합 문제를 해결해준다고 알려져 있다(Tyralis et al., 2019; Liaw and Wiener, 2002). 본 연구에서는 Python 3.9의 ‘scikit-learn’ 패키지의 ‘RandomForestRegressor’를 사용하였다.

LGBM은 DT의 부스팅 기반 앙상블 모형 중 하나인 gradient boosting machine (GBM)의 개선된 버전이다. LGBM은 기존 GBM에서 사용된 Level-wise 방식 대신 최대 손실 값을 가지는 노드를 지속적으로 분할하는 Leaf-wise 방식을 채택하여 계산 속도를 크게 향상시켰다(Lee et al., 2022). LGBM은 빠른 계산 속도와 높은 정확도를 바탕으로 원격 탐사 분야에서 다양한 국내외 연구에 적용되었다(Jung et al., 2022; Sung et al., 2022; Colkesen and Ozturk, 2022). 본 연구에서는 ‘lightgbm’ 패키지의 ‘LGBMRegressor’을 사용하였다.

Support vector machine (SVM)은 통계적 학습 개념을 바탕으로 하는 커널 기반 기계학습 알고리즘 중 하나이며 분류, 군집 및 회귀 문제에 대해 모두 적용 가능한 모델이다(Cetin and Yastikli, 2022). SVM은 데이터 포인트들 사이의 관계를 가장 잘 나타내는 초평면(hyperplane)을 탐색하여 오차를 최소화하는 방식으로 작동한다. SVM은 커널 함수를 통해 비선형 문제 처리가 가능하고 높은 일반화 성능으로 국내외의 다양한 원격탐사 분야 연구에서 활용되어 오고 있다(Kim and Lee, 2016; Ichii et al., 2017; Forkuor et al., 2017). 본 연구에서는 Python 3.9의 ‘scikit-learn’ 패키지의 ‘SVR’을 사용하였다.

MLP는 인공 신경망의 한 형태로 입력층과 은닉층, 출력층으로 구분되어 있고 각 층은 여러 개의 뉴런 또는 노드로 구성된다. MLP 알고리즘은 최소 손실을 찾기 위해 가중치와 편향을 업데이트하는 방식으로 작동하며, 실제 출력과 예상 출력 간의 오차를 계산하고 이를 역전파(back propagation)하여 각 뉴런의 가중치를 업데이트 한다. MLP 기반의 모델은 한 번에 다양한 동적요소를 모델링 할 수 있어 다양한 국내외 원격탐사 분야 연구에서 사용되어 오고 있다(Alqadhi et al., 2021; Lee et al., 2019). 본 연구에서는 Python 3.9의 ‘scikit-learn’ 패키지의 ‘MLPregressor’를 사용하였다.

훈련 샘플에 대해 10중 교차 검증(10-fold cross validation)을 바탕으로 격자 탐색(gridsearch) 기법을 수행하여 기계학습 모델의 하이퍼파라미터(hyperparameter) 최적화를 수행하였다. 각 입력변수 scheme에 따른 각 모델의 최적화된 하이퍼파라미터는 Table 5와 같다. 최적의 하이퍼파라미터 정보를 바탕으로 전체 훈련 샘플에 대한 훈련을 진행한 뒤, 검증 지역 및 수원시 전역에 대한 결과를 산출하였다.

Table 5. Hyperparameters optimized using the gridsearch method for each model scheme and machine learning algorithm

OGCSBN_2023_v39n5_3_1009_t0005.png 이미지

3.3. 성능 평가 방식

모델의 성능 평가는 검증 샘플에 대한 모델의 정확도를 바탕으로 진행되었다. 모델의 평가 지표로는 결정계수(coefficient of determination, R2), 평균 제곱근 오차(root mean squared error, RMSE) 및 평균 절대 오차(mean absolute error)를 사용하였다. 모델의 평가지표를 바탕으로 성능이 가장 우수한 입력 변수 scheme 및 기계학습 기법 모델을 선정하여, 변수 기여도 분석을 수행하였다. 또한, 수원시 전역에 대한 FTC 결과를 추정하여 훈련된 모델의 지역 확장성에 대해 논의하였다. 이때 수원시 내 국가 보안 지역 위치에 관한 일부 샘플은 평가에서 제외하였으며, 기존 세분류 토지 피복 지도에서 나타나는 항목 정보로 대체한 후 공간 분포를 분석하였다.

3.4. 변수 기여도 분석

각 입력변수가 모델의 최종 결과에 미치는 영향을 분석하기 위해 Shapley Additive exPlanations (SHAP)을 사용하였다. SHAP은 블랙박스 형태의 인공지능 모델을 해석하기 위해 고안된 XAI 기법 중 하나로써, 게임이론을 기반으로 여러 특성 조합을 구현하고 해당 특성의 유무에 따른 변화를 계산하는 방식으로 작동한다(Shapley, 1953; Lundberg and Lee, 2017). SHAP은 각 샘플과 특성별로 최종 결과에 도달하기 까지의 기여도 점수를 제공한다. 이를 통해 각 특성의 상대적인 중요도, 결과에 미치는 영향의 방향성과 크기, 특성 간의 의존도에 따른 영향 등의 정보를 알 수 있다(Park et al., 2021). SHAP은 여러 기계학습 모델링에서 비선형적이고 복잡한 관계 해석에 사용되어 왔으며(Lubo-Robles et al., 2020; Feng et al., 2021), 본 연구에서는 광학 지수 기반 변수와 토지 피복률 정보의 변화에 따른 FTC 추정 값 분석 및 모델 해석을 위해 사용하였다.

4. 연구결과 및 토의

4.1. FTC 추정 모델의 정확도 비교

Table 6는 검증 샘플에 대한 Scheme별 각 모델의 FTC 추정 결과를 나타낸다. 전체적으로 4가지 Scheme 모두 0.6 이상의 R2를 나타냈으며 0.07–0.11 범위의 MAE, 0.1–0.15 범위의 RMSE 값을 보였다. 모든 Scheme 중 검증 정확도가 가장 낮게 나타난 Scheme은 S1이었다. 광학지수의 mean 정보만 고려한 S1은 모든 기계학습 모델에서 가장 낮은 검증 정확도를 나타냈다(평균 R2=0.6678, MAE=0.1007, RMSE=0.1386). 광학 지수의 mean 정보와 함께 각 광학 지수의 std 정보와 토지 피복률 정보를 고려한 S2와 S3은 S1보다 우수한 성능을 나타냈다. S2와 S3 중에서는 세 평가지표 모두 토지 피복률 정보를 고려한 S3에서 더 나은 정확도를 나타냈다. 전체 scheme들 중에서 광학 지수의 mean과 std, 토지 피복률 정보를 모두 고려한 S4는 가장 높은 정확도를 나타냈다(평균 R2=0.8146, MAE=0.0771, RMSE=0.1036). 모든 기계학습 모델의 FTC 추정 성능은 S4에서 가장 우수하게 나타났으며, S3, S2 및 S1의 순으로 높은 정확도를 나타냈다. 특히 RF 모델의 경우 0.8196의 R2, 0.0749의 MAE, 및 0.1022의 RMSE를 나타내어 모든 Scheme과 기계학습 모델에 대해 가장 높은 정확도를 보였다.

Table 6. Comparison of performance by scheme and model

OGCSBN_2023_v39n5_3_1009_t0006.png 이미지

The best accuracy for each model scheme is shown in bold.

S4의 RF 모델이 가장 우수한 모델로 선정됨에 따라, 각 scheme 별 모델 성능 향상에 대한 논의는 RF 모델의 결과를 기준으로 진행하였다. Fig. 3는 scheme 별 RF 모델의 산점도를 나타낸다. S1에서 높은 FTC 값에 대한 과소 추정 경향이 나타났다. S1은 관심 해상도와 동일한 공간 해상도에 상응하는 광학지수의 값(mean) 정보를 입력 변수로 활용한다. 이러한 S1의 과소 추정 패턴은 기존 선행 연구에서 spectral unmixing 분석을 통해 추정한 Landsat 위성(30 m급) 기반 시가화 지역 피복률 및 FVC 과소 추정 패턴의 경향과 일치하였다(Mitraka et al., 2016). S1과 비교하여 S2, S3 및 S4에서 선형회귀 선의 기울기와 y 절편 값이 각 1과 0에 근접해지며 일부 과소추정 경향이 해소됨을 확인할 수 있었다.

OGCSBN_2023_v39n5_3_1009_f0003.png 이미지

Fig. 3. Density scatter plot for validation results of FTC predicted by random forest for each scheme.​​​​​​​

Fig. 4는 검증 지역 내 RF 모델의 FTC 추정 오차의 공간 분포를 나타낸다. 세 검증 지역에 대한 각 scheme별 MAE의 평균값을 바탕으로 S4 (0.0749), S3 (0.0812), S2(0.0898) 및 S1 (0.0961)의 순으로 낮은 오차를 나타내었다. 낮은 FTC 값을 나타내는 저층 상가형 건물 지역(Figs. 1k, l)에 대해서는 scheme에 따른 오차의 차이가 거의 나타나지 않지만, 높은 FTC 값을 갖는 고층 주거지역(Figs. 1k, m)의 경우, scheme에 따라 오차가 완화되는 모습을 확인할 수 있었다. 특히, Fig. 1(m) 지역은 고층 아파트와 함께 넓은 면적의 수목이 인접하게 분포되어 있어 혼합화소 문제와 더불어 건물에 의한 그림자 오염 문제에 취약할 수 있으며(Nichol and Lee, 2005; Qin and Fang, 2014), std 변수와 토지 피복률 변수를 고려하여 해당 지역에 대한 오차 성능 개선을 확인할 수 있었다.

OGCSBN_2023_v39n5_3_1009_f0004.png 이미지

Fig. 4. Error distribution of FTC predicted by RF for three test regions (Figs. 1k–m). The red color indicates the underestimation of FTC, while the blue one does the overestimation of FTC.​​​​​​​

4.2. 변수 기여도 분석

S4의 RF 모델에 대해 SHAP 분석을 수행하였다. S4 변수 조합에서 유일하게 광학지수 기반의 mean 정보를 나타내는 NDBI_mean이 가장 높은 변수 기여도를 보였다(Fig. 5). NDBI_mean은 값이 높을수록 FTC 예측 값을 감소시키는 방향으로, 값이 낮을수록 FTC 예측 값을 증가시키는 방향으로 기여하였으며, 이는 NDBI 정보가 식생 정보와 음의 상관성을 보이는 경향과 일치한다(Mitraka et al., 2016). 시가화 지역의 피복률을 나타내는 LC_Usedarea가 NDBI_mean와 비슷한 경향성을 보이며 네번째로 높은 기여도를 보였다.

OGCSBN_2023_v39n5_3_1009_f0005.png 이미지

Fig. 5. Summary plot of SHAP analysis of the RF model with scheme 4 for test samples.​​​​​​​

반면, RVI_std와 LC_Grassland는 값이 높아질수록 예측 값을 증가시키는 방향으로 양의 상관성을 나타내며 각 두번째 및 세번째로 높은 기여도를 나타냈다. RVI_std는 산림 지역(공원)과 형태가 비교적 균질한 도심지(저층 건물 지역 등)에 대해 낮은 값을 나타내고, 토지 피복이 혼합된 지역에 대해 높은 값을 나타낸다. 이는 NDBI_mean과의 관계성 분석에서도 확인할 수 있다(Fig. 6). 정규화 된 NDBI_mean 값이 0.6 이상인 경우는 실제 FTC 관측 값이 낮은 도심지로 RVI_std의 값도 낮게 나타났으며, 정규화 된 NDBI_mean 값이 약 0.3 이하 및 정규화 된 RVI_std가 약 0.4 이하인 샘플은 Fig. 1(k)의 공원 지역을 나타내었다. 그 외 NDBI_mean 값이 낮게 나타나는 토지 피복이 혼합된 지역에 대해서는 FTC 관측 값과 RVI_std 값의 변동이 큰 것으로 나타났다. 광학지수의 mean 정보와 함께 RVI_std를 고려할 경우, 격자 내 토지 피복 변동성 정보를 추가적으로 반영할 수 있어 복잡한 토지 피복 지형에 대해 과소추정 경향을 나타내는 S1모델보다 예측 성능을 높이는 경향성이 나타난 것으로 보인다. LC_Grassland의 경우, 환경부의 세분류 토지 피복 지도에서 고층 주거 지역 내 수목 정보가 기타 초지로 분류되어 있어 나타난 양의 관계성으로 예측할 수 있다(Fig. 5). 산림 피복률의 경우, Fig. 1(k)의 공원이 세분류 토지 피복 지도에서 각 침엽수림과 혼합림으로 구분됨에 따라 LC_Needleleaf와 LC_Mixedforest가 양의 상관성을 보였으며, 검증 지역에 대해 존재하지 않는 활엽수림 피복률의 경우, 낮은 feature 값을 나타내며 음의 기여도를 보였다.

OGCSBN_2023_v39n5_3_1009_f0006.png 이미지

Fig. 6. Scatter plot between normalized NDBI_mean and normalized RVI_std for test samples. The color indicates the observed FTC values.​​​​​​​

Fig. 7은 각 최상위 및 차상위의 SHAP value(기여도)를 갖는 입력 변수 정보를 공간 분포로 나타낸 그림이다. 토지 피복이 상대적으로 균질한 공원, 저층 건물 지역, 및 나지(운동장) 지역에 대해서는 NDBI_mean의 기여도가 가장 큰 것으로 나타났으며, 일부 도로 및 FTC 값이 높은 고층 건물 지역에 대해서는 RVI_std의 기여도가 크게 나타났다. 차상위 순위에서는 RVI_std, LC_Grassland, 및 LC_Usedarea가 우세하게 나타났다. 광학 지수의 std 변수와 토지 항목 별 피복률 정보는 도시 내 토지 피복의 다양성을 효과적으로 모의하는 것으로 보인다.

OGCSBN_2023_v39n5_3_1009_f0007.png 이미지

Fig. 7. Spatial distribution of the independent variables that exhibit the highest SHAP values for test areas.​​​​​​​

4.3. 모델의 확장성 평가 및 논의

광학 위성 기반 FTC 추정 모델의 지역 확장성을 추가적으로 검토하기 위하여 수원시 전역에 대해 FTC 추정 결과를 산출하고, Reference FTC 자료를 바탕으로 scheme별 RF 모델의 성능을 평가하였다(Fig. 8). Fig. 3에서 확인된 바와 같이 S1이 가장 낮은 성능을 나타내었으며, S4와 같이 다양한 변수 유형이 함께 고려될수록 성능이 향상됨을 확인할 수 있었다. 수원시 전역에 대한 FTC 추정 결과의 공간 분포는 Fig. 9(a)와 같다. S1과 S4 모두 Reference FTC와 비교하여 전반적인 FTC 값의 분포를 잘 나타내었으며, S1과 비교하여 S4의 공간 패턴이 대체적으로 더 뚜렷하게 나타났다. S1과 S4는 일부 초지(골프장 등) 및 습지 지역에 대해 과추정을 보이고 일부 고층 주거지역에 대해서 저추정하는 사례를 확인하였다(Fig. 9b). 초지의 구조 및 분광 특성은 수목 분류 및 면적 추정에 있어 정확도 감소를 야기시키는 일반적인 요인 중 하나이다(Myeong et al., 2001; Richardson and Moskal, 2014; Chen et al., 2017). 그러나 S1과 비교하여 30 m 격자 내 광학 지수의 std 정보와 토지 피복률을 고려한 S4는 FTC에 대한 각 과추정 및 저추정의 오류 강도를 감소시킬 수 있음을 확인하였다.

OGCSBN_2023_v39n5_3_1009_f0008.png 이미지

Fig. 8. Density scatter plot for FTC predicted by RF for each scheme for the entire Suwon.

OGCSBN_2023_v39n5_3_1009_f0009.png 이미지

Fig. 9. Spatial distribution of FTC predicted by RF. (a) Comparison of FTC for the entire Suwon. (b) The specific example of predicted FTC and error distributions within the region indicated in the black box in Fig. 9(a). For FTC, the red color indicates low FTC and green color does high FTC. For error (difference between predicted FTC and reference FTC), the red color represents the underestimation of FTC, while the blue color does the overestimation of FTC.

본 연구에서는 Sentinel-2의 시계열 합성 영상과 세분류 토지 피복 지도를 융합 활용하여 FTC 추정을 수행하였다. 시계열 합성 영상으로 모델을 훈련할 경우, 단일시기 영상을 활용했을 때와 비교하여 타 지역 및 다시기(다른 년도)에 대한 적용이 용이하다(Azzari and Lobell, 2017; Phan et al., 2020). 우리나라는 식생의 활력도가 높은 시기인 여름철에 대하여 구름으로 오염되는 광학 영상이 다수 존재하기 때문에(Kim and Eun, 2021; Kwak et al., 2022), FTC 추정에 있어 시계열 합성 영상을 활용하는 것이 유리할 것으로 여겨진다. 그러나 시계열 합성을 수행하더라도 도심 내 건축물로 인해 발생한 그림자 등의 영향이 존재하기 때문에, 가장 우수한 성능을 나타낸 S4에서도 일부 고층 건물 밀집 지역에 대해 상대적으로 큰 오차를 나타내었다(Figs. 4, 9). 광학 위성 영상만을 활용한 입력 변수 조합(S1, S2)에서는 이러한 광학위성 영상의 혼합 화소 문제와 그림자 오염 문제에 더 취약한 것으로 분석된다. 본 연구에서는 이러한 점을 보완하고자 Sentinel-2 위성 영상과 세분류 토지 피복 지도를 융합적으로 활용하였다. 그러나 사용된 Sentinel-2 영상과 세분류 토지 피복 지도 제작에 사용된 원시 영상의 관측 시기 간 차이가 존재하므로, 일부 토지 피복 변화가 존재하는 지역에 대해 일부 불확실성이 존재할 수 있다. 향후 타 지역 및 다시기에 대한 FTC 검증 자료 구축이 가능하다면, 본 연구에서 수행한 자료 융합 기반 FTC 추정 모델의 확장성에 대해 추가적 논의가 가능할 것으로 기대된다.

5. 결론

본 연구에서는 고해상도 광학 위성 자료인 Sentinel-2 위성 영상과 환경부 세분류 토지 피복 지도를 이용하여 기계학습 기반의 도시 내 고해상도 FTC 추정 모델을 구축하였다. 광학 위성으로부터 도시 내 토지 피복의 이질성을 반영할 수 있는 변수에 대해 제안하고자 30 m 격자 내 각 광학 지수의 mean과 std 값을 계산하여 FTC 추정모델의 입력변수로 활용하고자 하였다. 또한, 기존 환경부에서 제공하는 세분류 토지 피복 지도로부터 총 10개 항목에 대한 각 피복률을 계산하여 추가적인 입력변수로 고려하였다. 입력 변수 구성에 따른 여러 기계학습 모델의 성능을 비교한 결과, 모든 종류의 입력 변수(S4)를 고려한 RF 기반의 FTC 추정 모델이 검증 지역에 대해 0.8196의 R2, 0.0749의 MAE, 및 0.1022의 RMSE 값을 보이며 가장 우수한 성능을 나타냈다. 입력 변수 scheme 별 기계학습 모델의 평균 정확도를 산정하였을 때, 단일 종류의 입력 변수를 활용했을 때 보다 다양한 종류의 입력변수가 함께 고려되었을 때 정확도가 향상됨을 확인하였다. 가장 우수한 성능을 나타낸 S4 구성의 RF 모델의 변수 기여도 분석을 수행하였을 때, NDBI_mean 정보가 가장 높은 변수 기여도를 나타냈으며, 그 다음으로 RVI_std 및 LC_Grassland와 같이 대상 격자 내 토지 피복 특성의 다양성을 나타낼 수 있는 변수가 높은 기여도를 나타냈다. 특히, 각 격자 위치 별로 최상위 및 차상위 기여도를 갖는 변수의 분포를 확인하였을 때, 광학 지수의 평균값인 NDBI_mean은 비교적 균질한 토지 피복 지역에 대해 높은 기여도를 나타냈으며, RVI_std는 건물과 수목이 혼합된 지역에 대해 더 높은 기여도를 나타냄을 확인할 수 있었다. 훈련된 모델의 확장성을 평가하고자 수원시 전역에 대한 FTC 추정 결과를 산정하였으며, Reference FTC와 비교했을 때 검증 지역에 대한 평가와 마찬가지로 S4에서 가장 높은 정확도를 나타냈다. 그러나 수목과 비슷한 분광 특성을 보이는 일부 초지 지역에는 과추정문제가 발생하고, 일부 고층 건물 밀집 지역에서는 광학영상의 그림자 오염 문제로 인한 저추정 현상이 관측되었다. 이는 광학 위성 자료 기반 모델의 한계점으로 판단되며, 세분류 토지 피복 자료와 융합하여 사용하였을 때 오차가 일부 완화됨을 확인할 수 있었다. 본 연구에서는 광학 지수의 시계열 합성 영상을 활용하여 타 지역 및 다시기에 대한 접근 및 확장이 비교적 용이할 것으로 판단되며, 향후 다양한 지역에 대한 응용 및 도시 생태계 연구의 기초 자료로 활용될 수 있을 것으로 기대된다.

사사

본 결과물은 환경부의 재원으로 한국환경산업기술원의 관측기반 온실가스 공간정보지도 구축 기술개발사업(RS-2023-00232066)의 지원과 국토교통부 위성정보 빅데이터 활용 국토종합관리 기술개발사업(RS-2022-00155763)의 지원을 받아 연구되었습니다.

Conflict of Interest

No potential conflict of interest relevant to this article was reported.

References

  1. Alqadhi, S., Mallick, J., Balha, A., Bindajam, A., Singh, C. K., and Hoa, P. V., 2021. Spatial and decadal prediction of land use/land cover using multilayer perceptron-neural network (MLP-NN) algorithm for a semi-arid region of Asir, Saudi Arabia. Earth Science Informatics, 14, 1547-1562. https://doi.org/10.1007/s12145-021-00633-2
  2. Amini, S., Saber, M., Rabiei-Dastjerdi, H., and Homayouni, S., 2022. Urban land use and land cover change analysis using random forest classification of Landsat time series. Remote Sensing, 14(11), 2654. https://doi.org/10.3390/rs14112654
  3. Azzari, G., and Lobell, D., 2017. Landsat-based classification in the cloud: An opportunity for a paradigm shift in land cover monitoring. Remote Sensing of Environment, 202, 64-74. https://doi.org/10.1016/j.rse.2017.05.025
  4. Biau, G., and Scornet, E., 2016. A random forest guided tour. Test, 25, 197-227. https://doi.org/10.1007/s11749-016-0481-7
  5. Breiman, L., 2001. Random forests. Machine Learning, 45, 5-32. https://doi.org/10.1023/A:1010933404324
  6. Cai, Y., Zhang, M., and Lin, H., 2020. Estimating the urban fractional vegetation cover using an object-based mixture analysis method and Sentinel-2 MSI imagery. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 13, 341-350. https://doi.org/10.1109/JSTARS.2019.2962550
  7. Cetin, Z., and Yastikli, N., 2022. The use of machine learning algorithms in urban tree species classification. ISPRS International Journal of Geo-Information, 11(4), 226. https://doi.org/10.3390/ijgi11040226
  8. Chen, F., Wang, K., Van de Voorde, T., and Tang, T. F., 2017. Mapping urban land cover from high spatial resolution hyperspectral data: An approach based on simultaneously unmixing similar pixels with jointly sparse spectral mixture analysis. Remote Sensing of Environment, 196, 324-342. https://doi.org/10.1016/j.rse.2017.05.014
  9. Chen, Y., Weng, Q., Tang, L., Liu, Q., Zhang, X., and Bilal, M., 2021. Automatic mapping of urban green spaces using a geospatial neural network. GIScience & Remote Sensing, 58(4), 624-642. https://doi.org/10.1080/15481603.2021.1933367
  10. Cho, D. Y., and Kim, E. M., 2010. Extraction of spatial information of tree using LiDAR data in urban area. Journal of Korean Society for Geospatial Information Science, 18(4), 11-20.
  11. Choi, J. W., Kim, D. S., and Kim, Y. I., 2005. A study on constrained linear spectral unmixing of hyperspectral imagery based on unsupervised endmember selection. Korea Spatial Information System Society, 35-39.
  12. Choi, T., Cha, J., Moon, H., Lee, S., and Kang, D., 2017. Analysis of the effects of temperature mitigation on urban green area using UAV images. In Proceedings of the Korean Society of Environment and Ecology Conference, 27, 69-70.
  13. Coleman, R. W., Stavros, N., Yadav, V., and Parazoo, N., 2020. A simplified framework for high-resolution urban vegetation classification with optical imagery in the Los Angeles Megacity. Remote Sensing, 12(15), 2399. https://doi.org/10.3390/rs12152399
  14. Colkesen, I., and Ozturk, M. Y., 2022. A comparative evaluation of state-of-the-art ensemble learning algorithms for land cover classification using WorldView-2, Sentinel-2 and ROSIS imagery. Arabian Journal of Geosciences, 15(10), 942. https://doi.org/10.1007/s12517-022-10243-x
  15. Faqe Ibrahim, G. R., 2017. Urban land use land cover changes and their effect on land surface temperature: Case study using Dohuk City in the Kurdistan region of Iraq. Climate, 5(1), 13. https://doi.org/10.3390/cli5010013
  16. Feng, D. C., Wang, W. J., Mangalathu, S., and Taciroglu, E., 2021. Interpretable XGBoost-SHAP machine-learning model for shear strength prediction of squat RC walls. Journal of ctural Engineering, 147(11), 04021173. https://doi.org/10.1061/(ASCE)ST.1943-541X.0003115
  17. Forkuor, G., Hounkpatin, O. K., Welp, G., and Thiel, M., 2017. High resolution mapping of soil properties using remote sensing variables in south-western Burkina Faso: A comparison of machine learning and multiple linear regression models. PloS one, 12(1), e0170478. https://doi.org/10.1371/journal.pone.0170478
  18. He, C., Shi, P., Xie, D., and Zhao, Y., 2010. Improving the normalized difference built-up index to map urban built-up areas using a semiautomatic segmentation approach. Remote Sensing Letters, 1(4), 213-221. https://doi.org/10.1080/01431161.2010.481681
  19. Hidalgo-Garcia, D., and Arco-Diaz, J., 2022. Modeling the surface urban heat island (SUHI) to study of its relationship with variations in the thermal field and with the indices of land use in the metropolitan area of Granada (Spain). Sustainable Cities and Society, 87, 104166. https://doi.org/10.1016/j.scs.2022.104166
  20. Hu, B., Xu, Y., Huang, X., Cheng, Q., Ding, Q., Bai, L. et al., 2021. Improving urban land cover classification with combined use of Sentinel-2 and Sentinel-1 imagery. ISPRS International Journal of Geo-Information, 10(8), 533. https://doi.org/10.3390/ijgi10080533
  21. Ichii, K., Ueyama, M., Kondo, M., Saigusa, N., Kim, J., Alberto, M. C. et al., 2017. New data-driven estimation of terrestrial CO2 fluxes in Asia using a standardized database of eddy covariance measurements, remote sensing data, and support vector regression. Journal of Geophysical Research: Biogeosciences, 122(4), 767-795. https://doi.org/10.1002/2016JG003640
  22. Je, M. H., and Jung, S. H., 2018. Urban heat island intensity analysis by landuse types. The Journal of the Korea Contents Association, 18(11), 1-12. https://doi.org/10.5392/JKCA.2018.18.11.001
  23. Jeanjean, A. P., Monks, P. S., and Leigh, R. J., 2016. Modelling the effectiveness of urban trees and grass on PM2.5 reduction via dispersion and deposition at a city scale. Atmospheric Environment, 147, 1-10. https://doi.org/10.1016/j.atmosenv.2016.09.033
  24. Ju, Y., Dronova, I., and Delclos-Alio, X., 2022. A 10 m resolution urban green space map for major Latin American cities from Sentinel-2 remote sensing images and OpenStreetMap. Scientific Data, 9(1), 586. https://doi.org/10.1038/s41597-022-01701-y
  25. Jung, S., Choo, M., Im, J., and Cho, D., 2022. Generation of daily high-resolution sea surface temperature for the seas around the Korean peninsula using multi-satellite data and artificial intelligence. Korean Journal of Remote Sensing, 38(5), 707-273. https://doi.org/10.7780/kjrs.2022.38.5.2.5
  26. Jung, S. E., Lee, W. K., Kwan, D. A., and Choi, H. A., 2008. 3D based classification of urban area using height and density information of LiDAR. Spatial Information Research, 16(3), 373-383.
  27. Kaimaris, D., and Patias, P., 2016. Identification and area measurement of the built-up area with the built-up index (BUI). International Journal of Advanced Remote Sensing and GIS, 5(6), 1844-1858. https://doi.org/10.23953/cloud.ijarsg.64
  28. Kim, J., 2012. The Analysis of planning methode and case study for model 'Climate change adaptation city'. Korea Institute of Ecological Architecture and Environment, 12(4): 13-19.
  29. Kim, K. T., Cho, J. W., and Yoo, H. H., 2011. Carbon storage estimation of urban area using KOMPSAT-2 imagery. Journal of Korean Society for Geospatial Information Science, 9(2), 49-54.
  30. Kim, N., and Lee, Y. W, 2016. Machine learning approaches to corn yield estimation using satellite images and climate data: A case of Iowa state. Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography, 34(4), 383-390. http://dx.doi.org/10.7848/ksgpc.2016.34.4.383
  31. Kim, S. H., and Eun, J., 2021. Development of cloud and shadow detection algorithm for periodic composite of Sentinel-2A/B satellite images. Korean Journal of Remote Sensing, 37(5-1), 989-998. https://doi.org/10.7780/kjrs.2021.37.5.1.13
  32. Kwak G., Park, S., and Park, N. W., 2022. Combining conditional generative adversarial network and regression-based calibration for cloud removal of optical imagery. Korean Journal of Remote Sensing, 38(6-1), 1357-1369. https://doi.org/10.7780/kjrs.2022.38.6.1.28
  33. Lee, B., and Lee, Y., 2018. A study on utilization of spatial information for urban parks and green areas management. Journal of the Korean Cadastre Information Association, 20(2), 151-162. https://doi.org/10.14352/jkaie.2018.22.1.151
  34. Lee, H., Calvin, K., Dasgupta, D., Krinner, G., Mukherji, A., Thorne, P. et al., 2023. Climate change 2023: Synthesis report. Intergovernmental Panel on Climate Change. https://doi.org/10.59327/IPCC/AR6-9789291691647
  35. Lee, S., and Lathrop, R. G., 2005. Sub-pixel estimation of urban land cover components with linear mixture model analysis and Landsat Thematic Mapper imagery. International Journal of Remote Sensing, 26(22), 4885-4905. https://doi.org/10.1080/01431160500300222
  36. Lee, Y. K., Lee, J. S., and Park, J. W., 2022. A study on classification of crown classes and selection of thinned trees for major conifers using machine learning techniques. Journal of Korean Society of Forest Science, 111(2), 302-310. https://doi.org/10.14578/jkfs.2022.111.2.302
  37. Lee, Y. S., Baek, W. K., and Jung, H. S., 2019. Forest vertical Structure classification in Gongju city, Korea from optic and RADAR satellite images using artificial neural network. Korean Journal of Remote Sensing, 35(3), 447-455. https://doi.org/10.7780/kjrs.2019.35.3.8
  38. Lemonsu, A., Viguie, V., Daniel, M., and Masson, V., 2015. Vulnerability to heat waves: Impact of urban expansion scenarios on urban heat island and heat stress in Paris (France). Urban Climate, 14, 586-605. https://doi.org/10.1016/j.uclim.2015.10.007
  39. Liaw, A., and Wiener, M., 2002. Classification and regression by randomForest. R news, 2(3), 18-22.
  40. Lubo-Robles, D., Devegowda, D., Jayaram, V., Bedle, H., Marfurt, K. J., and Pranter, M. J., 2020. Machine learning model interpretability using SHAP values: Application to a seismic facies classification task. In Proceedings of the 2020 SEG International Exposition and Annual Meeting, Virtual, Oct. 11-16. https://doi.org/10.1190/segam2020-3428275.1
  41. Lundberg, S. M., and Lee, S. I., 2017. A unified approach to interpreting model predictions. arXiv preprint arXiv:1705.07874. https://doi.org/10.48550/arXiv.1705.07874
  42. McGovern, M., and Pasher, J., 2016. Canadian urban tree canopy cover and carbon sequestration status and change 1990-2012. Urban Forestry & Urban Greening, 20, 227-232. https://doi.org/10.1016/j.ufug.2016.09.002
  43. Mitraka, Z., Del Frate, F., and Carbone, F., 2016. Nonlinear spectral unmixing of landsat imagery for urban surface cover mapping. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 9(7), 3340-3350. https://doi.org/10.1109/JSTARS.2016.2522181
  44. Mtengwana, B., Dube, T., Mudereri, B. T., and Shoko, C., 2021. Modeling the geographic spread and proliferation of invasive alien plants (IAPs) into new ecosystems using multi-source data and multiple predictive models in the Heuningnes catchment, South Africa. GIScience & Remote Sensing, 58(4), 483-500. https://doi.org/10.1080/15481603.2021.1903281
  45. Myeong, S., Nowak, D. J., Hopkins, P. F., and Brock, R. H., 2001. Urban cover mapping using digital, high-spatial resolution aerial imagery. Urban Ecosystems, 5, 243-256. https://doi.org/10.1023/A:1025687711588
  46. Nichol, J., and Lee, C. M., 2005. Urban vegetation monitoring in Hong Kong using high resolution multispectral images. International Journal of Remote Sensing, 26(5), 903-918. https://doi.org/10.1080/01431160412331291198
  47. Park, S., Noh, Y., Jung, S., and Hwang, E., 2021. Shap-based explainable photovoltaic power forecasting scheme using lstm, In Proceedings of the 2021 Korea Information Processing Society Conference, Yeosu, Republic of Korea, Nov. 4-6, pp. 845-848. https://doi.org/10.3745/PKIPS.y2021m11a.845
  48. Pearse, G. D., Dash, J. P., Persson, H. J., and Watt, M. S. 2018. Comparison of high-density LiDAR and satellite photogrammetry for forest inventory. ISPRS Journal of Photogrammetry and Remote Sensing, 142, 257-267. https://doi.org/10.1016/j.isprsjprs.2018.06.006
  49. Phan, T. N., Kuch, V., and Lehnert, L. W., 2020. Land cover classification using Google Earth Engine and random forest classifier-The role of image composition. Remote Sensing, 12(15), 2411. https://doi.org/10.3390/rs12152411
  50. Priem, F., Okujeni, A., van der Linden, S., and Canters, F., 2019. Comparing map-based and library-based training approaches for urban land-cover fraction mapping from Sentinel-2 imagery. International Journal of Applied Earth Observation and Geoinformation, 78, 295-305. https://doi.org/10.1016/j.jag.2019.02.003
  51. Qin, R., and Fang, W., 2014. A hierarchical building detection method for very high resolution remotely sensed images combined with DSM using graph cut optimization. Photogrammetric Engineering & Remote Sensing, 80(9), 873-883. https://doi.org/10.14358/PERS.80.9.873
  52. Qiu, S., Zhu, Z., Olofsson, P., Woodcock, C. E., and Jin, S., 2023. Evaluation of Landsat image compositing algorithms. Remote Sensing of Environment, 285, 113375. https://doi.org/10.1016/j.rse.2022.113375
  53. Richardson, J. J., and Moskal, L. M., 2014. Uncertainty in urban forest canopy assessment: Lessons from Seattle, WA, USA. Urban Forestry & Urban Greening, 13(1), 152-157. https://doi.org/10.1016/j.ufug.2013.07.003
  54. Ruefenacht, B., 2016. Comparison of three Landsat TM compositing methods: A case study using modeled tree canopy cover. Photogrammetric Engineering & Remote Sensing, 82(3), 199-211. https://doi.org/10.14358/PERS.82.3.199
  55. Schultz, M., Clevers, J. G., Carter, S., Verbesselt, J., Avitabile, V., Quang, H. V. et al., 2016. Performance of vegetation indices from Landsat time series in deforestation monitoring. International Journal of Applied Earth Observation and Geoinformation, 52, 318-327. https://doi.org/10.1016/j.jag.2016.06.020
  56. Shafizadeh-Moghadam, H., Weng, Q., Liu, H., and Valavi, R., 2020. Modeling the spatial variation of urban land surface temperature in relation to environmental and anthropogenic factors: A case study of Tehran, Iran. GIScience & Remote Sensing, 57(4), 483-496. https://doi.org/10.1080/15481603.2020.1736857
  57. Shapley, L. S., 1953. Additive and non-additive set functions. Princeton University.
  58. Son, B., Lee, Y., and Im, J., 2021. Classification of urban green space using airborne LiDAR and RGB ortho imagery based on deep learning. Journal of the Korean Association of Geographic Information Studies, 24(3), 83-98. https://doi.org/10.11108/kagis.2021.24.3.083
  59. Sung, T., Sim, S., Jang, E., and Im, J., 2022. Estimation of high resolution sea surface salinity using multi satellite data and machine learning. Korean Journal of Remote Sensing, 5(2), 747-763. https://doi.org/10.7780/kjrs.2022.38.5.2.8
  60. Suwon City, 2016. Suwon-si environment conservation plan (2016~2025). https://www.suwon.go.kr/common-upload/environment/vision/1%EC%9E%A5-%EA%B3%BC%EC%97%85%EA%B0%9C%EC%9A%94.pdf
  61. Suwon City, 2019. 2030 Suwon-si urban basic plan (reorganization). https://www.suwon.go.kr/component/file/ND_fileDownload.do?id=a936d1d0-5912-4fa3-9aca-357464d9ee55
  62. Suwon City, 2022. Suwon-si climate change response comprehensive plan. https://www.gplib.kr/common/file/download.do?fno=10372&type=poc&key=2303156919496
  63. Thaiutsa, B., Puangchit, L., Kjelgren, R., and Arunpraparut, W., 2008. Urban green space, street tree and heritage large tree assessment in Bangkok, Thailand. Urban Forestry & Urban Greening, 7(3), 219-229. https://doi.org/10.1016/j.ufug.2008.03.002.
  64. Thanapura, P., Helder, D. L., Burckhard, S., Warmath, E., O'Neill, M., and Galster, D., 2007. Mapping urban land cover using QuickBird NDVI and GIS spatial modeling for runoff coefficient determination. Photogrammetric Engineering & Remote Sensing, 73(1), 57-65. https://doi.org/10.14358/PERS.73.1.57
  65. Tyralis, H., Papacharalampous, G., and Langousis, A., 2019. A brief review of random forests for water scientists and practitioners and their recent history in water resources. Water, 11(5), 910. https://doi.org/10.3390/w11050910
  66. Wang, R., Wan, B., Guo, Q., Hu, M., and Zhou, S., 2017. Mapping regional urban extent using NPP-VIIRS DNB and MODIS NDVI data. Remote Sensing, 9(8), 862. https://doi.org/10.3390/rs9080862
  67. Xu, F., and Somers, B., 2021. Unmixing-based Sentinel-2 downscaling for urban land cover mapping. ISPRS Journal of Photogrammetry and Remote Sensing, 171, 133-154. https://doi.org/10.1016/j.isprsjprs.2020.11.009
  68. Xu, X., Li, J., Wu, C., and Plaza, A., 2018. Regional clustering-based spatial preprocessing for hyperspectral unmixing. Remote Sensing of Environment, 204, 333-346. https://doi.org/10.1016/j.rse.2017.10.020
  69. Yoon, Y. H., 2001. Comparison study of air temperature by green condition and relative humidity. Turfgrass Society of Korea, 15(3), 111-118. https://doi.or.kr/10.KS/JAKO200111921145916 https://doi.org/10.KS/JAKO200111921145916
  70. Zha, Y., Gao, J., and Ni, S., 2003. Use of normalized difference built-up index in automatically mapping urban areas from TM imagery. International Journal of Remote Sensing, 24(3), 583-594. https://doi.org/10.1080/01431160304987
  71. Zhang, X., Friedl, M. A., Schaaf, C. B., Strahler, A. H., Hodges, J. C., Gao, F. et al., 2003. Monitoring vegetation phenology using MODIS. Remote Sensing of Environment, 84(3), 471-475. https://doi.org/10.1016/S0034-4257(02)00135-9
  72. Zheng, Y., Tang, L., and Wang, H., 2021. An improved approach for monitoring urban built-up areas by combining NPP-VIIRS nighttime light, NDVI, NDWI, and NDBI. Journal of Cleaner Production, 328, 129488. https://doi.org/10.1016/j.jclepro.2021.129488