DOI QR코드

DOI QR Code

Analysis of the Research Trends by Environmental Spatial-Information Using Text-Mining Technology

텍스트 마이닝 기법을 활용한 환경공간정보 연구 동향 분석

  • 오관영 (한국환경정책.평가연구원) ;
  • 이명진 (한국환경정책.평가연구원) ;
  • 박보영 (한국환경정책.평가연구원) ;
  • 이정호 (한국환경정책.평가연구원) ;
  • 윤정호 (한국환경정책.평가연구원)
  • Received : 2016.12.27
  • Accepted : 2017.03.21
  • Published : 2017.03.31

Abstract

This study aimed to quantitatively analyze the trends in environmental research that utilize environmental geospatial information through text mining, one of the big data analysis technologies. The analysis was conducted on a total of 869 papers published in the Republic of Korea, which were collected from the National Digital Science Library (NDSL). On the basis of the classification scheme, the keywords extracted from the papers were recategorized into 10 environmental fields including "general environment", "climate", "air quality", and 20 environmental geospatial information fields including "satellite image", "numerical map", and "disaster". With the recategorized keywords, their frequency levels and time series changes in the collected papers were analyzed, as well as the association rules between keywords. First, the results of frequency analysis showed that "general environment"(40.85%) and "satellite image"(24.87%) had the highest frequency levels among environmental fields and environmental geospatial information fields, respectively. Second, the results of the time series analysis on environmental fields showed that the share of "climate" between 1996 and 2000 was high, but since 2001, that of "general environment" has increased. In terms of environmental geospatial information fields, the demand for "satellite image" was highest throughout the period analyzed, and its utilization share has also gradually increased. Third, a total of 80 correlation rules were generated for environmental fields and environmental geospatial information fields. Among environmental fields, "general environment" generated the highest number of correlation rules (17) with environmental geospatial information fields such as "satellite image" and "digital map".

본 연구의 목적은 빅데이터 분석 기법 중 하나인 텍스트 마이닝 기법을 활용하여 환경 분야의 환경공간정보 활용 연구 동향을 정량적으로 분석하는 것이다. 분석에 활용된 자료는 NDSL (National Digital Science Library)을 통하여 획득한 국내 논문으로 총 869편을 대상으로 하였다. 논문에서 추출된 단어들은 "환경일반", "기후", "대기", 등 환경 분야 10개, "위성영상", "수치지도", "재난재해" 등 환경공간정보 20개로 설정된 분류체계에 따라 재분류 되었다. 재분류된 분류 키워드를 통해, 논문에서 해당 키워드의 출현 빈도 및 시계열 변화를 파악하였으며, 상호 간 연관분석을 수행하였다. 첫째, 빈도 분석 결과 환경 분야에서는 "환경일반"(40.85%)이 환경공간정보에서는 "위성영상" (24.87%)이 가장 높은 활용 빈도를 나타냈다. 둘째, 환경 분야에 대한 시계열 분석 결과 1996년부터 2000년까지는 "기후"에 대한 연구 비중이 높았으나, 2001년부터는 "환경일반"에 대한 연구가 증가하였다. 환경공간정보에서는 "위성영상"에 대한 수요가 전 기간에 걸쳐 가장 높았으며, 활용 비율 또한 점차적으로 증가하고 있었다. 셋째, 환경 분야와 환경공간정보에 대한 연관분석 결과 총 80개의 연관 규칙이 생성되었으며, 환경 분야 중 "환경일반"이 "위성영상", "전자지도" 등 총 17개의 환경공간정보와 가장 많은 수의 연관 규칙을 생성하였다.

Keywords

References

  1. Bae, K.Y., J.H. Park, J.S, Kim, and Y.S. Lee. 2013. Analysis of the abstracts of research articles in food related to climate change using a text-mining algorithm, Journal of the Korean Data & Information Science Society 24(6):1429-1437 (배규용, 박주현, 김정선, 이영섭. 2013. 텍스트 마이닝 기법을 활용한 기후변화관련식품분야 논문초록 분석, 한국데이터정보과학회지 24(6):1429-1437). https://doi.org/10.7465/jkdi.2013.24.6.1429
  2. Cho, H.G., Y.S. Kim, and S.E. Kim. 1998. A study on circulation and management of spatial data. Journal of the Korean Association of Geographic Information Studies 1(1):28-38 (조혜경, 김영섭, 김상은. 1998. 공간정보 유통 및 관리에 관한 연구. 한국지리정보학회지 1(1):28-38).
  3. Feldman, R. and H. Hirsh. 1996. Mining associations in text in the presence of background knowledge. Proceedings of the Second International Conference on Knowledge Discovery and Data Mining. pp.343-346.
  4. Feldman, R. and I. Dagan. 1995. Knowledge discovery in Textual Databases (KDT). Proceedings of the First International Conference on Knowledge Discovery and Data Mining. pp.112-117.
  5. Hotho, A., A. Nürnberger, and G. Paass. 2005. A brief survey of text mining. A brief survey of text mining 20(1): 19-62.
  6. Kim, H.J. and J,Y. Chang. 2011. Discovering news keyword associations using association rule. The journal of the Institute of Internet Broadcasting and Communication 11(6):63-71 (김한준, 장재영. 2011. 연관 규칙 마이닝을 활용한 뉴스기사 키워드의 연관성 탐사. 한국인터넷방송통신학회 논문지 11(6):63-71).
  7. Korea National Spatial Data Infrastructure Portal. http://www.nsdi.go.kr(Accessed June 1, 2016)
  8. Lee, M.S., C.H. Lee, and J.Y. Kim. 2014. Big data analysis on demands for environmental policies. Korea Environment Institute. Research report. pp.47 (이미숙, 이창훈, 김지연. 빅데이터를 활용한 환경분야 정책수요 분석. 한국환경정책평가연구원. 연구보고서. 47쪽).
  9. Lim, S.Y., M.S, Yi, G.H. Jin, and D.B, Shin. 2014a. A study on the research trends in the area of geospatial-information using text-mining technique focused on national R&D reports and theses. Journal of Korea Spatial Information Society 22 (4):11-20 (임시영, 이미숙, 진기호, 신동빈. 2014. 텍스트 마이닝 기술을 이용한 공간정보 분야의 연구 동향에 관한 고찰 -국가연구개발사업 보고서 및 논문을 중심으로-. 한국공간정보학회지 22 (4):11-20).
  10. Lim, S.Y., Y.M. Lim, and J.Y. Lee. 2014b. Study on the trends of U-City and smart city researches using text mining technology. Journal of the Korean Society for Geospatial Information Science 22(3):87-97 (임시영, 임용민, 이재용. 2014. 텍스트 마이닝 기법을 이용한 U-City와 Smart City의 연구 동향에 대한 분석. 한국지형공간정보학회지 22(3):87-97).
  11. Mindsinsight. http://www.mindsinsight.co.kr. (Accessed November 1, 2016).
  12. NDSL(National Digital Science Library). http://www.ndsl.kr(Accessed June 1, 2016).
  13. Sakong, H.S. and K.H. Seo. 2007. A review on GIS research trends using content analysis method -focus on the GIS journals published from 1993 to 2006-. Journal of the Korean Association of Geographic Information Studies 10(3): 104-112 (사공호상, 서기환. 2007. 내용분석 기법을 활용한 GIS관련 연구 동향 분석- 최근 14년(1993-2006)간 학회지 투고논문을 중심으로-. 한국지리정보학회지 10(3): 104-112).
  14. Shin, H.S., O.J. Kwon, Y.D. Koo, Y.W. Shon, and Y.C. Bae. 2013. Scientometric analysis through linkage relation of keyword. The Journal of the Korea Institute of Electronic Communication Sciences 8(10):1467-1475 (신현식, 권오진, 구영덕, 손영우, 배영철. 2013. 키워드 연결 관계를 통한 계량정보 분석. 전자통신학회 8(10):1467-1475). https://doi.org/10.13067/JKIECS.2013.8.10.1467
  15. Oh. K.Y., M.J. Lee, and W.Y. No. 2016. A study on the improvement of sub-divided land cover map classification system: based on the land cover map by Ministry of Environment. Korean Journal of Remote Sensing 32(2):105-118 (오관영, 이명진, 노우영. 2016. 세분류 토지피복지도 분류체계 개선방안 연구: 환경부 토지피복지도를 중심으로. 대한원격탐사학회지 32(2):105-118). https://doi.org/10.7780/kjrs.2016.32.2.4
  16. Yun, H.C., K.S. Min, and M.G. Kim. 2010. Construction of multi-purpose hazard information map based on digital image using geospatial information. Journal of the Korean Association of Geographic Information Studies 13(3):91-101(윤희천, 민관식, 김민규. 2010. 지형공간정보를 활용한 수치영상기반의 다목적 재해정보지도 구축. 한국지리정보학회지 13(3): 91-101).