A Study of Gyungnam's Social Indicator Survey Using Data Mining

데이터마이닝을 이용한 경상남도 사회지표 조사 분석

  • Received : 2013.09.17
  • Accepted : 2013.10.18
  • Published : 2013.10.31

Abstract

Currently, Gyeongnam province is executing the social index survey every year (per 3 year cycles) to the provincials. Social indicator survey can check the status of the whole society. Also, social indicator survey is an important measure of social change, and has been conducted in many municipalities (Seoul, Pusan, Ulsan, Gyeongnam etc). Social indicator survey is conducted a lot of time and expense. But, the results of social indicator survey analysis showed mainly the basic statistical analysis. This mean is the low utilization of survey data. We are necessary to apply a variety of ways in analysis of the social indicator survey. In this study, we analyze the 2010 Gyeongnam's social indicator survey data using data mining (association rule, clustering, decision tree). The results of this study can be analyzed much more efficiently social status.

현재 경상남도는 도민들을 대상으로 3년 주기로 매년 설문 문항을 다르게 하여 사회지표조사를 실시하고 있다. 사회지표조사는 주민들이 생각하는 사회 상태를 전반적으로 파악할 수 있다. 또한 사회지표조사는 사회 변화의 중요한 척도라고 할 수 있으며, 여러 지자체(서울, 부산, 울산, 경상남도 등)에서 많은 시간과 비용을 들여 사회지표조사를 실시하고 있다. 그러나 대부분의 사회지표조사 분석 결과를 살펴보면 결과가 단순 기초통계분석 위주로 되어 있다. 이는 각 지자체에서 많은 시간과 비용을 들여 조사한 자료를 제대로 활용하고 있지 못하고 있는 실정이라고 할 수 있으며, 사회지표조사에 대하여 기초통계분석 외의 다양한 분석 방법의 적용이 필요하다. 이에 본 논문에서는 2010년 경상남도에서 조사한 사회지표 조사 자료에 대하여 데이터마이닝 기법(연관성 규칙, 군집분석, 의사결정나무)을 이용하여 분석을 실시하고자 한다. 사회지표조사에 대한 데이터마이닝 기법의 적용은 주민들의 사회 상태를 더욱더 총체적이고 효율적으로 분석 할 수 있을 것이다.

Keywords

Acknowledgement

Supported by : 한국연구재단

References

  1. Agrawal, R., Imielinski, R., Swami, A. (1993). Mining association rules between sets of items in large databases, Proceedings of the ACM SIGMOD Conference on Management of Data, 207-216.
  2. Breiman, L., Friedman, J. H., Olshen, R. A., Stone, C. J. (1984). Classification and regression trees, Wadsworth and books, California.
  3. Cho, K. H., Park, H. C. (2011a). Study on the multi intervening relation in association rules, Journal of the Korean Data Analysis Society, 13, 297-306. (in Korean).
  4. Cho, K. H., Park, H. C. (2011b). Discovery of insignificant association rules using external variable, Journal of the Korean Data Analysis Society, 13, 1343-1351. (in Korean).
  5. Cho, K. H., Park, H. C. (2013). Sequential application of data mining techniques using marginally conditional variables, Journal of the Korean Data Analysis Society, 15, 115-124. (in Korean).
  6. Gyungsangnamdo (2011). 2010 Gyeongnam's social indicator survey, Gyungnam. (in Korean).
  7. Hartigan, J. A. (1975). Clustering algorithms, John Wiley & Sons, New York.
  8. MacQueen, J. (1967). Some methods for classification and analysis of multivariate observations, The 5th Berkeley Symposium on Mathematical Statistics and Probability, 1, 281-297.
  9. Park, H. C., Cho, K. H. (2006). SAS macro for statistical data fusion, Journal of the Korean Data Analysis Society, 8, 1927-1938. (in Korean).
  10. Pusan Kwangyuksi (2012). 2011 Pusan's social indicator survey, Pusan. (in Korean).
  11. Quinlan, J. R. (1993). C4.5 programs for machine learning, Morgan Kaufmann Publishers, San Francisco.
  12. Seoul Dobonggu (2011). 2010 Seoul Dobonggu's social indicator survey, Seoul Dobonggu. (in Korean).
  13. Ulsan Kwangyuksi (2011). 2011 Ulsan's social indicator survey, Ulsan. (in Korean).