DOI QR코드

DOI QR Code

Cluster analysis for Seoul apartment price using symbolic data

서울 아파트 매매가 자료의 심볼릭 데이터를 이용한 군집분석

  • Kim, Jaejik (Department of Statistics, Sungkyunkwan University)
  • 김재직 (성균관대학교 통계학과)
  • Received : 2015.07.17
  • Accepted : 2015.11.02
  • Published : 2015.11.30

Abstract

In this study, 64 administrative regions with high frequencies of apartment trade in Seoul, Korea are classified by the apartment sale price. To consider distributions of apartment price for each region as well as the mean of the price, the symbolic histogram-valued data approach is employed. Symbolic data include all types of data which have internal variation in themselves such as intervals, lists, histograms, distributions, and models, etc. As a result of the cluster analysis using symbolic histogram data, it is found that Gangnam, Seocho, and Songpa districts and regions near by those districts have relatively higher prices and larger dispersions. This result makes sense because those regions have good accessibility to downtown and educational environment.

이 논문에서는 아파트 매매가 활발히 일어나는 서울시내 64개 행정동들에 대해 아파트 전용면적별 실거래 매매가를 기준으로 군집분석을 실시하였다. 군집분석에 있어서 각 행정동의 실거래가에 대한 정보를 최대한 이용하기 위해 실거래가의 평균 뿐만 아니라 그 분포까지 고려할 수 있도록 전통적인 형태의 데이터를 히스토그램 형태의 데이터로 변환하여 분석을 하였다. 히스토그램 데이터는 심볼릭 데이터의 한 종류이고, 심볼릭 데이터는 기본적으로 구간, 목록, 히스토그램, 분포, 모형 등과 같이 데이터 자체가 내부적인 변동을 갖는 모든 형태의 데이터를 포함한다. 이러한 각 행정동들의 내부적인 매매가의 변동을 고려한 군집분석의 결과 강남구, 서초구, 송파구와 그에 인접한 행정동들이 상대적으로 다른 지역보다 매매가도 높았고 실거래가의 분포도 훨씬 더 넓은 것으로 조사되었다. 전반적으로 도심에 대한 접근성이 좋고 교육환경이 우수한 지역과 강북의 뉴타운 지역이 상대적으로 주변지역보다 더 높고 넓은 매매가 분포를 보이는 것으로 분석되었다.

Keywords

References

  1. Cha, S. H. and Srihari, S. H. (2002). On measuring the distance between histograms. Pattern Recognition Letter, 35, 1355-1370. https://doi.org/10.1016/S0031-3203(01)00118-2
  2. Billard, L. and Diday, E. (2006). Symbolic data analysis: Conceptual statistics and data mining, John Wiley and Sons, England.
  3. Bock, H. H. and Diday, E. (2000). Analysis of symbolic data: Exploratory methods for extracting statistical information from complex data, Springer-Verlag, Berlin.
  4. Brito, P. and Chavent, M. (2012). Divisive monothetic clustering for interval and histogram-valued data. ICPRAM 2012, Portugal.
  5. Diday, E. (1989). Introduction a l'approche symbolique en analyse des donnees. Recherche Operationnelle, 2, 193-236.
  6. Irpino, A. and Verde, R. (2006). A new Wasserstein based distance for the hierarchical clustering of histogram symbolic data. IFCS 2006, 185-192.
  7. Kim, J. (2009). Dissimilarity measures for histogram-valued data and divisive clustering of symbolic objects, Ph.D. Thesis, University of Georgia.
  8. Kim, J. and Billard, L. (2013). Dissimilarity measures for histogram-valued observations. Communications in Statistics - Theory and Methods, 42, 283-303 https://doi.org/10.1080/03610926.2011.581785
  9. Lim, S. S. (2014). A study on the forecasting models using housing price index. Journal of the Korean Data & Information Science Society, 25, 65-76. https://doi.org/10.7465/jkdi.2014.25.1.65
  10. Strelkov, V. V. (2008). A new similarity measure for histogram comparison and its application in time series analysis. Pattern Recognition Letter, 29, 1768-1774. https://doi.org/10.1016/j.patrec.2008.05.002
  11. Woo, S. Y., Lee, J.W. and Jhun, M. (2014). Microarray data analysis using relative hierarchical clustering. Journal of the Korean Data & Information Science Society, 25, 999-1009. https://doi.org/10.7465/jkdi.2014.25.5.999

Cited by

  1. Study on equity of taxation for non-residential property by analysis of actual transaction price vol.27, pp.3, 2016, https://doi.org/10.7465/jkdi.2016.27.3.639
  2. A sample design for the survey on goodwill in retail properties vol.27, pp.6, 2016, https://doi.org/10.7465/jkdi.2016.27.6.1443
  3. A study on an evaluation system by factor loadings vol.27, pp.5, 2016, https://doi.org/10.7465/jkdi.2016.27.5.1285
  4. 지리시간가중 회귀모형을 이용한 주택가격 영향요인 분석 vol.28, pp.1, 2017, https://doi.org/10.7465/jkdi.2017.28.1.173
  5. 기온과 강수량의 수치모델 격자자료를 이용한 기상관측지점의 월별 군집화 vol.28, pp.5, 2015, https://doi.org/10.7465/jkdi.2017.28.5.1133
  6. 벌칙가능도함수를 이용한 1인가구와 저소득 독거노인의 공간군집 탐색 vol.28, pp.6, 2017, https://doi.org/10.7465/jkdi.2017.28.6.1257
  7. 아파트매매가격지수와 거시경제변수에 관한 시계열모형 연구 vol.28, pp.6, 2015, https://doi.org/10.7465/jkdi.2017.28.6.1471