DOI QR코드

DOI QR Code

Multivariate Stratification under Consideration of Outliers

이상점을 고려한 다변량 층화

  • Published : 2008.06.30

Abstract

Most of the sample surveys conducted by several statistics preparation agencies are multipurpose surveys inquiring into several distinguishing items through a single sample. In a multipurpose sample design, the stratification tends to be very complex since the stratification variables which are both multivariate and heterogeneous must be considered collectively. In this paper we point out an outlier effect in a multivariate stratification to which the K-means clustering method is applied and propose to consider outliers prior to the stratification step. We also show an empirical stratification effect under consideration of outliers through a case study of sample design for The Rural Living Indicators.

여러 통계작성기관에서 실시하는 대부분의 표본조사들은 하나의 표본을 통해 서로 다른 여러 항목들을 조사하는 다목적조사이다. 다목적표본설계에서 층화변수들은 다변량이고 또한 서로 이질적인 속성을 지니는 관심변수들을 종합적으로 고려해야 하므로 층화는 매우 복잡한 양상을 띤다. 본 연구는 K-평균군집법을 적용한 다변량 층화에서 이상점의 효과를 지적하고, 층화 단계에서 사전에 이상점을 고려할 것을 제안하는 연구이다. 농촌생활지표조사를 위한 표본설계의 사례를 통해 이상점을 고려한 층화의 효과를 실증적으로 보인다.

Keywords

References

  1. 농총진흥청(2006) .<2006 농촌생활지표>, 농촌진흥청.
  2. 류제복, 김영원, 박진우 (2002) 어가경제조사 표본설계 <통계분석연구>, 7, 159-183
  3. 박진우, 윤석훈, 김진흠, 정형철 (2007). 군집분석을 이용한 다목적 조사의 층화에 관한 연구, <응용통계연구>, 20, 387-394. https://doi.org/10.5351/KJAS.2007.20.2.387
  4. 박홍래 (2002). <통계조사론>, 영지문화사.
  5. Becker, C. and Gather, U. (1999). The masking breakdown point of multivariate outlier identification rules, Journal of the American Statistical Association, 94, 947-955 https://doi.org/10.2307/2670009
  6. Cochran, W. G. (1977). Sampling Techniques, John Wiley & Sons, New York
  7. Dalenius, T. and Hodges, J. L. (1959). Minimum variance stratifcation, Journal of the American Statistical Association, 54, 88-101 https://doi.org/10.2307/2282141
  8. Davies, L. and Gather, U. (1993). The identifcation of multiple outliers, Journal of the American Statistical Association, 88, 782-792 https://doi.org/10.2307/2290763
  9. Golder, P. A. and Yeomans, K. A. (1973). The use of cluster analysis for stratifcation, Applied Statistics, 22, 213-219 https://doi.org/10.2307/2346922
  10. Jarque, C. M. (1981). A solution to the problem of optimum stratifcation in multivariate sampling, Applied Statistics, 30, 163-169 https://doi.org/10.2307/2346387
  11. Kish, L. (1965). Survey Sampling, John Wiley & Sons, New York
  12. Rocke, D. M. and Woodruff, D. L. (1996). Identifcation of outliers in multivariate data, Journal of the American Statistical Association, 91, 1047-1061 https://doi.org/10.2307/2291724
  13. Sarndal, C. E., Swensson, B. and Wretman, J. (1992). Model Assisted Survey Sampling, Springer, New York