Efficient Use of Auxiliary Information through the Stratified Sampling and Systematic Sampling Design

층화추출과 계통추출을 이용한 효율적인 보조정보 사용

  • Published : 2009.03.31

Abstract

As an efficient sampling design, stratified random sampling is often used when auxiliary information is available at the designing stage. Although one - per - stratum design is an efficient design that can be used when many auxiliary variables are available, it does not provide any unbiased variance estimator. With a two - per - stratum sample in which two elements are selected from each stratum, it is possible to obtain an unbiased variance estimator. However the loss of efficiency could be significant if any important stratification variable is missed. In this study, we investigated a sampling design that uses the all given auxiliary information and also permits an unbiased variance estimator suggested by Park and Fuller(2008). Through a simulation study, we compared several stratified random sampling and systematic sampling design. We also applied the proposed stratified sampling designs to 2007 youth panel data.

표본설계 단계에서 이용 가능한 보조정보가 있는 경우 효율적인 표본추출방법으로 층화추출법이 흔히 고려된다. 특별히 층화변수로 이용할 수 있는 변수가 많은 경우 전체 층의 숫자가 커지게 되며, 이때 각 층으로부터 한 단위를 추출하는 층 표본크기가 1인 층화추출이 효율적임이 알려져 있다. 그러나 각 층으로부터 하나의 추출단위를 추출하는 층 표본크기가 1인 층화추출의 경우 불편 분산 추정량의 계산이 불가능하다. 불편 분산 추정량의 계산은 층의 수를 줄이고 각 층으로부터 두 개의 표본추출단위를 표집하는 층 표본크기가 2인 층화추출에서 가능하나 중요 층화변수가 누락될 경우 층 표본크기가 1인 층화추출에 비해 그 효율성이 떨어진다. 본 연구에서는 Park & Fuller(2008)에 의해 제시된 층 표본크기가 2인 균형 층화추출과 호르비츠-톰슨 추정량의 불편 분산 추정량을 살펴보고, 모의실험을 통하여 여러 가지 층화추출법과 계통추출법을 비교한다. 또한 제시된 표본추출법을 2006년 청년패널 자료에 적용하여 그 효율성을 평가한다.

Keywords