A Study on the Imputation for Missing Data in Dual-loop Vehicle Detector System

차량 검지자료 결측 보정처리에 관한 연구 (이력자료 활용방안을 중심으로)

  • 김정연 (서울대학교 환경대학원 교통관리) ;
  • 이영인 (서울대학교 환경대학원 교통관리) ;
  • 백승걸 (한국도로공사 도로교통기술원) ;
  • 남궁성 (한국도로공사 도로교통기술원)
  • Published : 2006.12.31

Abstract

The traffic information is provided, which based on the volume of traffic, speed, occupancy collected through the currently operating Vehicle Detector System(VDS). In addition to the trend in utilization fold of traffic information is increasing gradually with the applied various fields and users. Missing data in Vehicle detector data means series of data transmitted to controller without specific property. The missing data does not have a data property, so excluded at the whole data Process Hence, increasing ratio of missing data in VDS data inflicts unreliable representation of actual traffic situation. This study presented the imputation process due out which applied the methodologies that utilized adjacent stations reference and historical data utilize about missing data. Applied imputation process methodologies to VDS data or SeoHaeAn/Kyongbu Expressway, currently operation VDS, after processes at missing data ratio of an option. Imputation process held presented to per lane-30seconds-period, and morning/afternoon/daily time scope ranges classified, and analyzed an error of imputed data preparing for actual data. The analysis results, an low error occurred relatively in the results of the imputation process way that utilized a historical data compare with adjacent stations reference methods.

교통정보는 운영 중인 VDS(Vehicle Detector System)를 통해 수집된 교통량, 속도, 점유율 자료를 바탕으로 가공되어 제공된다. 수집된 자료의 응용범위와 이용자 및 활용분야는 점점 증가하는 추세에 있다. 수집된 차량 검지자료 내의 결측자료는 대상의 속성을 포함하지 않은 채 전송되는 일련의 빈 데이터를 말한다. 결측자료는 속성 값을 갖고 있지 않은 관계로 데이터가공 처리대상에서 제외된다. 결국 수집 데이터 내의 결측자료의 비율이 증가할수록 해당 지점의 교통상황을 반영하는데 있어 신뢰성이 결여되는 문제점을 갖게 된다. 본 연구에서는 결측자료에 대해 인접지점 참조방식과 이력자료를 활용한 방법론을 적용한 보정처리 결과를 제시하였다 현재 운영 중인 서해안/경부고속도로의 VDS 자료에 임의의 결측자료 비율을 처리 후 보정처리 방법론을 적용하였다. 보정단위는 차로단위-30초 주기로 수행하였으며 오전/오후/일단위로 구분하여 원데이터 대비 보정된 값의 오차를 분석하였다. 분석결과 인접지점 참조방식에 비해 이력자료를 활용한 보정처리 방법이 원데이터에 가까운 값을 도출하는 것을 알 수 있었다.

Keywords

References

  1. 한국도로공사(2004), 2세대 FTMS 구축방안 연구 최종보고서
  2. 김동호(2006), 고속도로 통행시간 예측을 위한 과 거 통행시간 패턴자료 구축에 관한 연구, 한양대학 교 도시대학원 석사학위 논문
  3. 안광훈.백승걸.남궁성(2005), 차로이용률을 고려한 지점 교통량 자료의 집락화 방법에 관한 연구, 한국ITS학회 논문집, 제4권 제3호
  4. B.L. Smith(2003), Exploring imputation techniques for missing data in transportation management systems, TRR(1836)
  5. Conklin J.H(2002), The use of local lane distribution patterns for the estimation of missing data in transportation management systems, TRB
  6. Chao Chen, Jaimyoung Kwon, Jhoen Rice, Pravin Varaiya(2003), Detecting Errors And Imputing Missing Data for Single Loop Surveillance Systems, TRB 2003 annual Meeting
  7. James H. Conklin(2003), Data imputation strategies for Transportation Management System, Graduate Master's of Science Thesis, university of Virginia
  8. Texas Transportation Institute(2004), TRAFFIC DATA QUALITY MEASUREMENT FINAL REPORT
  9. UTAH DOT(2003), Automated Data Collection, Analysis, and Archival-FINAL REPORT
  10. Daiheng et. al(2005), Multiple Imputation scheme for overcoming the missing values and variability issues in ITS data, journal of transportation engineering
  11. Chandra, CVSR(2005), New Algorithms for filtering and imputation of real-time and archived dual-loop detector data in I-4 data warehouse, TRB
  12. Missing Data(2002), Sage Publication, Thousand Oaks, Calif
  13. B. Rubin(2002), Statistical Analysis With Missing Data, Wiley-Interscience
  14. University of Virginia(2005), TMS Performance Monitoring, Evaluation and Reporting Handbook Final Annotated Outline
  15. Linh N. Nguyen(2003), Imputation Techniques to Account for Missing Data in Support of ITS Application
  16. AASHTO(1992), AASHTO Guidelines for Traffic Data Programs, Washington, D.C
  17. 건설교통부.한국교통연구원(2003), 검지기별 구간 소통정보 산출 및 성능평가사업 1차년도 최종 보고서