Outlier Filtering and Missing Data Imputation Algorithm using TCS Data

TCS데이터를 이용한 이상치제거 및 결측보정 알고리즘 개발

  • 도명식 (한밭대학교 도시공학과) ;
  • 이향미 (한밭대학교 도시공학과) ;
  • 남궁성 (한국도로공사 도로교통기술원 교통연구팀)
  • Published : 2008.08.31

Abstract

With the ever-growing amount of traffic, there is an increasing need for good quality travel time information. Various existing outlier filtering and missing data imputation algorithms using AVI data for interrupted and uninterrupted traffic flow have been proposed. This paper is devoted to development of an outlier filtering and missing data imputation algorithm by using Toll Collection System (TCS) data. TCS travel time data collected from August to September 2007 were employed. Travel time data from TCS are made out of records of every passing vehicle; these data have potential for providing real-time travel time information. However, the authors found that as the distance between entry tollgates and exit tollgates increases, the variance of travel time also increases. Also, time gaps appeared in the case of long distances between tollgates. Finally, the authors propose a new method for making representative values after removal of abnormal and "noise" data and after analyzing existing methods. The proposed algorithm is effective.

지능형 교통체계구축과 교통 혼잡이 증가하면서 이용자는 과거보다 양질의 통행시간정보를 요구하고 있다. 기존 연구에서는 단속류, 연속류 모두 AVI검지기 자료를 이용한 이상치제거 및 통행시간 산출에 대한 연구가 많이 이루어져왔다. 현재 한국도로공사에서는 TCS(Toll Collection System)를 기반으로 정보제공을 준비 중에 있으며, TCS 데이터는 운전자가 실제교통상황을 경험한 동적특성을 가진 통행시간이 수집된 자료로 통행시간 추정자료로 잠재력이 크다. 그러나 '시간처짐현상'이 발생하고 속도위반, 휴게소, 고장 등으로 인해 평균통행시간보다 작거나 큰 이상치와 결측데이터가 존재하여 기존 방법을 적용하는데 효과적이지 못한 것으로 나타났다. 따라서 본 연구에서는 TCS 데이터에 맞는 이상치제거 및 결측보정 알고리즘을 개발하였다. 기존알고리즘과 비교한 결과 개발 알고리즘이 더 효과적인 것으로 나타났다.

Keywords

References

  1. 강진기.손영태.윤여환.변상철(2002), "비매설식 자동차량인식장치를 이용한 구간교통정보 산출방법 연구", 한국 ITS학회 논문집,vol.1 No.1, pp.22-31
  2. 남궁성 외(2000), "ITS 기술개발연구(IV)-고속도로 통행시간 예측시스템 개발", 한국도로공사 도로연구소
  3. 도명식.김성현.배현숙.김종식(2004), "국도의 동질구간 선정과 이상치 제거 방법에 관한 연구", 대한교통학회지, 제22권 제7호, 대한교통학회, pp.7-16
  4. 오세창.김명하.백용현(2003), "차량검지기 교통량 데이터를 이용한 고속도로 통행시간 추정 및 예측모형 개발에 관한 연구", 대한교통학회지, 제21권 제5호, 대한교통학회, pp.83-95
  5. 원태연.정성원(2004), "통계조사분석", SPSS 아카데미
  6. 이지연.도명식.김성현.류승기(2003), "교통량 데이터의 실시간 보정로직-국도 3호선을 중심으로", 응용통계연구, 제16권, 제2호, pp.203-215
  7. 장진환.변상철.백남철.김성현(2005), "AVI 자료 필터링 알고리즘 개발 -일반국도를 중심으로", 대한토목학회논문집, 제25권, 제2D호, pp.1-8
  8. 최윤혁(2003), "택시GPS Probe 자료의 실시간 이상치 제거 알고리즘 개발", 아주대학교 석사학위논문
  9. Barnett, V. and Lewis, T.(1994) "Outliers in statistical data", John Wiley & Sons
  10. Dion, F., and Rakha, H.(2003) "Estimation Spacial Travel Time using Automatic Vehicle Identification Data", TRB
  11. Little, R.J.A. and Rubin, D.B.(2002) "Statistical analysis with missing data", 2nd E. Wiley Interscience
  12. Mouskos K.C. et al.(1998) "TRANSMIT System Evaluation. Final Report, Institute for Transportation, New Jersey Institute of Technology, N.J
  13. Namkoong S., Park, E., Oh, C., Do, M. and Lee, H. (2008) "A method to estimate path-travel time on expressway using toll collection system data", 2008 ITS World Congress (in review)
  14. Tanaka Y, Kanayama K, Sugimura H.(1992) "Travel-time data provision system using vehicle license number recognition devices". In:Proc. of the Intelligent Vehicles 92 Symposium. Detroit, USA
  15. Whitlock M.E. and Queen C.M.(2000), "Modelling a Traffic Network with Missing Data", Journal of Forecasting, pp.561-574
  16. Yanmei Guo, Ling Qin, Tao Kong, Changqing Zheng, Haihui Shan(2007), "Extracting Travel Time Information from Automated Vehicle Identification Detectors Data", 14th World Congress on ITS, Beijing