Modeling Traffic Accident by Taxi Drivers through Overdispersion Test

과산포 검정을 통한 택시교통사고 모형설정

Jang, Tae-Youn
장태연

  • Published : 2003.01.31

Abstract

This study has the research purpose for establishing model considering overdispersion appeared frequently in count data and applies the model into traffic accidents by taxi drivers. The model usually used in current research on count data is based on linear regression analysis because of its simple concept and easy usage. But linear regression model has the following shortcoming; unreflection of non-negative integer characteristics in count data, unreliability of forecasting results, and not offering of discrete probability on traffic accident frequencies. The model appropriate for analyzing count data is poisson regression model. However, poission regression model is based on the concept that expected mean of distribution is equal to variance. The most count data has variance greater than mean, which results in underestimating standard error. In study, overdispersion test is used to estimate the degree of statistical difference between mean and variance. The result of test proves that negative binomial regression model rather than poisson regression model well reflects traffic accident frequencies of taxi drivers in this study. Likelihood ratio test and Theil's inequality coefficient test are applied for the validity of variables and for accuracy of estimating model.

본 연구는 가산자료에서 흔히 나타나는 과산포를 고려한 모형구축을 목적으로 하고 있으며, 택시 운전자의 교통사고 발생빈도와 관련된 가산자료에 적용하였다. 기존 연구에서 활용되는 가산자료 관련 모형으로는 단순하고 적용이 쉬운 선형회귀분석법이 활용되었는데, 선형회귀분석법은 가산자료가 지니는 비음정수 특징의 미반영, 예측결과의 비신뢰성, 교통사고 발생에 대한 이산확률의 미제공 등의 문제점을 지니고 있다. 이러한 가산자료를 분석하는 데 있어 활용될 수 있는 모형이 포와송 모형이다. 포와송모형의 가장 중요한 특징은 분포의 기대치와 분산이 같아야 된다는 것이다. 그러나 대부분의 가산자료는 분포의 분산이 기대치보다 크거나 작아 포와송모형의 적용에 어려움이 발생한다. 본 연구에서는 이러한 과산포의 존재여부를 확인하기 위해 과산포 검정을 실시하였는데 검정 결과 과산포 값이 양의 수를 가지고 있어 포와송 모형보다는 음이항모형이 본 연구에서 활용한 택시교통사고발생빈도에 적절하다는 것을 보여주었다. 우도비 검정을 통한 변수의 통계적 검정에서 적어도 변수 중 하나는 0이 아닌 것으로 나와 추정모형은 의미를 가지며, 또한, 예측도의 정확성 검정 결과 음이항모형을 재고할 필요성은 낮게 나타났다.

Keywords

References

  1. 교통사고 기술 방법에 관한 연구 김홍선
  2. 대한교통학회지 v.17 no.5 가산자료모형을 이용한 버스이용횟수추정에 관한 연구 문진수;김순관;임강원
  3. 대한교통학회지 v.13 no.1 충청지역 교통사고 예측모형 개발에 관한 연구 박병호
  4. 교통사고의 특성분석 - 운전자 행태를 중심으로 이상용;노정현
  5. 대한교통학회지 v.8 no.1 한국의 교통사고 예측모형 개발연구 임헌연;이일병
  6. Discrete Choice Analysis : Theory and Application to Travel Demand Ben-Akiva, M.;Lerman, S.
  7. Journal of Applied Econometrics v.1 Econometric Models Based on Count Data; Comparisons and Applications of Some Estimators Cameron, A.C.;Trivedi, P.K.
  8. Journal of Econometrics v.46 Regression based Tests for Overdispersion in the Poisson Model Cameron, A.C.;Trivedi, P.K.
  9. Regression Analysis of Count Data Cameron, A.C.;Trivedi, P.K.
  10. Journal of the American Statistical Association v.84 Testing for Overdispersion in Poisson Regression Models Dean, C.;Lawless, F.
  11. Journal of Econometrics v.79 A Count Data Model With Unobserved Heterogeneity Gourieroux, C.;Visser, M.
  12. Econometric Analysis Green, H.W.
  13. LIMDEP Version 7.0 User's Manual Green, H.W.
  14. Accid. Anal. and Prev. v.30 no.4 Heterogeneity Considerations in Accident Modeling Karlaftis, M.;Tarko, A.
  15. 9th WCTR An Analysis of Drinking and Driving Behaviors in US McCarthy, P.
  16. Reducing Traffic Injury-A Global Challenge, An lnternational Traffic Safety Project of the Royal Australians College of Surgeons Trinca, G.W.;Johnasston, I.R.(et al.)
  17. Econometrics Models and Economic Forecasts Pindyck, R.S.;Rubinfeld, D.L.