DOI QR코드

DOI QR Code

VILODE : A Real-Time Visual Loop Closure Detector Using Key Frames and Bag of Words

VILODE : 키 프레임 영상과 시각 단어들을 이용한 실시간 시각 루프 결합 탐지기

  • 김혜숙 (경기대학교 컴퓨터과학과) ;
  • 김인철 (경기대학교 컴퓨터과학과)
  • Received : 2015.02.25
  • Accepted : 2015.03.08
  • Published : 2015.05.31

Abstract

In this paper, we propose an effective real-time visual loop closure detector, VILODE, which makes use of key frames and bag of visual words (BoW) based on SURF feature points. In order to determine whether the camera has re-visited one of the previously visited places, a loop closure detector has to compare an incoming new image with all previous images collected at every visited place. As the camera passes through new places or locations, the amount of images to be compared continues growing. For this reason, it is difficult for a visual loop closure detector to meet both real-time constraint and high detection accuracy. To address the problem, the proposed system adopts an effective key frame selection strategy which selects and compares only distinct meaningful ones from continuously incoming images during navigation, and so it can reduce greatly image comparisons for loop detection. Moreover, in order to improve detection accuracy and efficiency, the system represents each key frame image as a bag of visual words, and maintains indexes for them using DBoW database system. The experiments with TUM benchmark datasets demonstrates high performance of the proposed visual loop closure detector.

본 논문에서는 키 프레임 영상과 SURF 특징점 기반의 시각 단어들을 이용한 효과적인 실시간 시각 루프 결합 탐지기 VILODE를 제안한다. 시각 루프 결합 탐지기는 과거에 지나온 위치들 중 하나를 다시 재방문하였는지를 판단하기 위해, 새로운 입력 영상을 이미 지나온 위치들에서 수집한 과거 영상들과 모두 비교해보아야 한다. 따라서 새로운 위치나 장소를 방문할수록 비교 대상 영상들이 계속해서 증가하기 때문에, 일반적으로 루프 결합 탐지기는 실시간 제약과 높은 탐지 정확도를 동시에 만족하기 어렵다. 이러한 문제점을 극복하기 위해, 본 시스템에서는 입력 영상들 중에서 의미 있는 것들만을 선택해 이들만을 비교하는 효과적인 키 프레임 선택 방법을 채택하였다. 따라서 루프 탐지에 필요한 영상 비교를 대폭 줄일 수 있다. 또한 본 시스템에서는 루프 결합 탐지의 정확도와 효율성을 높이기 위해, 키 프레임 영상들을 시각 단어들로 표현하고, DBoW 데이터베이스 시스템을 이용해 키 프레임 영상들에 대한 색인을 구성하였다. TUM 대학의 벤치마크 데이터들을 이용한 실험을 통해, 본 논문에서 제안한 시각 루프 결합 탐지기의 높은 성능을 확인할 수 있었다.

Keywords

References

  1. Y. Liu, H. Zhang, "Visual Loop Closure Detection with Compact Image Descriptor," Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems, pp.1051-1056, 2012.
  2. A. Angeli, S. Doncieux, J.A. Meyer, and D. Filliat, "Real-Time Visual Loop-Closure Detection," Proceedings of IEEE International Conference on Robotics and Automation, pp. 1842-1847, 2008.
  3. K. L. Ho, P. Newman, "Detecting Loop Closure with Scene Sequences", International Journal of Computer Vision, Vol.74, No.3, pp.261-286, 2007. https://doi.org/10.1007/s11263-006-0020-1
  4. J. Sturm, N. Engelhard, F. Endres, W. Burgard, and D. Cremers, "A Benchmark for the Evaluation of RGB-D SLAM Systems," Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems, 2012.
  5. S. A. Sebastian, A. Kloss, and A. Zell, "Loop Closure Detection using Depth Images," Proceedings of the European Conference on Mobile Robots, pp.100-106, 2013.
  6. C. Kerl, J. Sturm, and D. Cremers, "Dense Visual SLAM for RGB-D Cameras," Proceedings of IEEE/RSJ International Conference on Intelligence Robots and Systems, pp.2100- 2106, 2013.
  7. D. Galvez-Lopez, J. D. Tardos, "Bags of Binary Words for Fast Place Recognition in Image Sequences," IEEE Transaction on Robotics, Vol.28, No.5, pp.1188-1197, 2012. https://doi.org/10.1109/TRO.2012.2197158
  8. T. Whelan, M. Kaess, J. J. Leonard, and J. McDonald, "Deformation-based Loop Closure for Large Scale Dense RGB-D SLAM," Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems, pp.548-555, 2013.