DOI QR코드

DOI QR Code

물체인식 딥러닝 모델 구성을 위한 파이썬 기반의 Annotation 툴 개발

Development of Python-based Annotation Tool Program for Constructing Object Recognition Deep-Learning Model

  • 임송원 (서울과학기술대학교 일반대학원 미디어 IT 공학과) ;
  • 박구만 (서울과학기술대학교 일반대학원 미디어 IT 공학과)
  • 투고 : 2020.01.17
  • 심사 : 2020.03.06
  • 발행 : 2020.05.30

초록

본 논문에서는 물체인식 딥러닝 모델을 구성하는데 필요한 데이터 레이블링 과정을 하나의 프로그램에서 사용할 수 있는 Annotation 툴을 개발했다. 프로그램의 인터페이스는 파이썬의 기본 GUI 라이브러리를 활용하였으며, 실시간으로 데이터 수집이 가능한 크롤러 기능을 구성하였다. 기존의 물체인식 딥러닝 모델인 Retinanet을 활용하여, 자동으로 Annotation 정보를 제공하는 기능을 구현했다. 또한, 다양한 물체인식 네트워크의 레이블링 형식에 맞추어 학습할 수 있도록 Pascal-VOC, YOLO, Retinanet 등 제각기 다른 학습 데이터 레이블링 형식을 저장하도록 했다. 제안하는 방식을 통해 국산 차량 이미지 데이터셋을 구축했으며, 기존의 물체인식 딥러닝 네트워크인 Retinanet과 YOLO 등에 학습하고, 정확도를 측정했다. 차량이 진입하는 영상에서 실시간으로 차량의 모델을 구별하는 정확성은 약 94%의 정확도를 기록했다.

We developed an integrative annotation program that can perform data labeling process for deep learning models in object recognition. The program utilizes the basic GUI library of Python and configures crawler functions that allow data collection in real time. Retinanet was used to implement an automatic annotation function. In addition, different data labeling formats for Pascal-VOC, YOLO and Retinanet were generated. Through the experiment of the proposed method, a domestic vehicle image dataset was built, and it is applied to Retinanet and YOLO as the training and test set. The proposed system classified the vehicle model with the accuracy of about 94%.

키워드

참고문헌

  1. Tsung-Yi Lin, Microsoft COCO: Common Objects in Context, Computer Vision and Pattern Recognition (cs.CV), Submitted on 1 May 2014 (v1) last revised 21 Feb 2015 (this version, v3), arXiv:1405.0312 [cs.CV]
  2. Mark Everingham, Luc Van Gool, The PASCAL Visual Object Classes (VOC) Challenge, Int J Comput Vis (2010), Received: 30 July 2008 / Accepted: 16 July 2009 / Published online: 9 September 2009.
  3. Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi "You Only Look Once: Unified, Real," Computer Vision and Pattern Recognition 2016, pp. 779-788, June 2016, arXiv:1506.02640.
  4. Tsung-Yi Lin, Focal Loss for Dense Object Detection, Computer Vision and Pattern Recognition (cs.CV), Submitted on 7 Aug 2017 (v1), last revised 7 Feb.
  5. Mr. Pankaj S. Parsania, A Comparative Analysis of Image Interpolation Algorithms, International Journal of Advanced Research in Computer and Communication Engineering Vol. 5, Issue 1, January 2016.
  6. Karen Simonyan, VERY DEEP CONVOLUTIONAL NETWORK SFORLARGE-SCALE IMAGE RECOGNITION, Published as a conference paper at ICLR 2015.
  7. Shaoqing Ren, Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks, Computer Vision and Pattern Recognition, Submitted on 4 Jun 2015 (v1), last revised 6 Jan 2016.
  8. Joseph Redmon, YOLO9000: Better, Faster, Stronger, Computer Vision and Pattern Recognition, Submitted on 25 Dec 2016, arXiv:1612.08242.
  9. 3D Object Representations for Fine-Grained Categorization, Kaggle, Stanford Cars Dataset. Jonathan Krause, Michael Stark, Jia Deng, Li Fei-Fei, 4th IEEE Workshop on 3D Representation and Recognition, at ICCV 2013 (3dRR-13). Sydney, Australia. Dec. 8, 2013.
  10. J. Hu, L. Shen, and G. Sun. Squeeze-and-excitation networks. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 7132-7141, 2018.
  11. E. D. Cubuk, B. Zoph, D. Mane, V. Vasudevan, and Q. V. Le. Autoaugment: Learning augmentation strategies from data. In Proceedings of the IEEE conference on computer vision and pattern recognition, 2019.