A Hangul Document Image Retrieval System Using Rank-based Recognition

웨이브렛 특징과 순위 기반 인식을 이용한 한글 문서 영상 검색 시스템

  • 이득용 (전북대학교 컴퓨터과학과) ;
  • 김우연 (전북대학교 컴퓨터과학과) ;
  • 오일석 (전북대학교 컴퓨터과학과)
  • Published : 2005.04.01

Abstract

We constructed a full-text retrieval system for the scanned Hangul document images. The system consists of three parts; preprocessing, recognition, and retrieval components. The retrieval algorithm uses recognition results up to k-ranks. The algorithm is not only insensitive to the recognition errors, but also has the advantage of user-controllable recall and precision. For the objective performance evaluation, we used the scanned images of the Journal of Korea Information Science Society provided by KISTI. The system was shown to be practical through theevaluationofrecognitionandretrievalrates.

우리는 스캔된 한글 문서 영상에 대한 전문(full-text) 검색 시스템을 구축하였다. 이 시스템은 크게 전처리부, 인식부, 그리고 검색부로 구성되어 있다 검색 알고리즘은 k순위까지의 인식 결과를 이용한다. 이 방법은 검색 성능이 인식 오류에 둔감할 뿐만 아니라, 재현률과 정확률을 사용자가 조절할 수 있는 장점을 갖는다. 객관적인 성능 평가를 위해 KISTI가 제공하는 정보과학회 논문지 영상을 실험에 사용하였다. 인식과 검색 성능을 통하여 시스템이 실용적임을 보였다.

Keywords