DOI QR코드

DOI QR Code

Efficient Approximate String Searches using Bitmap Filter

비트맵 필터를 이용한 효율적인 유사 문자열 검색 기법

  • Kwon, In-Teak (Div. of Electronics & Information Engineering, Chonbuk National University) ;
  • Kim, Jong-Ik (Div. of Computer Science & Engineering, Chonbuk National University)
  • 권인택 (전북대학교 전자정보공학부) ;
  • 김종익 (전북대학교 컴퓨터공학부)
  • Published : 2011.04.30

Abstract

텍스트 데이터는 표현 방식의 차이, 타이핑 오류 등을 포함하고 있어 정확히 일치하는 검색으로는 유용한 정보를 얻기 어렵다. 따라서 유사도 기반 검색 방법이 많이 연구되고 있으며 효율적인 유사도 기반 검색을 위해 텍스트 데이터에 대한 역 리스트를 구성한다. 그리고 이를 병합하여 질의와 일정 기준 이상 유사한 데이터를 찾는다. 본 논문에서는 역 리스트 병합 과정에서 역 리스트의 탐색 비용을 줄이기 위해 비트맵 필터를 사용하는 기법을 제안한다. 비트맵 필터를 사용하여 역 리스트의 탐색 여부를 결정하여 불필요한 역 리스트 탐색을 회피함으로써 역 리스트 병합 비용을 줄인다. 실험을 통하여 제안된 기법이 기존의 연구에서 제안된 역 리스트 병합 알고리즘의 성능을 30~40% 정도 개선함을 보인다.

Keywords