Performance Comparison of Out-Of-Vocabulary Word Rejection Algorithms in Variable Vocabulary Word Recognition

가변어휘 단어 인식에서의 미등록어 거절 알고리즘 성능 비교

  • 김기태 (인하대학교 전자공학과 디지털 신호처리 연구실) ;
  • 문광식 (인하대학교 전자공학과 디지털 신호처리 연구실) ;
  • 김회린 (한국정보통신대학원대학교 공학부) ;
  • 이영직 (한국전자통신연구원 통신단말연구부 멀티모달 I/F팀) ;
  • 정재호 (인하대학교 전자공학과 디지털 신호처리 연구실)
  • Published : 2001.02.01

Abstract

Utterance verification is used in variable vocabulary word recognition to reject the word that does not belong to in-vocabulary word or does not belong to correctly recognized word. Utterance verification is an important technology to design a user-friendly speech recognition system. We propose a new utterance verification algorithm for no-training utterance verification system based on the minimum verification error. First, using PBW (Phonetically Balanced Words) DB (445 words), we create no-training anti-phoneme models which include many PLUs(Phoneme Like Units), so anti-phoneme models have the minimum verification error. Then, for OOV (Out-Of-Vocabulary) rejection, the phoneme-based confidence measure which uses the likelihood between phoneme model (null hypothesis) and anti-phoneme model (alternative hypothesis) is normalized by null hypothesis, so the phoneme-based confidence measure tends to be more robust to OOV rejection. And, the word-based confidence measure which uses the phoneme-based confidence measure has been shown to provide improved detection of near-misses in speech recognition as well as better discrimination between in-vocabularys and OOVs. Using our proposed anti-model and confidence measure, we achieve significant performance improvement; CA (Correctly Accept for In-Vocabulary) is about 89%, and CR (Correctly Reject for OOV) is about 90%, improving about 15-21% in ERR (Error Reduction Rate).

발화 검증이란 등록된 단어 목록 이외의 단어가 입력되었을 때, 미등록된 단어는 인식할 수 없는 단어임을 알려주는 기능으로써 사용자에게 친숙한 음성 인식 시스템을 설계하는데 중요한 기술이다. 본 논문에서는 가변어휘 단어 인식기에서 최소 검증 오류를 나타낼 수 있는 발화 검증 시스템의 알고리즘을 제안한다. 우선, 한국전자통신연구원의 PBW(Phonetically Balanced Words) 445DB를 이용하여 가변어휘 단어 인식에서의 미등록어 거절 성능을 향상시키는 효과적인 발화 검증 방법을 제안하였다. 구체적으로 특별한 훈련 과정이 없이도 유사 음소 집합을 많이 포함시킨 반음소 모델을 제안하여 최소 검증 오류를 지니도록 하였다. 또한, 음소 단위의 null hypothesis와 alternate hypothesis의 비를 이용한 음소 단위의 신뢰도는 null hypothesis로 정규화해서 강인한 발화 검증 성능을 보여 주었으며, 음소 단위의 신뢰도를 이용한 단어 단위의 신뢰도는 등록어와 미등록어 사이의 분별력을 잘 표현해 주었다. 이와 같이 새로이 제안된 반음소 모델과 발화 검증 방법을 사용했을 때, CA (Correctly Accept for Keyword: 등록어를 제대로 인정한 경우)는 약 89%, CR (Correctly Reject for OOV (Out-of-Vocabulary): 미등록어에 대해 거절한 경우)은 약 90%로써, 기존 필터 모델을 이용한 방법보다 미등록어 거절 성능이 ERR (Error Reduction Rate) 측면에서 약 15-21% 향상됨을 알 수 있었다.

Keywords

References

  1. 한국음향학회지 v.18 no.3 반음소 모델링을 이용한 거절기능에 대한 연구 김우성;구명완
  2. ICSLP Improved Utterance Rejection Using Length Dependent Thresholds Sunil K. Gupta;Frank K. Soong
  3. ICSLP Vocabulary-Independent Word Confidence Measure Using Subword Features Li Jiang;Xuedong Huang
  4. ICASSP Discriminative Utterance Verification Using Minimum String Verification Error (MSVE) Training Mazin G. Rahim;Chin-Hui Lee;Biing-Hwang Juang;Wu Chou
  5. 한국음향학회지 v.16 no.2 음성학적 지식 기반 변이음 모델을 이용한 가변 어휘 단어 인식기 김회린;이항섭
  6. ICSP v.1 Out-of -Vocabulary Rejection using Phone Filler Model in Variable Vocabulary Word Recognition Hoi-Rin Kim;SiongHun Yi;Hang-Seop Lee