Speech Recognition in Noisy Environments using the NOise Spectrum Estimation based on the Histogram Technique

히스토그램 처리방법에 의한 잡음 스펙트럼 추정을 이용한 잡음환경에서의 음성인식

  • Published : 1997.10.01

Abstract

Spectral subtraction is widely-used preprocessing technique for speech recognition in additive noise environments, but it requires a good estimate of the noise power spectrum. In this paper, we employ the histogram technique for the estimation of noise spectrum. This technique has advantages over other noise estimation methods in that it does not requires speech/non-speech detection and can estimate slowly-varying noise spectra. According to the speaker-independent isolated word recognition in both colored Gaussian and car noise environments under various SNR conditions. Histogram-technique-based spectral subtraction method yields superier performance to the one with conventional noise estimation method using the spectral average of initial frames during non-speech period.

스펙트럼 차감법은 잡음이 더해진 환경에서의 음성인시기에 널리 사용되는 전처리 방법이지만, 이를 위해서는 잡음의 스펙트럼을 잘 추정할 필요가 있다. 본 논문에서는 잡음 스펙트럼의 추정방법으로 히스토그램 처리방법을 사용한다. 이 방법은 음성/비음성 구간의 구분을 할 필요가 없으며 서서히 변화하는 잡음의 스펙트럼도 추정할 수 있다는 점에서 여타의 잡음 추정방법에 비해 장점을 지닌다. 다양한 SNR 조건하에서 유색 가우시안 잡음 및 실제 자동차 소음을 부가시킨 음성에 대해 화자독립 고립단어 인식 실험을 수행한 결과, 히스토그램 처리방법에 기반을 둔 스펙트럼 차감법의 인식성능이 초기 비음성구간의 스펙트럼 평균을 이용한 기존의 잡음 스펙트럼 추정방법에 비해 우수한 성능을 나타내었다.

Keywords