Fast Algorithm for Recognition of Korean Isolated Words

한국어 고립단어인식을 위한 고속 알고리즘

  • 남명우 (서울 시립대학교 전자전기공학부 CAD & VLSI 연구실) ;
  • 박규홍 (서울 시립대학교 전자전기공학부 CAD & VLSI 연구실) ;
  • 정상국 (서울 시립대학교 전자전기공학부 CAD & VLSI 연구실) ;
  • 노승용 (서울 시립대학교 전자전기공학부 CAD & VLSI 연구실)
  • Published : 2001.01.01

Abstract

This paper presents a korean isolated words recognition algorithm which used new endpoint detection method, auditory model, 2D-DCT and new distance measure. Advantages of the proposed algorithm are simple hardware construction and fast recognition time than conventional algorithms. For comparison with conventional algorithm, we used DTW method. At result, we got similar recognition rate for speaker dependent korean isolated words and better it for speaker independent korean isolated words. And recognition time of proposed algorithm was 200 times faster than DTW algorithm. Proposed algorithm had a good result in noise environments too.

본 논문에서는 청각모델을 이용하여 음성신호로부터 추출한 특징벡터를 2차원 DCT (discrete cosine transform)방법을 사용하여 가공한 후, 새로운 거리측정 방법에 적용하여 한국어 고립단어 인식 실험을 행하였다. 고립단어 인식은 기존에 많은 방법들이 제안되어졌으나, 본 논문에서 제안한 방법은 고립단어 인식을 위한 특징 파라미터로 2차원 DCT 계수를 사용한 것으로 구현이 간단하며, 간단한 계산식으로 인하여 빠른 인식 시간을 가지는 장점이 있다. 제안한 방식의 타당성 검토를 위하여, 고립단어 인식에서 좋은 인식결과를 나타내는 DTW (Dynamic Time Warping)방법을 사용하여 인식률을 비교하였다[5][6]. 실험결과 제안한 방식은 DTW를 사용한 인식방법에 비하여 화자종속 고립단어 인식에서는 거의 유사한 인식결과를, 화자독립 고립단어 인식에서는 더 높은 인식결과를 얻을 수 있었다. 또한, DTW에 비해 패턴비교를 위한 계산시간에 있어서는 200배 이상의 감소효과를 볼 수 있었다. 제안된 방법은 비교 방법에 비하여 잡음환경에서도 강한 특성을 보였다.

Keywords

References

  1. IEEE Trans. Consumer Electron. v.38 no.1 The JPEG still picture compression standard G. K. Wallace
  2. Fundamentals of Speech Recognition Lawrence Rabiner;Biing-Hwang Juang
  3. IEEE Trans. v.2 Auditory Models and Human Performance in Tasks Related to Speech Coding and Speech Recognition Oded Ghitza
  4. Hearing Res. v.49 Modeling Rapid Waveform Compression on the Basilar Membrane as a Multiple-Bandpass-Nonlinearity Filtering J. L. Goldstein
  5. IEEE Trans. v.ASSP-28 no.6 Performance Tradeoffs in Dynamic Time Warping Algorithms for Isolated Word Recognition C. Myers;L.R. Rabiner;A. E. Rosenberg
  6. IEEE Trans. v.ASSP-26 no.1 Dynamic Programming Optimization for Spoken Word Recognition Sakoe;S. Chiba
  7. IEEE Trans. on signal proc. v.40 Discriminative Learnig for Minimum Error Classification B. H. Juang;Shigeru Katagiri