DOI QR코드

DOI QR Code

A Study on Improved Method of Voice Recognition Rate

음성 인식률 개선방법에 관한 연구

  • 김영포 (한국항공대학교 정보통신공학과) ;
  • 이한영 (대림대학교 방송음향영상학과)
  • Received : 2012.09.10
  • Accepted : 2013.01.21
  • Published : 2013.01.31

Abstract

In this paper, we suggested a method about the improvement of the voice recognition rate and carried out a study on it. In general, voices were detected by applying the most widely-used method, HMM (Hidden Markov Model) algorithm. Regarding the method of detecting voices, the zero crossing ratio was calculated based on the units of voices before the existence of data was identified. Regarding the method of recognizing voices, the patterns shown by the forms of voices were analyzed before they were compared to the patterns which had already been learned. According to the results of the experiment, in comparison with the recognition rate of 80% shown by the existing HMM algorithm, the suggested algorithm based on the recognition of the patterns shown by the forms of voices showed the recognition rate of 92%, reflecting the recognition rate improved by about 12% compared to the existing one.

본 논문에서는 음성 인식률 개선에 관한 방법을 제시하고 연구하였다. 기존의 음성 검출 방법 중 많이 이용되고 있는 HMM(Hidden Markov Model) 알고리즘을 이용하여서 음성을 검출하였다. 실험은 음성 검출과 음성 인식의 두 가지 방법으로 진행하였다. 음성 검출은 음성의 단위로 영교차율을 구하여 데이터의 유무를 판별하였다. 음성 인식은 음성의 형상의 패턴을 분석한 후 학습된 패턴과 비교 하는 형식으로 분석하였다. 실험 결과, 제안된 음성 형상의 패턴인식 이용한 알고리즘은 92%의 음성 인식률을 얻어 80%의 기존 HMM 알고리즘에 비해서 약 12%의 향상된 인식률을 얻을 수 있었다.

Keywords

References

  1. J. M. Markoul, "Linear prediction A tutorial review", Proceeding sof IEEE, Vol. 63, No. 4, 1975.
  2. 薺蕂-收三, 中田和男, "音聲情報處理の基礎", オ-ム社, 1982.
  3. 中川聖一, "連タ續出力分布型HMMによる日本 音韻認識", 音響學會論文誌, Vol. 46, pp. 486-496, 1990.
  4. 허강인, "스펙트럼 모멘트법에의한 韓國語音聲의포만트周波數 推定에 관한 硏究", 博士學位論文, 1990.
  5. 김수훈, 이종진, 허강인, "이산 지속시간제어 연속 분포 HMM을 이용한 연속음성 인식", 한국음향학회논문지, 14권, 1호, pp. 81-89, 1995.
  6. 한학용, "우리말 음성의 최적분할과 인식에 관한 연구", 博士學位論文, 2004.
  7. 한학용저, "패턴인식개론", 한빛미디어, pp. 418-424, 2009.
  8. L. R. Rabiner and B. H. Juang, "An Introdu-ction to Hidden Markov Models", IEEE ASSP magazine, pp. 4-17, 1986.
  9. 이종진, "한국어 연속음성 인식시스템의 구현", 博士學位論文, 1994.
  10. 한학용저, "패턴인식개론", 한빛미디어, pp. 418-424, 2009.
  11. A. Rosen Feld, A. C. Kak, "Digital Picture Processing", 2nd Edition, Academic Press, 1982.
  12. Franco, H., Weintraub, M., Cohen, M., "Context modeling in a hybird HMM neural net speech recognition system", International Conference on Neural Networks, Vol. 4, 9-12, pp. 2089-2092, 1997.
  13. 김용연, "영상통신을 위한 웨이블릿 변환 부호화 " 한국전자통신신학회논문지, 6권, 1호, pp. 61-67, 2011.
  14. 홍완표, "데이터 전송 효울을 wrhvy한 $3{{\times}}4$비트 1 바이트 문자 부호화 규칙에 관한 연구" 한국전자통신신학회논문지, 6권, 4호, pp. 499-504, 2012.
  15. 이창영, "음성인식에서 중복성의 저감에 대한 연구", 한국전자통신신학회논문지, 7권, 3호, pp. 475-483, 2012.
  16. 김범준 "버퍼 크기 기반 자동재전송 프로토콜의 재전송 지속성 제어" 한국전자통신신학회논문지, 7권, 3호, pp. 487-492, 2012.
  17. 정상래, "NCW 및 전술데이터링크 기술개발 현황분석", 한국전자통신신학회논문지, 7권, 5호, pp. 991-998, 2012.