A Hardware Implementation of Support Vector Machines for Speaker Verification System

에스 브이 엠을 이용한 화자인증 알고리즘의 하드웨어 구현 연구

  • 최우용 (한국전자통신연구원 정보보호연구단) ;
  • 황병희 (부산대학교 컴퓨터공학) ;
  • 이경희 (부산대학교 컴퓨터공학) ;
  • 반성범 (한국전자통신연구원 정보보호연구) ;
  • 정용화 (고려대학교 컴퓨터공학) ;
  • 정상화 (부산대학교 컴퓨터공학과)
  • Published : 2004.05.01

Abstract

There is a growing interest in speaker verification, which verifies someone by his/her voices. There are many speaker vitrification algorithms such as HMM and DTW. However, it is impossible to apply these algorithms to memory limited applications because of large number of feature vectors to register or verify users. In this paper we introduces a speaker verification system using SVM, which needs a little memory usage and computation time. Also we proposed hardware architecture for SVM. Experiments were conducted with Korean database which consists of four-digit strings. Although the error rate of SVM is slightly higher than that of HMM, SVM required much less computation time and small model size.

화자인증이란 생체인식 방법 중의 하나로 사람의 목소리를 이용하여 사용자를 인증하는 방법이다. 현재까지 가장 많이 사용되는 화자인증 알고리즘으로는 HMM(Hidden Markov Model)과 DTW(Dynamic Time Warping)를 들 수 있는데, 이들 알고리즘은 사용자의 등록 및 인증을 위해 많은 수의 특징벡터를 필요로 하므로 스마트 카드와 같은 메모리가 제한된 시스템에는 적용하기 어려운 단점이 있다. 본 논문에서는 SVM(Support vector Machine)을 이용함으로써 적은 양의 메모리와 적은 계산량으로 화자인증을 수행할 수 있는 방법을 제안하였으며, 이의 실시간 처리를 위해 하드웨어 구조를 제시하였다. 한국어 4연숫자 데이터베이스를 이용하여 제안한 알고리즘의 성능을 평가한 결과, 기존 알고리즘에 비해 약간의 에러율 증가가 있었으나 수행시간 및 모델크기에서는 상당한 감소를 나타내었다. SVM을 이용한 화자인증 알고리즘을 하드웨어로 구현한 결과, 소프트웨어로 구현한 경우에 비해서 훈련시간은 175분의 1, 인증시간에서는 6분의 1의 감소를 나타내었다.

Keywords

References

  1. J. P. Campbell, 'Speaker recognition: a tutorial,' Proc. of the IEEE, Vol. 85, No.9, pp, 1437-1462, Sep. 1997 https://doi.org/10.1109/5.628714
  2. Q. Li, B.-H. luang, C.-H. Lee, Q. Zhou and F. K Soong, 'Recent advancements in automatic speaker authentication,' IEEE Robotics and Automation Magazine, pp. 24-34, Mar. 1999 https://doi.org/10.1109/100.755812
  3. J. He, L. Liu and G. Palm, 'A new codebook training algorithm for VQ-based speaker recognition,' Proc. ICASSP, Vol. 2, pp. 1091-1094, 1997 https://doi.org/10.1109/ICASSP.1997.596131
  4. C. M. deIAlamo, F. J. C. Gil, C. dela Torre Munilla and L. H. Gomez, 'Discriminative training of GMM for speaker identification,' Proc. ICASSP, Vol. 1, pp. 89-92, 1996 https://doi.org/10.1109/ICASSP.1996.540297
  5. S. Haykin, Neural networks, Prentice Hall, 1999
  6. W. - Y. Choi, K. Lee and Y. Chung, 'Support vector machines for robust speaker verification,' Proc. of the AICSST, pp. 262-267, 2002
  7. B. Scholkopf, C. J. C. Burges and A. J. Smola, Advances in kernel methods, The MIT Press, 1999
  8. R. Genov and G. Cauwenberghs, 'Charge-mode parallel architecture for vector-matrix multiplication,' Proc. of the IEEE, Vol. 48, No. 10, Oct. 2001 https://doi.org/10.1109/82.974781