DOI QR코드

DOI QR Code

An Emotion Recognition Technique using Speech Signals

음성신호를 이용한 감정인식

  • Published : 2008.08.25

Abstract

In the field of development of human interface technology, the interactions between human and machine are important. The research on emotion recognition helps these interactions. This paper presents an algorithm for emotion recognition based on personalized speech signals. The proposed approach is trying to extract the characteristic of speech signal for emotion recognition using PLP (perceptual linear prediction) analysis. The PLP analysis technique was originally designed to suppress speaker dependent components in features used for automatic speech recognition, but later experiments demonstrated the efficiency of their use for speaker recognition tasks. So this paper proposed an algorithm that can easily evaluate the personal emotion from speech signals in real time using personalized emotion patterns that are made by PLP analysis. The experimental results show that the maximum recognition rate for the speaker dependant system is above 90%, whereas the average recognition rate is 75%. The proposed system has a simple structure and but efficient to be used in real time.

휴먼인터페이스 기술의 발달에서 인간과 기계의 상호작용은 중요한 부분이다. 감정인식에 대한 연구는 이러한 상호작용에 도움을 준다. 본 연구는 개인화된 음성신호에 대하여 감정인식 알고리즘을 제안하였다. 감정인식을 위하여 PLP 분석을 이용하여 음성신호의 특징으로 사용하였다. 처음에 PLP 분석은 음성인식에서 음성신호의 화자 종속적인 성분을 제거하기 위하여 사용되었으나 이후 화자인식을 위한 연구에서 PLP 분석이 화자의 특징 추출을 위해 효과적임을 설명하고 있다. 그래서 본 논문은 PLP 분석으로 만들어진 개인화된 감정 패턴을 이용하여 쉽게 실시간으로 음성신호로부터 감정을 평가하는 알고리즘을 제안하였다. 그 결과 최대 90%이상의 인식률과 평균 75%의 인식률을 보였다. 이 시스템은 간단하지만 효율적이다.

Keywords

References

  1. Kwang-Dong Jang, Nam Kim, Oh-Wook Kwon, "Speech Emotion Recognition on a Simulated Intelligent Robot," 대한음성학회, vol. 56, pp. 173-183, 2006
  2. Chang-Huun Park and Kwee-Bo Sim, "Reinforcement Learning Method Based Interactive Feature Selection(IFS) Method for Emotion Recognition," 제어 자동화 시스템공학 논문지, 제12권 제7호, pp. 666-670, 2006 https://doi.org/10.5302/J.ICROS.2006.12.7.666
  3. J. Nicholson, K. Takahashi and R. Nakatsu, "Emotion Recognition in Speech using Neural Networks," Neural Comput. & Applic., 제9권, pp. 290-296, 2000 https://doi.org/10.1007/s005210070006
  4. Aishah Abdul Razak, Ryoichi Komiya, Mohamad Izani Zainal Abidin, "Comparison Between Fuzzy and NN Method for Speech Emotion Recognition," Proceedings of the Third International Conference on Information Technology and Applications, 2005
  5. 강면구, 서정태, 김원구, "음성 신호를 사용한 GMM 기반의 감정 인식," 한국음향학회지, 제23권 제 3호, pp. 235-241, 2004
  6. 조윤호, 박규식, "A Study on Robust Speech Emotion Feature Extraction Under the Mobile Communication Environment," 한국음향학회지, 제25권 제6호, pp. 269-276, 2006
  7. Vladimir Hozjan and Zdravko, "Context-Independent Multilingual Emotion Recognition from Speech Signals," International journal of speech technology, Vol. 6, pp. 311-320, 2003 https://doi.org/10.1023/A:1023426522496
  8. 심귀보, 박창현, 주영훈, "음향적 요소분석과 DRNN을 이용한 음성신호의 감성 인식," 퍼지 및 지능시스템학회 논문지, Vol. 13, No. 1, pp. 45-50, 2003
  9. 정광우, "화자인식을 위한 음성신호처리," 전자공학회집, 제26권, 제11호, pp. 135-1145, 1999

Cited by

  1. Extraction of Speech Features for Emotion Recognition vol.4, pp.2, 2012, https://doi.org/10.13064/KSSS.2012.4.2.073