On a Pitch Alteration Technique in the V/UV Spectrum for High Quality Speech Synthesis Technique

고음질 합성방식용 V/UV 스펙트럼상의 피치변경법에 관한 연구

  • 조왕래 (숭실대학교 정보통신공학과) ;
  • 배명진 (숭실대학교 정보통신공학과) ;
  • 김동성 (숭실대학교 정보통신공학과)
  • Published : 1996.12.01

Abstract

Most waveform coding techniques attempt to reduce redundancy of speech signal while preserving the shape of the waveform. In speech synthesis, wavefrom coding methods are used to the synthesis by rule for high quality speech. However, it is difficult to apply the waveform coding to the synthesis by rule because the parameters of the wavefrom coding cannot be classified as either the excitation or the vocal tract parameters. The proposed method shows little spectrum distortion of 2.7% or less for 50% pitch changes. It also achieves smooth connection of wavefrom magnitudes among the frames by compensating the phase in time domain.

파형부호화법은 파형의 잉여성분 제거과정을 통해 음성파형의 꼴을 단순히 보존하는 부호화법이다. 음성합성분야에서 파형부호화법은 주로 분석에 의한 고음질 합성방식으로 적용되고 있다. 그렇지만 이 부호화법은 분석시에 여기원과 성도여파기 피라미터들로 분류하여 처리하지 않기 때문에 규칙에 의한 합성방식으로는 적용하기가 힘들다. 본 논문에서는 스펙트럼영역에서 유성스펙트럼에 대해서만 스펙트럼축의 변경을 통해 피치를 조절하는 새로운 피치변경법을 제안하였다. 이 방법은 주파수영역의 처리법이며 50%의 피치변경을 수행하여도 스펙트럼 왜곡율이 2.7% 이하로 얻어졌고, 시간영역의 위상특성 보상에 의해 프레임간의 진폭연결이 자연스럽다는 장점을 갖느다.

Keywords