DOI QR코드

DOI QR Code

Implementation of Korean TTS Service on Android OS

안드로이드 OS 기반 한국어 TTS 서비스의 설계 및 구현

  • 김태권 (원광대학교 음성정보기술산업지원센터) ;
  • 김봉완 (원광대학교 음성정보기술산업지원센터) ;
  • 최대림 (원광대학교 음성정보기술산업지원센터) ;
  • 이용주 (원광대학교 컴퓨터공학부)
  • Received : 2011.12.09
  • Accepted : 2012.01.02
  • Published : 2012.01.28

Abstract

Though Android-based smart phones are being released in Korea, Korean TTS engine is not built on them and Google has not announced service or software developer's kit related to Korean TTS officially. Thus, application developers who want to include Korean TTS capability in their application have difficulties. In this paper, we design and implement Android OS-based Korean TTS system and service. For speed, text preprocessing and synthesis libraries are implemented using Android NDK. By using Java's thread mechanism and the AudioTrack class, the response time of TTS is minimized. For the test of implemented service, an application that reads incoming SMS is developed. The test shows that synthesized speech are generated in real-time for random sentences. By using the implemented Korean TTS service, Android application developers can transmit information easily through voice. Korean TTS service proposed and implemented in this paper overcomes shortcomings of the existing restrictive synthesis methods and provides the benefit for application developers and users.

국내에서 출시된 안드로이드 기반의 스마트폰은 한국어 TTS 엔진이 내장되어 있지 않고, 구글에서도 공식적인 한국어 TTS 기술 개발을 발표하지 않고 있는 상황이다. 따라서 안드로이드 스마트폰을 사용하는 어플리케이션 개발자 및 사용자들의 불편이 갈수록 심해져 가고 있다. 본 논문은 안드로이드 기반의 스마트폰에서 서비스할 수 있는 TTS시스템의 설계 및 구현에 대해 기술하였다. 신속 명료한 TTS를 위해 안드로이드 NDK를 이용하여 텍스트 전처리와 합성음 생성 라이브러리를 구현하였다. 또한, 자바의 스레드 기법과 스트림을 적용한 AudioTrack 클래스 객체를 사용하여 TTS 응답시간을 최소화 하였다. 구현된 한국어 TTS 서비스를 테스트하기 위해 수신된 문자메시지를 읽어주는 어플리케이션을 설계 및 개발하였다. 평가 결과, 임의의 문장에 대해 자연스러운 합성음을 생성하였으며, 실시간 청취가 가능하였다. 또한, 어플리케이션 개발자들은 구현된 한국어 TTS 서비스를 이용하여 음성을 통한 정보 전달을 손쉽게 적용할 수 있다. 본 논문에서 구현한 한국어 TTS 서비스는 기존 제한적 음성합성 방식의 어플리케이션의 단점을 개선하였으며, 음성을 통한 정보전달 어플리케이션 개발자 및 사용자들에게 사용성과 편의성을 제공할 수 있다.

Keywords

References

  1. 대한상공회의소, 직장인의 인터넷 활용실태 보고서, 2006.
  2. http://www.seoul.co.kr/news/newsView.php?id=20110623019012
  3. 고석훈, "안드로이드 플랫폼 동향", 한국콘텐츠학회지, 제8권, 제2호, pp.11-122, 2010.
  4. 한국소비자원 정보교육국 소비자 정보팀, 스마트폰 이용 만족도 비교정보 조사 결과, 2010.
  5. 한국정보통신기술협회(TTA) 웹 표준화 프로젝트 그룹(PG605), 모바일 접근성, 2010.
  6. 김종진, 김정세, 김상훈, 박준, 내장형 TTS 기술 동향 및 사례, 전자통신동향분석, 제23권, 제1호, 2008.
  7. T. Yoshimura, K. Tokuda, T. Masuko, T. Kobayashi, and T. Kitamura, "Simultaneous Modeling of Spectrum, Pitch and Duration in HMM-Based Speech Synthesis," Proc. of EUROSPEECH, Vol.5, pp.2347-2350, 1999.
  8. http://www.sitec.or.kr
  9. http://developer.android.com
  10. 국립국어원, 표준어 규정, 문교부 고시 제88-2호, 1988.
  11. http://hts.sp.nitech.ac.jp