DOI QR코드

DOI QR Code

MPEG Audio New Standard: USAC Technology

MPEG 오디오 최신 표준: USAC 기술

  • 이태진 (한국전자통신연구원 방통융합미디어연구부) ;
  • 강경옥 (한국전자통신연구원 방통융합미디어연구부) ;
  • 김환우 (충남대학교 전자공학과)
  • Received : 2011.06.24
  • Accepted : 2011.08.08
  • Published : 2011.09.30

Abstract

As mobile devices become multi-functional, and converge into a single platform, there is a strong need for a codec that is able to provide consistent quality for speech and music contents. MPEG-D USAC standardization activities started at the 82nd MPEG meeting with a CfP and approved Study on DIS at the 96th MPEG meeting. MPEG-D USAC is converged technology of AMR-WB+ and HE-AAC V2. Specifically, USAC utilizes three core codecs (AAC, ACELP, and TCX) for low frequency regions, SBR for high frequency regions, the MPEG Surround for stereo information, and window transition technology for smoothing transition between various core coder. USAC can provide consistent sound quality for both speech and music contents and can be applied to various applications such as multi-media download to mobile devices, digital radio, mobile TV and audio books.

다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. 이와 같은 새로운 부호화 기술에 대한 요구사항에 따라, MPEG에서는 2007년 10월 82차 회의에서 CfP를 시작으로 USAC 표준화를 시작하였고, 2011년 7월 97차 회의에서 FDIS까지 승인하였다. MPEG-D USAC 기술은 최신 음성 부호화기인 AMR-WB+와 최신 오디오 부호화기인 HE-AAC V2를 융합한 기술로 입력 신호의 특성에 따라 코어 대역 부호화로 AAC, ACELP, TCX 등 다양한 방법 중 하나를 선택하여 부호화를 수행하고, 고대역 부호화 기술로는 SBR, 스테레오 부호화 기술로는 MPEG-Surround를 이용하며, 다양한 코어 코더 사이의 천이를 위한 윈도우 기술을 이용한다. USAC 기술은 음성과 음악 신호 모두에 대해 우수한 음질을 제공할 수 있으며, 모바일 기기로의 멀티미디어 콘텐츠 다운로드, 디지털 라디오, 모바일 TV 및 오디오 북 등에서 응용이 가능하다.

Keywords

References

  1. ISO/IEC SC29 WG11 N9519, Call for Proposals on Unified Speech and Audio Coding, 82nd MPEG Meeting, October, 2007.
  2. 박호종, 박영철, "MPEG 오디오표준기술: USAC," 방송공학회지, 14권, 2호, 63-74쪽, 2009.
  3. 이태진, 강경옥, 김환우, "MPEG-D USAC: 통합 음성 오디오 부호화 기술", 한국음향학회논문지, 제28권, 제7호, pp. 589-598, 2009.
  4. ISO/IEC SC29 WG11 N12013, Study on ISO/IEC 23003-3:201x/DIS of Unified Speech and Audio Coding, 96th MPEG Meeting, March, 2011.
  5. 3GPP TS 26.290 V6.3.0, Extended Adaptive Multi-Rate -Wideband (AMR-WB+) codec, 2007.
  6. ISO/IEC 14496-3:2005, Information technology - Coding of audio- visual objects -Part 3: Audio, 2005
  7. ISO/IEC SC29 WG11 N9638, Evaluation Guidelines for Unified Speech and Audio Proposals, 83rd MPEG Meeting, Antalya, Turkey, January, 2008.
  8. ISO/IEC SC29 WG11 N9927, Workplan for Subjective Testing of Unified Speech and Audio Coding Proposals, 84th MPEG Meeting, Archamp, France, April, 2008.
  9. ISO/IEC 14496-3, AMD. 1, Bandwidth Extension, 2003.
  10. ISO/IEC 14496-3, AMD. 2, Parametric Coding of High Quality Audio, 2004.
  11. ISO/IEC SC29 WG11 N10047, Report on Unified Speech and Audio Coding Call for Proposals Submissions, 85th MPEG Meeting, July, 2008.
  12. ISO/IEC SC29 WG11 N10215, WD on Unified Speech and Audio Coding, 86th MPEG Meeting, October, 2008.
  13. Frederik Nagel, Sascha Disch, and Nikolaus Rettelbach, "A PHASE VOCODER DRIVEN BANDWIDTH EXTENSION METHOD WITH NOVEL TRANSIENT HANDLING FOR AUDIO CODECS," in 127thAESConvention,NewYork,USA,Oct.2009.
  14. 이태진, 강경옥, 오현오, MPEG-D USAC 표준화 동향 및 기술추적 보고서, MPEG 포럼, 2010
  15. ISO/IEC SC29 WG11 N12027, Workplan for Verification Testing of USAC, 964th MPEG Meeting, Geneva, Switzerland, March, 2011.