Fast Mode Decision Algorithm for H.264 using Mode Classification

H.264 표준에서 모드 분류를 이용한 고속 모드결정 방법

  • Kim, Hee-Soon (Gwangju Institute of Science Technology Department of Information and Communications) ;
  • Ho, Yo-Sung (Gwangju Institute of Science Technology Department of Information and Communications)
  • 김희순 (광주과학기술원 정보통신공학과) ;
  • 호요성 (광주과학기술원 정보통신공학과)
  • Published : 2007.05.25

Abstract

H.264 is a new international video coding standard that can achieve considerably higher coding efficiency than conventional standards. Its coding gain has been achieved by employing advanced video coding methods. Specially, the increased number of macroblock modes and the complex mode decision procedure using the Lagrangian optimization are the main factors for increasing coding efficiency. Although H.264 obtains improved coding efficiency, it is difficult to do an real-time encoding because it considers all coding parameters in the mode decision procedure. In this paper, we propose a fast mode decision algorithm which classifies the macroblock modes in order to determine the optimal mode having low complexity quickly. Simulation results show that the proposed algorithm can reduce the encoding time by 34.95% on average without significant PSNR degradation or bit-rate increment. In addition, in order to show the validity of simulation results, we set up a low boundary condition for coding efficiency and complexity and show that the proposed algorithm satisfies the low boundary condition.

지난 수년간 많은 국제 비디오 부호화 표준들이 연구되고 제안되었다. 그 중에서도 H.264는 가장 최근에 제안된 부호화 방식으로 가장 높은 부호화 효율을 제공한다. 이는 기존의 부호화 방식들보다 향상된 부호화 기법들을 사용했으며, 특히 다양한 매크로블록 모드와 라그랑지안(Lagrangian) 최적화 기법을 통한 최적 모드 결정법은 부호화 효율 향상에 결정적인 역할을 했다. 비록 H.264는 부호화 효율 측면에서 기존의 방식보다 월등한 성능 향상을 보이지만, 최적 모드를 결정하는 과정에서 모든 부호화 매개 변수를 고려하므로 실시간 부호화가 어려울 정도로 복잡도가 크게 증가한다. 본 논문에서는 이러한 복잡도를 최소화하기 위해 매크로블록 모드를 복잡도 측면에서 분류하고 복잡도가 낮은 최적 모드를 조기에 결정하는 고속 모드결정 방식을 제안한다. 실험 결과, 제안한 방식은 여러 종류의 실험 영상에 대해 현저한 PSNR 감소나 비트량 증가 없이 부호화 시간을 평균 34.95%까지 감소시켰다. 또한, 본 논문에서 제공한 실험 결과의 타당성을 보이기 위해 부호화 효율과 복잡도에 대한 하위 경계조건(low boundary condition)을 설정하고, 제안한 방식이 하위 경계조건을 만족함을 보였다.

Keywords

References

  1. ITU-T Rec. H.264 | ISO/IEC 14496-10 AVC, 'Draft ITU-T Recommendation and Final Draft International Standard of Joint Video Specification', JVT Doc. G050, March 2003
  2. T. Wiegand, G. J. Sullivan, G. Bjontegaard, and A. Luthra, 'Overview of the H.264/AVC Video Coding Standard,' IEEE Trans. Circuit and System for Video Technology, vol. 13, no. 7, pp. 560-576, July 2003 https://doi.org/10.1109/TCSVT.2003.815165
  3. T. Wiegand, M. Lightstone, T. G. Campbell, and S. K. Mitra, 'Efficient Mode Selection for Block-Based Motion Compensated Video Coding', Proc. Int. Conf. on Image Processing, pp. 23-2, Oct. 1995 https://doi.org/10.1109/ICIP.1995.537540
  4. T. Wiegand, H. Schwarz, A. Joch, F. Kossentini and G. J. Sullivan, 'Rate-Constrained Coder Control and Comparison of Video Coding Standards', IEEE Trans. Circuit and System for Video Technology,vol. 13, no. 7, pp. 688-703, July 2003 https://doi.org/10.1109/TCSVT.2003.815168
  5. G. Sullivan and T. Wiegand, 'Rate-distortion Optimization for Video Compression', IEEE Signal Processing Magazine, vol. 15, pp. 74-90, Nov. 1998 https://doi.org/10.1109/79.733497
  6. T. Wiegand and B. Girod, 'Lagrange Multiplier Selection in Hybrid Video Coder Control', Proc. Int. Conf. on Image Processing, pp. 542-54, Oct. 2003 https://doi.org/10.1109/ICIP.2001.958171
  7. Y. Wang, Q. F. Zhu and L. Shaw, 'Maximally Smooth Image Recovery in Transform Coding', IEEE Tansactions on Communication, vol. 41, no. 10, pp. 1544-1551, Oct. 1993 https://doi.org/10.1109/26.237889
  8. G. Bjontegaard, 'Calculation of Average PSNR Difference between RD-curve', ITU-T Q.6/16, Doc. VCEG-M33, April 2001