DOI QR코드

DOI QR Code

Selective Inter-layer Residual Prediction Coding and Fast Mode Decision for Spatial Enhancement Layers in Scalable Video Coding

스케일러블 비디오 부호화에서 선택적 계층간 차분 신호 부호화 및 공간적 향상 계층에서의 모드 결정

  • Published : 2007.11.30

Abstract

In order to reduce the complexity of SVC encoding, we introduce a fast mode decision method in the enhancement layers of spatial scalability by selectively performing the inter-layer residual prediction of SVC. The Inter-layer residual prediction coding in Scalable Video Coding has a large advantage of enhancing the coding efficiency since it utilizes the correlation between two residuals from a lower spatial layer and its next higher spatial layer. However, this entails the dramatical increase in the complexity of SVC encoders. The proposed method is to analyze the characteristics of integer transform coefficients for the subtracted signal for two residuals from lower and upper spatial layers. Then it selectively performs the inter-layer residual prediction coding and rate-distortion optimizations in the upper spatial enhancement layer if the SAD values of residuals exceed adaptive threshold values. Therefore, by classifying the residuals according to the properties of integer-transform coefficients only with SAD of residuals between two layers, the SVC encoder can perform the inter-layer residual coding selectively, thus significantly reducing the total required encoding time. The proposed method results in reduction of the total encoding time with 51.5% in average while maintaining the RD performance with negligible amounts of quality degradation.

본 논문에서는 스케일러블 비디오 부호화기의 복잡도 감소를 위해, 공간 계층간 잔차 신호 부호화를 선택적으로 수행하고 그 정보를 바탕으로 향상 계층에서 모드를 고속으로 결정하는 방법에 대해 소개한다. 계층간 잔차 신호 부호화는 스케일러블 비디오 부호화에서 공간 계층간 상관도를 이용하여 계층간의 두 잔차 신호에 대한 차 신호를 부호화하는 방법으로서 부호화 효율을 증대 할 수 있는 장점이 있으나 향상 계층의 모든 화면간 모드에 대해 율-왜곡 비용을 계산하기 때문에 부호화기의 복잡도를 크게 증가시키는 주요 요인이 된다. 제안 알고리듬은 하위 계층으로부터 업샘플된 잔차 신호와, 하위 계층의 움직임 벡터, 참조 화면 정보를 이용하여 향상 계층에서 얻은 잔차 신호의 SAD값을 통해 정수 변환 계수의 특징을 미리 판별하여 계층간 잔차 신호 부호화를 선택적으로 수행하는 방법이다. 제안 알고리듬에서는 계층간 잔차 영상의 차 신호에 대한 SAD값에 양자화 계수와 시간 계위에 따라 문턱치 값을 적응적으로 적용시키면서 SAD가 적응적으로 설정된 문턱치 보다 작을때는 잔차 블록에 대한 정수변환 계수가 매우 작다고 판단하여 그 블록에 대해서는 선택적으로 계층간 잔차 부호화를 수행하고 역시 공간적 향상 계층에서 $16{\times}16$블록에 대해서만 율-왜곡 최적화를 수행한다. 따라서 계층간 차분 신호에 대한 SAD값만으로 정수변환계수의 특성을 양자화 계수와 시간 계위에 따라 분류하여 고속의 부호화를 달성함으로써 SVC 부호화기의 복잡도 및 부호화 시간을 크게 감소 시켰다. 제안 알고리듬을 적용하면 다양한 특성을 갖는 영상에 대하여 부호화 시간을 원래의 SVC 참조 소프트웨어 대비 평균 51.5%의 부호화 속도를 향상하였음에도 이에 따른 PSNR의 감소는 평균 0.03dB, 비트율의 증가는 0.64%로 무시할 수 있을 정도로 작았다.

Keywords

References

  1. T.Wiegand, G.Sullivan, J.Reichel, H.Schwarz and M.Wien, ISO/IEC JTC 1/SC 29/WG 11 and ITU-T SGI6 Q.6: JVT-W201 'Joint Draft 10 of SVC Amendment,' 23th Meeting, San Jose, California, April 2007
  2. ITU-T and ISO/IEC JTC 1, 'Generic Coding of Moving Pictures and Associated Audio Information Part 2:Video,' ITU-T Recommendation H.262 ISO/IEC 13818-2, 1994
  3. ISO/IEC 14496-2,'Information technology-Coding of audio-visual objects - part 2', International Standard, second edition, December 2001
  4. ITU-T and ISO/IEC JVT 1, 'Advanced video coding for generic audiovisual services,' ITU- T Recommendation H.264 and ISO/IEC 14496-1-(MPEG-4 AVC), Version 1:May 2003, Version 2: Jan 2004, Version 3:Sep.2004, Version 4:July 2005
  5. 최해철, 강정원, 배성준, 유정주, '스케일러블 비디오 부호화 Phase 1기술', 전자공학회지, 제34권, 8호, pp.18-26, 2007년 8월
  6. 이범식, 김문철, 함상진, 김병선, 이근식, 박근수, , '스케일러블 비디오 부호화에서 통계적 가설검증을 이용한 고속 화면간 모드 결정', 제12권 3호 pp.250-265, 2007년 5월 https://doi.org/10.5909/JBE.2007.12.3.250
  7. H.Schwarz, D.Marpe and T.Wiegand, 'Hierarchical B pictures,' Joint Video Team, Doc.JVT-POI4, Poznan, Poland, July 2005
  8. H.Li, Z.Li and C.Wen, 'Fast Mode Decision Algorithm for Inter-Frame Coding in Fully Scalable Video Coding', IEEE Transaction on Circuits and Systems for Video Technology, vol 16, no 7, pp.889-895, July 2006 https://doi.org/10.1109/TCSVT.2006.877404
  9. D.S.Turga, M.van der Schaar, Y.Andreopoulos, A.Munteanu, P.Schelkens, 'Unconstrained motion compensated temporal filtering(UMCTF) for efficient and flexible interframe wavelet video coding,' Signal Processing :Image Communication, 20(2005) 1-19 https://doi.org/10.1016/j.image.2004.08.006
  10. A.Segall and J.Zhao, ISO/IEC JTC 1/SC 29/WG 11 and ITU-T SG16 Q.6: JVT-U42 'CE:Evaluation of Texture Upsampling with 4-tap Cubic-Spline Filter,' 21 st Meeting, Hangzhou, China, October 2006
  11. H.Schwarz, T.Hinz, D.Marpe and T.Wiegand, 'Constrained Inter-Layer Prediction for Single-Loop Decoding in Spatial Scalability,' IEEE International Conference on Image Processing, vol. 2, pp.870-873, September 2005
  12. D.Wu, F.Pan, K.P.Lim, S.Wu, Z,G,Li, X.Lin, S.Rahardja and C.C.Ko, ' Fast Intermode Decision in H.264/AVC Video Coding,' IEEE Transaction on Circuits and Systems for Video Technology, vol.l5, no.6, pp.953-958, July 2005 https://doi.org/10.1109/TCSVT.2005.848304
  13. H.Wang, S.Kwong, 'Hybrid Model to Detect Zero Quantized DCT Coefficients in H.264,' IEEE Transaction on Multimedia, vol.9, no.4 pp.728-735, June 2007 https://doi.org/10.1109/TMM.2007.893336
  14. H.Hallapuro, M.Karczewicz and L.Kerofsky, 'Low Complexity Transform and Quantization in H.264/AVC,' IEEE Transaction on Circuits and Systems for Video Technology, vol.l3, no 7, pp.598-603, July, 2003 https://doi.org/10.1109/TCSVT.2003.814964
  15. L. A. Sousa, 'General method for eliminating redundant computations in video coding,' Electronics Letters, vol.36, noA, pp.306-307, Feb. 2000 https://doi.org/10.1049/el:20000272
  16. Y.H.Moon, G.Y.Kim and lH.Kim, 'An Improved Early Detection Algorithm for All-Zero Blocks in H.264 Video Encoding,' IEEE Transaction on Circuits and Systems for Video Technology, vol.15, no.8, pp.1053-1057, August, 2005 https://doi.org/10.1109/TCSVT.2005.852411
  17. J.Vieron, M.Wien and H.Schwarz, ISO/IEC JTC 1/SC 29/WG 11 and ITU-T SG16 Q.6: JVT-V203 'JSVM 9 Software' 22th Meeting, Marrakech, Morocco, January 20071
  18. G. Bjontegaard, 'Calculation of Average PSNR Differences between RD-curves,' Doc. VCEG-M33, April 2001
  19. Heiko Schwarz, Detlev Marpe and Thomas Wiegand, 'Analysis of Hierarchical B Pictures and MCTF,' IEEE International Conference on Multimedia & Expo (ICME 2006), Canada, July 9-12, 2006
  20. H. Schwarz, D. Marpe, and T. Wiegand, 'MCTF and Scalability Extension of H.264/AVC,' Proc. PCS 2004, San Francisco, CA, USA, December 2004

Cited by

  1. Fast Mode Decision Algorithm for Inter-Frame Coding in Fully Scalable Video Coding vol.16, pp.7, 2006, https://doi.org/10.1109/TCSVT.2006.877404