Content based Video Copy Detection Using Spatio-Temporal Ordinal Measure

시공간 순차 정보를 이용한 내용기반 복사 동영상 검출

  • Received : 2011.11.08
  • Accepted : 2012.01.02
  • Published : 2012.03.25

Abstract

In this paper, we proposed fast and efficient algorithm for detecting near-duplication based on content based retrieval in large scale video database. For handling large amounts of video easily, we split the video into small segment using scene change detection. In case of video services and copyright related business models, it is need to technology that detect near-duplicates, that longer matched video than to search video containing short part or a frame of original. To detect near-duplicate video, we proposed motion distribution and frame descriptor in a video segment. The motion distribution descriptor is constructed by obtaining motion vector from macro blocks during the video decoding process. When matching between descriptors, we use the motion distribution descriptor as filtering to improving matching speed. However, motion distribution has low discriminability. To improve discrimination, we decide to identification using frame descriptor extracted from selected representative frames within a scene segmentation. The proposed algorithm shows high success rate and low false alarm rate. In addition, the matching speed of this descriptor is very fast, we confirm this algorithm can be useful to practical application.

본 논문은 대용량 동영상을 관리하기 위한 빠르고 효율적인 내용기반 중복 동영상 검출 알고리즘을 제안한다. 효율적인 중복 동영상 검출을 위해 대용량의 동영상을 처리하기 쉬운 작은 단위로 나누는 동영상 장면 전환 기반 분할 기술을 적용하였다. 동영상 서비스 및 저작권 보호 관련 사업모델의 경우, 필요한 기술은 아주 작은 구간의 동영상이나 한 장의 영상 을 검색하기보다는 상당한 길이 이상 일치하는 동영상을 파악하는 기술이 필요하다. 이러한 중복 동영상 검출을 위해 본 논문에서 동영상을 장면 전환을 기준으로 분할하여, 나누어진 장면 내에서 움직임 분포 서술자와 대표 프레임을 선택하여 프레임 서술자를 추출한다. 움직임 분포 서술자는 동영상 디코딩 과정에서 얻어지는 매크로 블록의 움직임 벡터를 이용한 장면 내 움직임 분포 히스토그램을 구성하였다. 움직임 분포 서술자는 정합시 고속 정합이 가능하도록 필터링 역할을 한다. 반면 움직임 정보만는 낮은 변별력을 가진다. 이를 높이기 위해 움직임 분포 서술자를 이용하여 정합된 장면 간에 선택된 대표 프레임의 패턴 서술자를 이용하여 동영상의 중복 여부를 최종 판단한다. 제안된 방법은 실제 동영상 서비스 환경에서 우수한 인식률과 낮은 오인식률을 가질 뿐만아니라 실제 적용이 가능할 정도의 빠른 정합 속도를 얻을 수 있었다.

Keywords

References

  1. C. Jacob, A. Frinkelstein, and D. Salesin "Fast multiresolution image query," Technical Report 95-01-06, University of Washington, 1995.
  2. Y. Aslandogan, T. Yu, "Techniques and systems for image and video retrieval," IEEE Trans. on Knowledge and Data Engineering, Vol. 11, No.1, p 56-63, Jan. 1999. https://doi.org/10.1109/69.755615
  3. J. M. Martinez, "Overview of the MPEG-7 Standard," ISO/IEC JTCI/SC29/WG11/N4031, Mar. 2001.
  4. L. Cieplinski, M. Kim, J.-R. Ohm, M. Pickering and A. Yamada, "Text of ISO/IEC 15938-3/FCD Information Technology - Multimedia Content Description Interface - Part 3 Visual", ISO/IEC JTC1/SC29/WG11/N4062, Mar. 2001.
  5. X. S. Hua, X. Chen, and H, J, Zhang, "Robust video signature based on ordinal measure," International Conference on Image Processing, 2004.
  6. C. Kim and B. Vasudev, "Spatiotemporal sequence matching for efficient video copy detection," IEEE Trans. Circuits Syst. Video Technol., Vol. 15, No. 1, pp. 127-132, Jan. 2005. https://doi.org/10.1109/TCSVT.2004.836751
  7. C. W. Ngo, T. C. Pong, and R. T. "Video partitioning by temporal slice coherency." IEEE Trans. on Circuits and Systems for Video Technology, Vol. 11, No. 8, Aug 2001.
  8. TF. Smith, MS. Waterman, "Identification of Common Molecular Subsequences," Journal of Molecular Biology, Vol. 147, No. 1, pp. 195-197, 1981 https://doi.org/10.1016/0022-2836(81)90087-5