DOI QR코드

DOI QR Code

Segmentation and Contents Classification of Document Images Using Local Entropy and Texture-based PCA Algorithm

지역적 엔트로피와 텍스처의 주성분 분석을 이용한 문서영상의 분할 및 구성요소 분류

  • Published : 2009.10.31

Abstract

A new algorithm in order to classify various contents in the image documents, such as text, figure, graph, table, etc. is proposed in this paper by classifying contents using texture-based PCA, and by segmenting document images using local entropy-based histogram. Local entropy and histogram made the binarization of image document not only robust to various transformation and noise, but also easy and less time-consuming. And texture-based PCA algorithm for each segmented region was taken notice of each content in the image documents having different texture information. Through this, it was not necessary to establish any pre-defined structural information, and advantages were found from the fact of fast and efficient classification. The result demonstrated that the proposed method had shown better performances of segmentation and classification for various images, and is also found superior to previous methods by its efficiency.

본 논문은 지역적 엔트로피 기반의 히스토그램을 이용한 문서영상의 분할과 텍스처 기반의 주성분 분석을 이용한 구성요소인 글자, 그림, 그래프 등의 구성요소 분류방안을 제안한다. 지역적 엔트로피와 히스토그램을 이용함으로써 문서영상의 다양한 변형이나 잡음에 강건하며 빠르고 손쉬운 이진화가 가능하다. 그리고 문서영상 내 존재하는 구성요소들이 각기 다른 텍스처 정보를 가지고 있다는 것에 착안하여 각 분할 영역의 텍스처 정보를 기반으로 주성분분석을 수행하였으며 이를 통해 사전에 구성요소들에 대한 구조정보를 설정할 필요가 없다는 장점을 가진다. 실험결과에서 다양한 문서영상의 분할 및 분류결과를 보였으며, 기존 방법보다 우수한 성능을 가져 그 유효함을 보였다.

Keywords

References

  1. J. Toyouda, Y. Noguchi and Y. Nishimura, "Study of Extracting Japanese Newspaper Article," Proc. 6th Int'l conf. Pattern Recognition, pp.744-747, 1998.
  2. A.K Jain. B. Yu, "Document Representation and Its Application to Page Decomposition," IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol.29, No.3, pp.294-308, 1998. https://doi.org/10.1109/34.667886
  3. X. Hao, J.T.L. Wang and P.A. Ng, "Nested Segmentation : An Approach for layout Analysis in Document Classification." Proc. 2nd Int. conf. Document Analysis and Recognition, pp.319-322, 1993. https://doi.org/10.1109/ICDAR.1993.395723
  4. 박동열, "Coarse/fine 전략을 이용한 문서영상의 구조 분석에 관한 연구," 전남대학교 대학원 전산통계학과 학위논문, 2001.
  5. 곽희규, "문서영상의 단어 단위 분할 및 단어 영상의 속성 추출에 관한 연구," 전남대학교 대학원 전산통계학과 학위논문, 2001.
  6. F. M. Wahi K. Y. Wong, and R. G. Casey, "Block segmentation and text extraction in mixed text/image documents," Computer Graphics and Image Processing, Vol.22, pp.375-390, Feb., 1982.
  7. P.D Wasserman, "Neural Computing," Van Nostrand Reinhold, New York, 1989.
  8. S. Imade, S. Tatsuta. and T. Wada, "Segmentation and classification for text/image documents using neural network," Proc. of the Second International Conference on Document Analysis and Recognition, Tsukuba, Japan. pp.930-934, Oct., 1993.
  9. S. B. Park, J. W. Lee, S. K. Kim, "Content-based image classification using a neural network," Pattern Recognition Letter 25, pp.287-300, 2004. https://doi.org/10.1016/j.patrec.2003.10.015
  10. Han Wang, Stan Z Li, S Ragupathi, "A fast and robust approach for document segmentation and classification," MVA'96, pp.333-336, Nov., 1996.
  11. Laura Caponetti, Ciro Castiello, Przemyslaw Gorechki, "Document page segmentation using neuro-fuzzy approach," Applied Soft Computing, Vol.8, pp.118-126, 2008. https://doi.org/10.1016/j.asoc.2006.11.008
  12. Zheru Chi, Qing Wang, Wan-Chi Siu, "Hierarchical content classification and script determination for automatic document image processing," Pattern Recognition, Vol.36, pp.2483-2500, 2003. https://doi.org/10.1016/S0031-3203(03)00128-6
  13. M-W Lin, J-R Tapamo, B Ndovie, "A texture-based method for document segmentation and classification," ARIMA/SACJ, Vol.36, pp.49-56, 2006.
  14. N. Otsu, "A threshold selection method from gray level histograms," IEEE Trans. on Syst. Man Cybern. Vol.9, No.1, pp.62-66, 1979 https://doi.org/10.1109/TSMC.1979.4310076
  15. 박상철, 김수형, "투영 프로파일의 간략화 방법을 이용한 인쇄 체 한글 문서 영상에서의 문자 분할", 정보처리학회 논문지B, Vol.13, No.2, pp.89-96, 2006. https://doi.org/10.3745/KIPSTB.2006.13B.2.089
  16. 김병기, "연결요소와 색상정보를 이용한 실제적 문서영상 분 할", 정보처리학회 논문지, Vol.7, No.1, pp.273-285, 2000.