DOI QR코드

DOI QR Code

The Effectiveness of High-level Text Features in SOM-based Web Image Clustering

SOM 기반 웹 이미지 분류에서 고수준 텍스트 특징들의 효과

  • 조수선 (국립충주대학교 컴퓨터과학과)
  • Published : 2006.04.01

Abstract

In this paper, we propose an approach to increase the power of clustering Web images by using high-level semantic features from text information relevant to Web images as well as low-level visual features of image itself. These high-level text features can be obtained from image URLs and file names, page titles, hyperlinks, and surrounding text. As a clustering engine, self-organizing map (SOM) proposed by Kohonen is used. In the SOM-based clustering using high-level text features and low-level visual features, the 200 images from 10 categories are divided in some suitable clusters effectively. For the evaluation of clustering powers, we propose simple but novel measures indicating the degrees of scattering images from the same category, and degrees of accumulation of the same category images. From the experiment results, we find that the high-level text features are more useful in SOM-based Web image clustering.

본 논문에서는 웹 이미지의 분류 효과를 높이기 위해 이미지 자체에서 추출된 저수준의 비주얼 특징뿐만 아니라 이미지와 관련된 텍스트 정보로부터 나온 고수준 시맨틱 특징들을 이용하는 분류 방법을 제안한다. 이 고수준의 텍스트 특징들은 이미지 URL, 파일명, 페이지 타이틀, 하이퍼링크 및 이미지 주변 텍스트로부터 얻어진다. 분류 엔진으로는 Kohonen의 SOM(Self Organizing Map)을 사용한다. 고수준의 텍스트 특징들과 저수준의 비주얼 특징들을 동시에 사용하는 SOM 기반의 이미지 분류에서는 10개의 카테고리로부터 수집된 200개의 테스트 이미지들이 사용되었다. 분류 성능을 평가하기 위해 간단하면서도 새로운 두 가지 척도, 즉 동일 카테고리 이미지들의 산포 정도와 집적 정도를 나타내는 각각의 척도를 정의하고 사용하였다. 실험결과, SOM기반의 웹 이미지 분류에서는 고수준의 텍스트 특징들이 보다 유용한 것임이 밝혀졌다.

Keywords

References

  1. D. Arotaritei and S. Mitra, 'Web mining: a survey in the fuzzy framework, ' Fuzzy Sets and Systems, Vol.148, pp.5-19, 2004 https://doi.org/10.1016/j.fss.2004.03.003
  2. N. Gudivada and V. Ragahavan 'Content-based image retrieval systems,'IEEE Computer, Vol.28, No.9, pp.18-22,1995 https://doi.org/10.1109/2.410145
  3. Y. Rui, T. Huang and S. Chang, 'Image retrieval: current techniques, promising directions and open issues, ' Journal of Visual Communication and Image Representation, Vol.10, No.4, pp.39-62, 1999 https://doi.org/10.1006/jvci.1999.0413
  4. A.W.M. Smeulders, M. Worring, S. Santini, A.Gupta and R. Jain, 'Content-based image retrieval at the end of the early years,' IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.22, pp.1349-1379, 2000 https://doi.org/10.1109/34.895972
  5. Z. Chen, L. Wenyne, F. Zhang, M. Li and H. Zhang, 'Web Mining for Web Image Retrieval,' Journal of the American Society for Information Science and Technology, Vol.52, No. 10, pp.831-839, 2001 https://doi.org/10.1002/asi.1132.abs
  6. Y.Lu, C. Hu,X. Zhu,H. Zhang and Q. Yang,'A unified framework for semantics and feature based relevance feedback in image retrieval systems,' In proceedings of the 8th ACM international Conference on Multimedia, pp.31 - 38, 2000 https://doi.org/10.1145/354384.354403
  7. T. Kohonen, 'Self-Organizing Maps', New York: SpringerVerlag, 1997
  8. S.W.K. Chan and M.W.C. Chong, 'Unsupervised clustering for nontextual web document classification,' Decision Support Systems, Vol.37, pp.377-396, 2004 https://doi.org/10.1016/S0167-9236(03)00035-6
  9. J. Laaksonen, M. Koskela, S. Laakso and E. Oja, 'PicSOM-content-based image retrieval with self-organizing maps,'Pattern Recognition Letters, Vol.21, pp.1199-1207, 2000 https://doi.org/10.1016/S0167-8655(00)00082-9
  10. J. Laaksonen, M. Koskela, S. Laakso and E. Oja, 'Self-organizing maps as a relevance feedback technique in content-based image retrieval,' Pattern analysis & Applications, Vol.4, pp.140-152, 2001 https://doi.org/10.1007/PL00014575
  11. J. Laaksonen, M. Koskela and E. Oja, 'PicSOM-Self-organizing image retrieval with MPEG-7 content descriptions,' IEEE Transactions on Neural Networks, Special Issue on Intelligent Multimedia Processing, Vol.13, pp.841-853, 2002 https://doi.org/10.1109/TNN.2002.1021885
  12. S. E. Umbaugh, Y. Wei, and M. Zuke, 'Feature Extraction in Image Analysis,' IEEE Engineering in Medicine and Biology, Vol.16, pp.62-73, 1997 https://doi.org/10.1109/51.603650
  13. T. Chang and C.-C.J. Kuo, 'Texture analysis and classification with tree-structured wavelet transform,' IEEE Tr. IP, Vol.2, pp.429-441, 1993 https://doi.org/10.1109/83.242353
  14. G. Salton, 'Automatic Text Processing', Addison-Wesley, pp.279-281, 1989