DOI QR코드

DOI QR Code

Supervised Rank Normalization for Support Vector Machines

SVM을 위한 교사 랭크 정규화

  • Received : 2013.10.03
  • Accepted : 2013.11.11
  • Published : 2013.11.29

Abstract

Feature normalization as a pre-processing step has been widely used in classification problems to reduce the effect of different scale in each feature dimension and error as a result. Most of the existing methods, however, assume some distribution function on feature distribution. Even worse, existing methods do not use the labels of data points and, as a result, do not guarantee the optimality of the normalization results in classification. In this paper, proposed is a supervised rank normalization which combines rank normalization and a supervised learning technique. The proposed method does not assume any feature distribution like rank normalization and uses class labels of nearest neighbors in classification to reduce error. SVM, in particular, tries to draw a decision boundary in the middle of class overlapping zone, the reduction of data density in that area helps SVM to find a decision boundary reducing generalized error. All the things mentioned above can be verified through experimental results.

특징 정규화는 인식기를 적용하기 이전의 전처리 단계로 특징의 스케일에 따른 오류를 줄이기 위해 널리 사용되고 있다. 하지만 기존 정규화 방법은 특징의 분포를 가정하는 경우가 많으며, 클래스 라벨을 고려하지 않으므로 정규화 결과가 인식률에서 최적임을 보장하지 못하는 문제점이 있다. 이 논문에서는 특징의 분포를 가정하지 않는 랭크 정규화 방법과 클래스 라벨을 사용하는 교사 학습법을 결합한 교사 랭크 정규화 방법을 제안하였다. 제안하는 방법은 데이터의 분포를 바탕으로 특징의 분포를 자동으로 추정하므로 특징의 분포를 가정하지 않으며, 데이터 포인트의 최근접 이웃이 가지는 클래스 라벨을 바탕으로 정규화를 시행하므로 오류의 발생을 최소화할 수 있다. 특히 SVM의 경우 서로 다른 클래스에 속하는 데이터 포인트들이 혼재되어 나타나는 영역에 경계선을 설정하므로 이 영역의 밀도를 줄임으로써 경계선 설정을 보다 용이하게 하고 결과적으로 일반화 오류를 감소시킬 수 있다. 이러한 사실들은 실험 결과를 통해 확인할 수 있다.

Keywords

References

  1. Vladimir Vapnik, Statistical Learning Theory, John Wiley & Sons, New York, 1998.
  2. Ingo Steinwart, Andreas Christmann, "Support Vector Machines," Springer, 2008.
  3. Ashis Pradhan, "Support Vector Machine - A Survey," International Journal of Emerging Technology and Advanced Engineering, Vol. 2, No. 8, pp. 82-85, Aug. 2012.
  4. Selim Aksoy, Robert M. Haralick, "Feature normalization and likelihood-based similarity measures for image retrieval," Pattern Recognition Letters, Vol. 22, No. 5, pp. 563-582, Apr. 2001. https://doi.org/10.1016/S0167-8655(00)00112-4
  5. Keinosuke Fukunaga, Introduction to Statistical Pattern Recognition, 2nd edition, SanDiego, AcademicPress, 1990
  6. Rafeel C. Gonzalez, Richard E. Woods, Steven L. Eddins, "Digital Image Processing using MATLAB," McGraw Hill, 2011.
  7. Andreas Stolcke, Sachin Kajarekar, and Luciana Ferrer, "Nonparametric Feature Normalization for SVM-based Speaker Verification," Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing, Las Vegas NV, pp. 1577-1580, March 2008.

Cited by

  1. 학습 샘플 선택을 이용한 교사 랭크 정규화 vol.20, pp.1, 2013, https://doi.org/10.9708/jksci.2015.20.1.021