DOI QR코드

DOI QR Code

Chlorophyll-a Forcasting using PLS Based c-Fuzzy Model Tree

PLS기반 c-퍼지 모델트리를 이용한 클로로필-a 농도 예측

  • 이대종 (충북대학교 BK21 충북정보기술사업단) ;
  • 박상영 (한국 수자원 공사 수자원연구원) ;
  • 정남정 (한국 수자원 공사 수자원연구원) ;
  • 이혜근 (한국 수자원 공사 수자원연구원) ;
  • 박진일 (충북대학교 전기전자컴퓨터 공학부) ;
  • 전명근 (충북대학교 전기전자컴퓨터 공학부)
  • Published : 2006.12.25

Abstract

This paper proposes a c-fuzzy model tree using partial least square method to predict the Chlorophyll-a concentration in each zone. First, cluster centers are calculated by fuzzy clustering method using all input and output attributes. And then, each internal node is produced according to fuzzy membership values between centers and input attributes. Linear models are constructed by partial least square method considering input-output pairs remained in each internal node. The expansion of internal node is determined by comparing errors calculated in parent node with ones in child node, respectively. On the other hands, prediction is performed with a linear model haying the highest fuzzy membership value between input attributes and cluster centers in leaf nodes. To show the effectiveness of the proposed method, we have applied our method to water quality data set measured at several stations. Under various experiments, our proposed method shows better performance than conventional least square based model tree method.

본 논문에서는 부분최소법 (PLS: Partial least square)과 c-퍼지 모델트리를 적용하여 클로로필-a 농도의 예측 모델을 제안한다. 제안된 방법은 모든 입력속성을 고려하여 퍼지 클러스터에 의해 계산된 중심벡터를 설정한 후, 각각의 중심벡터들과 입력속성간의 소속도를 이용하여 내부 노드를 형성하고, 형성된 내부노드에서 PLS를 적용하여 지역모델(Local model)을 구축한다. 노드의 분리기준으로서 부모노드(patent node)에서 구축된 모델에서 계산된 에러값이 자식노드(child node)에서 계산된 에러값보다 클 경우에 분기가 이루어진다. 최종 단계에서는 임의의 입력데이터와 잎노드에서 계산된 클러스터 중심값과 비교하여 소속도가 높은 클러스터에 속한 지역모델을 선택하여 출력값을 예측한다. 제안된 방법의 우수성을 보이기 위해 수질 데이터를 대상으로 실험한 결과 기존의 모델트리 방식에 비하여 향상된 성능을 보임을 알 수 있었다.

Keywords

References

  1. 김좌관, 1995, 수질오염개론, 동화기술, pp.154-178
  2. 김미숙, 정영륜, 서의훈, 송원섭, '낙동강 부영양화와 수질환경요인의 통계적 분석', Algae, Vol.17(1), pp. 105-115, 2002 https://doi.org/10.4490/ALGAE.2002.17.2.105
  3. 김호섭, 황순진, '육수학적 특성에 따른 국내 수지의 부영양화 유형분석-엽록소 a와 수심을 중심으로', orean J. Lomnol., Vol. 37(2), pp.213-226, 2004
  4. Robert G.Wetzel, Limnology-lake and river ecosystems, third edition, Elsevier academic press, 2001
  5. Quinlan J.R. 'Learning with continuous classes' in Proceedings AI'92, Adams & Sterling (Eds.), World Scientific, pp. 343-348, 1992
  6. Wang Y., Witten I.H., 'Inducing Model Trees for Continuous Classes', in Poster Paper of the 9th European Conference on Machine Learning (ECML 97)., M. van Someren, & G. Widmer (Eds.), Prague, Czech Republic, pp. 128-137, 1997
  7. 이대종, 박진일, 박상영, 정남정, 전명근, '클러스터 기반 퍼지 모델트리를 이용한 데이터 모델링', 한국 퍼지 및 지능시스템 학회 2006, Vol. 16, pp. 493-500, No. 5, 2006 https://doi.org/10.5391/JKIIS.2006.16.4.493
  8. Rasmus Bro, Age. K. Smide, Sijmen de Jong, 'On the difference between low-rank and subspace approximation: improved model for multi-linear PLS regression', Chemometics and Intelligent Laboratory Systems, Vol. 58, pp. 3-13, 2001 https://doi.org/10.1016/S0169-7439(01)00134-4
  9. Y.P. Zhou, J.H. Jiang, W.Q. Lin, L. Xu, H.L. Wu, G.L. Yu, 'Artificial neural network-based partial least-square regression with application to QSAR studies', Talanta, 2006, not printed, available online at www.sciencedirect.com
  10. Y. Tian, L. Shi, W. Tong, G.T. Gene Hwang, C. Wang, 'Multi-class tumor classification by discriminant partial least squares using microarray gene expression data and assesment of classification models', Computational Biology and Chemistry, Vol. 28, pp. 235-244, 2005 https://doi.org/10.1016/j.compbiolchem.2004.05.002
  11. C. A. Andersson and R. Bro, 'The N-way Toolbox for MATLAB', Chemometrics and Intelligent Laboratory Systems, Vol. 52, pp. 1-4, 2000 https://doi.org/10.1016/S0169-7439(00)00071-X
  12. Ian H. Witten & Eibe Frank, DATA MININING-Practical machine learning tools and techniques, Morgan Kaufmann publisher, (2005)