DOI QR코드

DOI QR Code

Microarray data analysis using relative hierarchical clustering

상대적 계층적 군집 방법을 이용한 마이크로어레이 자료의 군집분석

  • Received : 2014.05.30
  • Accepted : 2014.08.02
  • Published : 2014.09.30

Abstract

Hierarchical clustering analysis helps easily exploring massive microarray data and understanding biological phenomena with dendrogram. But, because hierarchical clustering algorithms only consider the absolute similarity, it is difficult to illustrate a relative dissimilarity, which consider not only the distance between a pair of clusters, but also how distant are they from the rest of the clusters. In this study, we introduced the relative hierarchical clustering method proposed by Mollineda and Vidal (2000) and compared hierarchical clustering method and relative hierarchical method using the simulated data and the real data in the various situations. The evaluation of the quality of two hierarchical methods was performed using percentage of incorrectly grouped points (PIGP), homogeneity and separation.

계층적 군집 분석은 분석 결과를 덴드로그램으로 쉽게 표시할 수 있어서 방대한 양의 마이크로어레이 자료를 탐색하기에 유용하며, 군집된 결과를 이용하여 생물학적 현상을 이해하는데 도움을 준다. 하지만, 계층적 군집방법은 두 군집간의 절대값 거리만을 고려하여 병합하기 때문에 군집 간의 상대적 비유사성은 설명하지 못하는 단점이 있다. 본 연구에서는 상대적 계층적 군집 방법을 소개하고, 마이크로어레이 자료와 같이 다양한 군집의 모양을 가진 모의실험 자료들과 실제 마이크로어레이 자료를 사용하여 상대적 계층적 군집방법과 기존의 계층적 군집 방법을 비교하였다. 두 계층적 군집 방법의 질적 평가는 오분류율, 동질성, 이질성 지표를 이용하여 수행하였다.

Keywords

References

  1. Ben-Dor, A., Shamir, R. and Yakhini, Z. (1999). Clustering gene expression patterns. Journal of Computational Biology, 6, 281-297. https://doi.org/10.1089/106652799318274
  2. Chen, G., Jaradat S. A., Banerjee, N., Tanaka T. S., Ko M. S. H. and Zhang, M. Q. (2002) Evaluation and comparison of clustering algorithms in analyzing ES cell gene expression data. Statistica Sinica, 12, 241-262.
  3. Datta, S. and Datta, S. (2003). Comparisons and validation of statistical clustering techniques for microarray gene expression data. Bioinformatics, 19, 459-466. https://doi.org/10.1093/bioinformatics/btg025
  4. Eisen, M. B., Spellman, P. T., Brown, P. O. and Botstein, D. (1998). Cluster analysis and display of genome-wide expression patterns. Proceedings of the National Academy of Sciences, 95, 14863-14868. https://doi.org/10.1073/pnas.95.25.14863
  5. Hartigan, J. A. (1975). Clustering algorithms, Wiley, New York.
  6. Lance, G. N. and Williams W. T. (1967). A General theory of classificatory sorting strategies: 1. Hierarchical system. Computer Journal, 9, 373-380. https://doi.org/10.1093/comjnl/9.4.373
  7. Lee, S. H. and Lee, K. H. (2012). Detecting survival related gene sets in microarray analysis. Journal of the Korean Data & Information Science Society, 23, 1-11. https://doi.org/10.7465/jkdi.2012.23.1.001
  8. Lim, J. S. and Lim, D. H. (2012). Comparison of clustering methods of microarray gene expression data. Journal of the Korean Data & Information Science Society, 23, 39-51. https://doi.org/10.7465/jkdi.2012.23.1.039
  9. Mollineda, R. A. and Vidal E. (2000). Pattern recognition and applications, IOS Press, Amsterdam.
  10. Rohlf, F. J. (1973). Hierarchical clustering using the minimum panning tree. Computer Journal, 16, 93-95.
  11. Speed, T. (2003). Statistical analysis of gene expression microarray data, CRC Press, Boca Raton, Florida.
  12. Yeo, I. (2011). Clustering analysis of Korea's meteorological data. Journal of the Korean Data & Information Science Society, 22, 941-949

Cited by

  1. A spectrum based evaluation algorithm for micro scale weather analysis module with application to time series cluster analysis vol.26, pp.1, 2015, https://doi.org/10.7465/jkdi.2015.26.1.41
  2. A study on the ordering of similarity measures with negative matches vol.26, pp.1, 2015, https://doi.org/10.7465/jkdi.2015.26.1.89
  3. Cluster analysis for Seoul apartment price using symbolic data vol.26, pp.6, 2015, https://doi.org/10.7465/jkdi.2015.26.6.1239
  4. 통일 한국의 징병제와 모병제 하의 병력규모에 관한 연구 vol.28, pp.6, 2017, https://doi.org/10.7465/jkdi.2017.28.6.1521
  5. 계층적 군집분석(최단, 최장, 평균, 중앙연결)방법에 의한 아시아 컨테이너 항만의 클러스터링 측정 및 실루엣방법과 2단계(Type II) 교차효율성 메트릭스 군집모형을 이용한 실증적 검증에 관한 연구 vol.37, pp.1, 2014, https://doi.org/10.38121/kpea.2021.03.37.1.31