DOI QR코드

DOI QR Code

Non-parametric approach for the grouped dissimilarities using the multidimensional scaling and analysis of distance

다차원척도법과 거리분석을 활용한 그룹화된 비유사성에 대한 비모수적 접근법

  • Received : 2017.05.08
  • Accepted : 2017.07.02
  • Published : 2017.08.31

Abstract

Grouped multivariate data can be tested for differences between two or more groups using multivariate analysis of variance (MANOVA). However, this method cannot be used if several assumptions of MANOVA are violated. In this case, multidimensional scaling (MDS) and analysis of distance (AOD) can be applied to grouped dissimilarities based on the various distances. A permutation test is a non-parametric method that can also be used to test differences between groups. MDS is used to calculate the coordinates of observations from dissimilarities and AOD is useful for finding group structure using the coordinates. In particular, AOD is mathematically associated with MANOVA if using the Euclidean distance when computing dissimilarities. In this paper, we study the between and within group structure by applying MDS and AOD to the grouped dissimilarities. In addition, we propose a new test statistic using the group structure for the permutation test. Finally, we investigate the relationship between AOD and MANOVA from dissimilarities based on the Euclidean distance.

일반적으로 그룹화된 다변량자료는 다변량 분산분석(multivariate analysis of variance; MANOVA)을 사용하여 그룹 간 차이를 검정할 수 있다. 그러나 만약 다변량 분산분석의 기본적인 가정이 위배되면 이 방법은 적절하지 못하다. 이 경우 다양한 거리로부터 그룹화된 비유사성을 계산한 후 다차원척도법(multidimensional scaling; MDS), 거리분석(analysis of distance; AOD) 그리고 비모수적 기법인 순열검정(permutation test)을 적용하여 문제를 해결할 수 있다. 다차원척도법은 비유사성으로부터 개체들의 좌표를 계산해주며 거리분석은 이 좌표를 활용하여 그룹구조를 파악하는데 유용하다. 특히 비유사성의 측도로 유클리드 거리를 사용하면 거리분석은 다변량 분산분석과 수리적으로 매우 밀접한 연관관계를 맺는다. 따라서 본 연구에서는 그룹화된 비유사성에 다차원척도법과 거리분석을 적용하여 그룹 내와 그룹 간의 구조를 파악하고 순열검정을 위한 새로운 검정통계량을 제안하려 한다. 덧붙여 유클리드 거리를 활용한 비유사성을 통해 거리분석과 다변량 분산분석과의 수리적 연관성을 고찰하고자 한다.

Keywords

References

  1. Choi, Y. S. (2014). Walk in Multidimensional Scaling, Free Academy, Kyungki.
  2. Clarke, K. R. (1993). Non-parametric multivariate analyses of changes in community structure, Australian Journal of Ecology, 18, 117-143. https://doi.org/10.1111/j.1442-9993.1993.tb00438.x
  3. Cox, T. F. and Cox, M. A. A. (2001). Multidimensional Scaling, Chapman & Hall/CRC, London.
  4. Gower, J. C. and Krzanowski, W. J. (1999). Analysis of distance for structured multivariate data and extensions to multivariate analysis of variance, Journal of the Royal Statistical Society, Series C (Applied Statistics), 48, 505-519. https://doi.org/10.1111/1467-9876.00168
  5. Johnson, R. A. and Wichern, D. W. (2007). Applied Multivariate Statistical Analysis, Prentice Hall, New Jersey.
  6. Kruskal, J. B. and Wish, M. (1978). Multidimensional Scaling, Sage University Paper Series on Quantitative Applications in the Social Sciences, 07-011, Sage Publications, Beverly Hills and London.
  7. Manly, B. F. J. (2007). Randomization, Bootstrap and Monte Carlo Methods in Biology, Chapman & Hall/CRC, London.
  8. Torgerson, W. S. (1958). Theory and Methods of Scaling, Wiley, New York.