Analysis of Gene Expression Data Using Gath-Geva Algorithm

Gath-Geva 알고리즘을 이용한 유전자 발현 데이터의 분석

  • 박한샘 (연세대학교 컴퓨터과학과) ;
  • 유시호 (연세대학교 컴퓨터과학) ;
  • 조성배 (연세대학교 컴퓨터과학과)
  • Published : 2004.04.01

Abstract

다량의 유전자 발현 정보를 담고 있는 DNA 마이크로어레이 기술의 발달로 인해 대량의 생물정보를 한번의 실험을 통해 분석할 수 있게 되었다. 유전자 발현 데이터를 분석하는 방법 중 하나인 클러스터링은 비슷한 기능을 가진 유전자들을 그룹별로 묶어서 그룹 레의 유전자들의 기능을 밝히거나 미지의 유전자를 분석하는데 이용되고 있다 본 논문에서는 유전자 발현 데이터를 클러스터링 하여 그로부터 유전 정보를 찾아내기 위한 방법으로 GG (Gath-Geva) 알고리즘을 제시한다. 퍼지 클러스터링 알고리즘중 하나인 GG 알고리즘은 대표적인 퍼지 클러스터링 방법인 퍼지 c-means 와 GK (Gustafson-Kessel) 알고리즘을 개선한 것으로. 차원이 크고 분포가 애매하여 클러스터링이 어려운 유전자 발현 데이터의 클러스터링에 적합한 알고리즘이다. 혈청(Serum) 유전자 데이터와 효모(Yeast) 세포주기 데이터를 CG 알고리즘 이용해 클러스터링 해 보고, 그 결과를 퍼지 c-means 알고리즘, GK알고리즘과 비교해 본 결과, GG 알고리즘이 유전자 발현 데이터의 클러스터링에 더 적합함을 확인하였다.

Keywords