DOI QR코드

DOI QR Code

Discrimination model of cultivation area of Corni Fructus using a GC-MS-Based metabolomics approach

GC-MS 기반 대사체학 기법을 이용한 산수유의 산지판별모델

  • Received : 2016.01.01
  • Accepted : 2016.02.07
  • Published : 2016.02.25

Abstract

It is believed that traditional Korean medicines can be managed more scientifically through the development of logical criteria to verify their region of cultivation, and that this could contribute to the advancement of the traditional herbal medicine industry. This study attempted to determine such criteria for Sansuyu. The volatile compounds were obtained from 20 samples of domestic Corni fructus (Sansuyu) and 45 samples of Chinese Sansuyu by steam distillation. The metabolites were identified in the NIST Mass Spectral Library via the obtained gas chromatography/mass spectrometer (GC/MS) data of 53 training samples. Data binning at 0.2 min intervals was performed to normalize the number of variables used in the statistical analysis. Multivariate statistical analyses, such as principle component analysis (PCA), partial least squares-discriminant analysis (PLS-DA), and orthogonal partial least squares-discriminant analysis (OPLS-DA) were performed using the SIMCA-P software package. Significant variables with a variable importance in the projection (VIP) score higher than 1.0 were obtained from OPLS-DA, and variables that resulted in a p-value of less than 0.05 through one-way ANOVA were selected to verify the marker compounds. Finally, among the 11 variables extracted, 1-ethylbutyl-hydroperoxide (9.089 min), nonadecane (20.170 min), butylated hydroxytoluene (25.319 min), 5β,7βH,10α-eudesm-11-en-1α-ol (25.921 min), 7,9-bis(2-methyl-2-propanyl)-1-oxaspiro[4.5]deca-6,9-diene-2,8-dione (34.257 min), and 2-decyldodecyl-benzene (54.717 min) were selected as markers to indicate the origin of Sansuyu. The statistical model developed was suitable for the determination of the geographical origin of Sansuyu. The cultivation areas of four Korean and eight Chinese Sansuyu samples were predicted via the established OPLS-DA model, and it was confirmed that 11 of the 12 samples were accurately classified.

생약의 원산지를 판별하는 논리적인 일련의 기준을 개발한다면, 현재 유통되는 한약을 좀 더 과학적으로 관리 할 수 있을 것이다. 이러한 노력은 전통적인 한약 산업 발전에 기여할 것이라고 사료된다. 산수유의 원산지 판별법을 개발하기 위해, 본 연구에서는 우선 국산 산수유와 중국산 산수유를 각각 수증기 증류하고 이 때 얻은 휘발성분을 GC/MS를 이용하여 분석하였다. NIST mass spectral library의 데이터베이스로부터 정성분석한 결과를 바탕으로 데이터를 범주화(binning)하여 변수를 얻고, 이에 대하여 PCA, OPLS-DA 등 다변량 통계 분석을 수행함으로써 신속, 정확하게 국산 산수유와 중국산 산수유의 산지를 판별할 수 있는 산지 판별모델을 확립하였다. 산지 판별모델 개발을 위해서 학습집합(n=53)을 분석하여 산지 판별모델을 수립한 후, 검증집합(n=12)을 산지 판별모델에 적용함으로써 그 타당성을 확인하였다. 더불어 1-ethylbutyl-hydroperoxide, nonadecane, butylated hydroxytoluene, 5β,7βH,10α-Eudesm-11-en-1α-ol, 7,9-bis (2-methyl-2-propanyl)-1-oxaspiro[4.5]deca-6,9-diene-2,8-dione, 그리고 2-decyldodecyl-benzene 등 6개의 마커성분을 선정할 수 있었다. 최근에 NMR을 활용한 산수유 원산지 판별에 대한 보고는 있었으나, GC/MS를 기반으로 한 대사체학 연구기법을 이용하여 산지판별 모델을 제시하는 것은 최초의 보고로서 그 의미가 크다. 본 연구결과를 활용하여 한약의 원산지 판별모델 확립과 산수유 원산지의 과학적인 관리에 적용할 수 있으리라 사료된다.

Keywords

1. 서 론

최근에 있었던 백수오 사건을 비롯하여 중국 등 외국의 값싼 약재를 국산 약재와 섞는 등 국산으로 둔갑시켜 판매하는 사례가 증가하고 있다. 이로 인해 재배농가의 경작기피와 일반인들의 한약에 대한 불신뿐 만 아니라 오남용으로 인한 부작용 발생의 위험이 대두되고 있다. 한약을 재배하는 지역의 환경적 요인은 대사물질의 다양성을 유도하여 그 치료효과를 나타내는데 결정적 역할을 할 수도 있기 때문에 그 원산지를 정확히 구별하는 것은 매우 중요하다.1,2 본 연구의 목적은 한약의 원산지를 과학적으로 검증할 수 있는 판별법의 개발을 통해서 보다 과학적인 원산지 관리로 한의약산업 발전에 기여하는 데 있다. 한편, 대사체학(metabolomics)은 nuclear magnetic resonance (NMR), gas chromatography/mass spectrometer (GC/MS), liquid chromatography/mass spectrometer (LC/MS), near infrared spectroscopy (NIR) 등 다양한 분석기기를 사용하여 생체 내에 존재하는 저분자 대사체를 광범위하게 분석하고, 다변량 통계 분석(multivariate data analysis)을 통하여 내인성 대사체의 변화를 연구하는 분야로, 신약 개발 및 평가, 질병의 조기진단 뿐만 아니라 농산물이나 생약 등의 원산지 판별 등 다양한 분야에서 응용되고 있다.3-8

GC/MS 분석은 mass spectra를 NIST library와 비교함으로써 물질 확인이 가능한 장점이 있다.9-12 대사체학 기법의 하나인 주성분 분석(principal component analysis, PCA)은 다변량 데이터가 갖고 있는 정보들을 최대한 확보하면서 서로 독립적이고 적은 수의 새로운 변수들을 생성하고 다차원의 자료를 2차원 또는 3차원의 주성분 공간으로 추출하는 통계기법이라고 할 수 있다. 회귀분석법(orthogonal partial least squares discriminant analysis, OPLS-DA)은 classification을 통해 집합이라는 종속변수를 부여하여 판별에 기여하는 각 데이터의 시각화를 극대화하고 실험군 간 차이가 있는 대사산물을 찾을 수 있게 도와주는 통계 기법으로서, 예측모델의 확립과 판별에 기여하는 변수 탐색에 가장 적합한 방법이다.13-15

본 연구에서는 국산 산수유와 중국산 산수유를 수증기 증류하여 얻은 휘발성분을 GC/MS를 이용하여 분석한 후, 그 결과에 대하여 PCA, OPLS-DA 등 다변량 통계 분석을 수행함으로써 신속, 정확하게 국산 산수유와 중국산 산수유의 산지를 판별할 수 있는 산지 판별모델을 확립하였다. 산지 판별모델 개발을 위해서 전체 시료를 학습집합(training set)과 검증집합(test set)으로 나누고 학습집합(n=53)으로 산지 판별모델을 수립한 후, 검증집합(n=12)을 통해 산지 판별모델의 타당성을 확인하였다. 최근에 NMR을 활용한 산수유 원산지 판별에 관한 보고는 있었으나, GC/MS를 기반으로 한 대사체학 연구기법을 이용하여 산지 판별 모델을 제시하는 것은 최초의 보고로서 그 의미가 크다.16 본 연구의 결과를 활용하여 한약의 원산지 판별모델 확립과 산수유 원산지의 과학적인 관리에 적용할 수 있으리라 판단되기에 보고하고자 한다.

 

2. 실험방법

2.1. 시험약재

산수유는 국산 20종과 중국산 45종을 사용하였으며, 국산은 중앙대학교 황완균 교수님, 중국산은 대전대학교 서영배 교수님께서 수집 제공해 주셨다. Table 1에 나타낸 바와 같이, 국산은 전남 구례군(Gurye), 경기 양평읍(Yangpyeong), 경기 이천(Icheon), 경북 문경시(Mungyeong), 경북 의성군(Uiseong)에서 총 20개를 수집하였고, 중국산은 사천성(Sichuan), 산서성(Shanxi), 섬서성(Shaanxi), 하남성(Henan) 지역에서 45개를 수집하였다. 이들 시료 중 판별모델의 확립을 위해 국산 16개, 중국산 37개의 시료를 학습집합(training set)으로 정하여 분석하였고, 모델의 검증을 목적으로 국산 4개와 중국산 8개의 시료를 검증 집합(test set)으로 사용하여 산지예측을 하였다. 진균오염이 확인된 시료는 제외하고 산지별 시료 10 g을 취해 세절 후, 분쇄하여 추출에 사용하였다(Table 1).

Table 1.Collected regions and the number of samples of Sansuyu in Korea and China

2.2. 정유성분의 추출 및 GC/MS 분석시료의 조제

각각의 시료로부터 정유성분을 추출하기 위해 대한 약전 생약시험법 중 정유 정량법에 사용되는 정유정량기와 환류냉각기를 사용하였다. 간략히 기술하면, 10 g의 시료에 250 ℃의 증류수를 넣고 100 ℃에서 6시간 동안 수증기증류(steam distillation) 한다. 증류물이 포집된 에텔(J.T. Baker, Philipsburg, NJ, USA) 분획에 무수 황산나트륨(Junsei, Tokyo, Japan)을 넣어 탈수한 후, 건조시켜 헥산(J.T. Baker, Philipsburg, NJ, USA)으로 용해하여 GC/MS 분석시료로 사용하였다.

2.3. 분석기기 및 조건

정유성분 분석을 위하여 Bruker GC-MS 320 (Bruker, Billerica, MA, USA)을 사용하였으며 컬럼은 HP-5MS (30 m × 0.25 mm, film thickness 250 ℃, Agilent, Santa Clara, CA, USA)를 사용하였다. 운반기체로 순도 99.999 % 헬륨가스를 유속 1.0 mL/min로 사용하였다. 주입구 온도는 250 ℃로 정하였고 분할 주입 (1:1) 방법을 사용하였으며, 컬럼 온도는 50 ℃에서 4 min간 유지시킨 후 5 ℃/min로 280 ℃까지 올리고 10 min간 유지하였다. 이온검출 방법은 스캔모드를 사용하여 EI (Electron Impact Ionization, 70.0 eV) 법으로 m/z값 50~500 범위를 조사하였다. 분석과정의 오차를 줄이기 위해, 시험시료의 분석 순서는 산지나 번호순으로 하지 않고 임의의 순서를 정하여 분석하였다.

2.4. 데이터 분석

GC/MS 분석을 통해 얻은 피크는 NIST mass spectral library의 데이터 베이스를 이용하여 일치율이 높고 MS fragment 양상이 유사한 물질로 동정하였다(National Institute of Standards and Technology, version 2008; NIST Mass spectrometry Data Center: Gaitherburg, MD, USA, 2008). 통계학적 분석을 위해 각 시료의 TIC로부터 나온 GC/MS 데이터(Time vs Intensity)를 ASC 파일로 변환하여 엑셀 파일(*.csv)로 저장하였다. 각 시료들 사이에 존재하는 실험오차를 보정하고 변수의 수를 줄이기 위해 GC/MS 데이터의 변수를 0.2 min 간격으로 더하는 데이터 범주화(binning)를 수행하였다. 예를 들면 4.00 min에서 4.19 min까지의 intenstity를 더하여 새로운 변수(variable)인 4.1을 만들었고, 이러한 방법으로 60 min까지 총 285개의 새로운 변수를 만들었다.

2.5. 다변량 통계분석

SIMCA-P, ver 11.0 software (Umetrics, Umea, Sweden, 경희대 장영표 교수 제공)를 이용해 chemometric method인 PCA, PLS-DA, OPLS-DA 분석을 수행하였다.

2.6. 원산지 판별 마커 대사체 탐색법

PLS-DA 분석을 통해 VIP (variable importance in the projection)를 얻어 유의성 있는 변수를 추출하였다. VIP는 두 집단이 나뉘었을 경우 변수들마다 기여한 정도의 차이를 나타내는데, 두 그룹을 구분하는데 가장 기여한 정도가 큰 변수들을 찾아내는데 사용되었다. 보통 VIP score가 1.0 이상인 변수들에 대하여 유의성이 있다고 보기 때문에 여러 가지 변수 중 VIP가 1.0 이상인 변수들을 선택하였다. 더욱 정확한 결과를 위해 표준편차는 1.0 미만인 것을 선택하였다. 통계프로그램인 SPSS 11.0 (SPSS Inc., Chicago, IL, USA)을 사용하여 one-way ANOVA를 통하여 p-value가 0.05 미만인 변수를 추출하였다.

 

3. 실험결과 및 고찰

3.1. 대사체의 분석 및 동정

Fig. 1의 (A)는 국산 산수유 시료의 대표적인 total ion chromatogram이며, (B)는 중국산 산수유 시료의 대표적인 total ion chromatogram을 나타낸 것이다. 화살표 및 숫자로 표기한 피크는 NIST mass spectra library를 이용하여 동정한 피크를 표시한 것이다. GC/MS 분석에 의해 얻어진 total ion chromatogram 및 MS fragment 양상을 NIST mass spectra library로부터 비교함으로써 대사체의 분석이 용이했다. 한편, 중국산과 국산 산수유 시료의 피크 신호세기와 양상이 매우 유사하여 육안으로는 확인할 수 없었다. 머무름 시간 (retention time) 43 min~47 min 사이의 강한 피크는 수증기증류 장치에 사용한 실리콘에서 유래한 것을 확인하였다(Fig. 1). Table 2와 Table 3에는 각각 Fig. 1과 Fig. 2에 검출된 국산과 중국산 산수유의 GC/MS 분석으로부터 예상되는 대사체를 NIST mass spectra library로부터 동정한 결과를 나타내었다(Table 2, 3).

Fig. 1.Total ion chromatograms of volatile constituents of (A) Korean Sansuyu extract, and (B) Chinese Sansuyu extracts obtained by GC/MS EI scan mode.

Table 2.The list of identified metabolites from Korean Sansuyu. NIST library-based putative identification of primary metabolites analyzed by GC/MS

Table 3.The list of identified metabolites from Chinese Sansuyu. NIST library-based putative identification of primary metabolites analyzed by GC/MS

Fig. 2.OPLS-DA score plots of volatile metabolites that identified by GC/MS. Sansuyu samples from Korea and China are represented with a ▲K, and ■C, respectively. OPLS-DA; Orthogonal Partial Least Squares Discriminant Analysis.

3.2. 다변량 통계분석을 통한 판별

PCA, PLS-DA, OPLS-DA 등의 다변량 통계분석법을 시도해 본 결과, PCA는 국산 산수유와 중국산 산수유 대부분이 중첩되어 모델 확립에는 적합하지 않았다(자료 미제시). PLS-DA에서도 PCA에서 보다는 약간 개선되었지만, 일부시료에서 중첩되어 역시 모델 확립에는 적합하지 않았다(자료 미제시). Fig. 2에 나타낸 바와 같이, OPLS-DA에서는 국산 산수유와 중국산 산수유의 모든 시료가 중첩되지 않고 잘 분리되었으며, 따라서 OPLS-DA를 이용하여 산수유의 산지 판별 모델을 확립하였다. 한편, PCA는 독립변수만을 이용하여 새로운 주성분을 구하고 그 주성분을 이용하여 회귀식을 구하는 반면, PLS는 독립변수뿐만 아니라 종속변수를 동시에 고려하여 새로운 변수를 찾고 이를 이용하여 회귀식을 구하므로 PCA보다는 PLS에서 더욱 개선된 결과를 얻을 수 있다. OPLS-DA는 분광학적 데이터와 데이터의 특정 성질, 예를 들면 어떤 그룹에 속하는지의 여부를 연관시키는 회기 분석법중의 하나로, 이 방법은 주관심 대상인 그룹간의 차이가 첫 번째 특이 벡터에 나타나도록 데이터 행렬을 회전시킴으로써 관찰값과 서로 다른 그룹간의 연관된 변이를 쉽게 알아낼 수 있다(Fig. 2).13,17

3.3. 원산지 판별 마커 대사체

국산 산수유와 중국산 산수유를 판별할 수 있는 마커 대사체를 검출하기 위해 OPLS-DA 분석으로부터 얻어진 VIP score가 1.0 이상으로 유의성이 있는 변수 (variable)를 고르고 더욱 정확한 결과를 위해 그 중에 표준오차가 1.0 미만인 것을 추출하였다(Fig. 3 참조). VIP plot은 두 그룹을 나뉘게 하는데 기여를 한 순서에 따라 분류된다. 그리고 one-way ANOVA를 통하여 p-value가 0.05 미만인 변수들을 추출한 결과, 변수 9.1(9.0-9.19 min), 20.1 (20.0-20.19 min), 25.3(25.20-25.39 min), 25.9(25.80-25.99 min), 26.1(26.0-26.19 min), 26.5(26.40-26.59 min) 28.3(28.20-28.39 min), 28.9(28.80-28.99 min), 30.7(30.60-30.79 min), 34.3(34.20-34.39 min), 54.7(54.60-54.79 min) 변수 등 유의성 있는 변수 11개가 선택되었다(Table 4 참조). Table 4에 나타낸 바와 같이, VIP와 SPSS를 통해 동시에 추출된 유의성 있는 변수들 중 GC/MS NIST 라이브러리 탐색을 통해 동정된 성분은 1-ethylbutyl-hydroperoxide, nonadecane, butylated hydroxytoluene, 5β,7βH,10α-Eudesm-11-en-1α-ol, 7,9-bis(2-methyl-2-propanyl)-1-oxaspiro[4.5]deca-6,9-diene-2,8-dione, 2-decyldodecyl-benzene으로 총 6가지의 마커 대사체를 얻을 수 있었다. Fig. 4에 이들 성분 중 NIST 라이브러리로부터 얻은 butylated hydroxytoluene, nonadecane, 7,9-bis(2-methyl-2-propanyl)-1-oxaspiro[4.5] deca-6,9-diene-2,8-dione의 질량스펙트럼을 나타내었다. Table 4에 나타낸 mass fragment 값과 일치함을 알 수 있다. 한편, Fig. 4의 C에 제시된 7,9-di-tert-butyl-1-oxaspiro (4,5)deca-6,9-diene-2,8-dione는 7,9-bis(2-methyl-2-propanyl)-1-oxaspiro[4.5]deca-6,9-diene-2,8-dione 와 동일 화합물이다.

Fig. 3.Plot of variable importance in the projection from the OPLS-DA of volatile metabolites that identified by GC/MS of Sansuyu. OPLS-DA; Orthogonal Partial Least Squares Discriminant Analysis.

Table 4.The list of marker metabolites to discriminate between Korean and Chinese origins

Fig. 4.EI-mass spectra of representative marker metabolites. (A) Butylated hydroxytoluene, (B) Nonadecane, (C) 7,9-Bis(2-methyl-2-propanyl)-1-oxaspiro[4.5]deca-6,9-diene-2,8-dione were identified from NIST mass spectral library.

3.4. 검증집합 테스트

이상과 같이 확립한 국산 산수유와 중국산 산수유의 OPLS-DA 판별모델의 정확도를 검증하고자 미지 시료의 분석값을 적용하였다. 이미 산지를 알고 있는 시료인 국산 4개와 중국산 8개를 검증집합으로 정하여 수증기 증류로 얻은 휘발성 분획을 GC/MS로 분석하였다. 이 때 분석 순서는 무작위로 정하여 수행하였다. 그 결과, Fig. 5의 2D score scatter plot에서 보는 바와 같이 총 12개 가운데 C25 시료를 제외한 11개의 시료가 정분류 되었으며 정확도는 92 %이었다(Fig. 4). 한편, GC/MS 분석에 비하여 동정할 수 있는 화합물이 상이한 차이점이 있지만, NMR을 이용하여 당, 아미노산 등을 동정하고 이를 다변량 통계분석법을 이용해 산수유의 산지판별 모델을 제시한 경우에도 유의성 있는 결과가 보고되었다.16

Fig. 5.Predicted score scatter plot of blind samples of Sansuyu on OPLS-DA model. Sansuyu samples from Korea are represented with a ▲K, samples China from with ▲C. OPLS-DA; Orthogonal Partial Least Squares Discriminant Analysis.

 

4. 결 론

이상의 결과를 종합해 보면, 16개의 국산 산수유와 37개의 중국산 시료를 학습집합(training set)으로 정하여 GC/MS 분석을 기반으로 대사체학 기법을 사용하여 산수유의 원산지 판별모델을 확립하였고, 모델의 검증을 목적으로 4개의 국산 산수유와 8개의 중국산시료를 검증집합(test set)으로 사용하여 산지예측을 검증한 결과, 92 %가 정분류됨을 확인하였다. 본 연구 결과를 활용하여 국산 산수유와 중국산 산수유의 과학적인 관리에 적용할 수 있을 것이며, 나아가 다른 한약의 원산지 판별모델을 확립하는데도 기여할 것으로 사료된다. 또한 이러한 대사체학 연구에 의해 한약의 과학적 관리가 용이해짐으로써 한약발전에도 크게 기여할 것이다.

References

  1. H. W. Lee, J. H. Choi, S. Y. Park, B. K. Choo, J. M. Chun, A. Y. Lee and H. K. Kim, Korean J. Med. Crop Sci., 16, 168-172 (2008).
  2. A. Zhang, H. Sun, Z. Wang, W. Sun, P. Wang and X. Wang, Planta Med.., 76, 2026-2035 (2010). https://doi.org/10.1055/s-0030-1250542
  3. O. Fiehn, Plant Mol. Biol., 48, 155-171 (2002). https://doi.org/10.1023/A:1013713905833
  4. J. C. Lindon, E. Holmes and J. K. Nicholson, FEBS J., 274, 1140-51 (2007). https://doi.org/10.1111/j.1742-4658.2007.05673.x
  5. V. Arbona, D. J. Iglesias, M. Talon and A. Gomez-Cadenas, J. Agric. Food Chem.., 57, 7338-7347 (2009). https://doi.org/10.1021/jf9009137
  6. W. M. Claudino, P. H. Goncalves, A. di Leo, P. A. Philip and F. Sarkar, Crit. Rev. Oncol. Hematol., 84, 1-7 (2012). https://doi.org/10.1016/j.critrevonc.2012.02.009
  7. S. O. Yang, S. W. Lee, Y. O. Kim, S. W. Lee, N. H. Kim, H. K. Choi, J. Y. Jung, D. H. Lee and Y. S. Shin, Korean J. Med. Crop Sci., 22, 17-22 (2014). https://doi.org/10.7783/KJMCS.2014.22.1.17
  8. R. C. H. De Vos, S. Moco, A. Lommen, J. J. B. Keurentjes, R. J. Bino and R. D. Hall, Nat. Protoc., 2, 778-791 (2007). https://doi.org/10.1038/nprot.2007.95
  9. H. Kanani, J. Chromatogr. B., 871, 191-201 (2008). https://doi.org/10.1016/j.jchromb.2008.04.049
  10. A. Kende, D. Portwood, A. Senior, M. Earll, E. Bolygo and M. Seymour, J. Chromatogr. A, 1217, 6718-6723 (2010). https://doi.org/10.1016/j.chroma.2010.05.030
  11. E. Fukusaki and A. Kobayashi, J. Biosci. Bioeng., 100, 347-354 (2005). https://doi.org/10.1263/jbb.100.347
  12. G. Özek, F. Demirci, T. Özek, N. Tabanca, D. E. Wedge, S. I. Khan, K. Hüsnü, C. Baser, A. Duran and E. Hamzaoglu, J. Chromatogr. A, 1217, 741-748 (2010). https://doi.org/10.1016/j.chroma.2009.11.086
  13. M. Bylesjo, M. Rantalainen, O. Cloarec, J. K. Nicholson, E. Holmes and J. Trygg, J. Chemom., 20, 341-351 (2006). https://doi.org/10.1002/cem.1006
  14. J. A. Westerhuis, E. J. J. van Velzen, H. C. J. Hoefsloot and A. K. Smilde, Metabolomics, 6, 119-128 (2010). https://doi.org/10.1007/s11306-009-0185-z
  15. Y. S. Hong, J. Korean Soc. Food Sci. Nutr., 43, 179-186 (2014). https://doi.org/10.3746/jkfn.2014.43.2.179
  16. Y. A. Jung, Y. S. Jung and G. S. Hwang, J. Korean Magn. Reson. Soc., 15, 90-103 (2011). https://doi.org/10.6564/JKMRS.2011.15.2.090
  17. S. Wiklund, E. Johansson, L. Sjöström, E. J. Mellerowicz, U. Edlund, J. P. Shockcor, J. Gottfries, T. Moritz and J. Trygg, Anal. Chem., 80, 115-122 (2008). https://doi.org/10.1021/ac0713510