1. SNP
어느 집단에 있어, Genome에 있는 하나의 염기가 염색체마다 다른 경우가 있다. 예를 들면 우리는 아버지와 어머니로부터 각각 한 세트의 염색체를 계승하고 있지만, 어느 부위에 있어 A로 되어 있는 염색체(A allele)와 C로 되어 있는 염색체(C allele)가 존재한다. 이 양쪽 모두의 Allele가 1%이상의 빈도로 관찰되어지는 다형성을 SNP(Single Nucleotide Polymorphism)라고 한다.
SNP는 300-1000 염기 영역에 하나꼴로 존재하기 때문에 Human Genome DNA에 적어도 300만개의 SNP가 존재하게 된다.

2. SNP의 분류
rSNP(regulatory SNP): Promoter 영역 등 전사할성조절에 관계하는 영역
cSNP(coding SNP): 유전자영역의 exon 부분으로 아미노산 변이를 일으키는 영역
iSNP(intronic SNP): 유전자영역의 intron 부분에 있는 영역
sSNP(silent SNP): 유전자영역의 exon 부분에 있고, 아미노산 변화를 일으키는 영역
gSNP(genome SNP): 이외의 영역

3. SNP 해석의 의의
인간 Genome의 99.9%는 사람마다 공통이고, 나머지의 0.1%가 특정 질환에 감수성이나 약제에 대한 부작용 등의 개체 차이에 관여하고 있다고 생각된다. SNP 해성을 통해 질환 관련 유전자나 약물 대사에 관한 유전자의 분류, 질환의 원인 해명, 새로운 약제 및 치료법의 개발과 개인의 유전 정보에 근거한 질환 유무 판정과 치료 등이 가능하게 된다.

4. SNP의 해석
SNP를 이용해서 질환 관련 유전자나 약물 대사에 관한 유전자 등을 분류하는 방법은 Case-Control Study 등의 관련 해석 또는 Linkage disequilibrium에 근거하고 있다. 또, 동일 염색체상의 복수의 위치에 있어서의 Allele 편셩인 Haplotype을 이용한 해석도 가능하다.

  * HWE(Hardy-Weinberg equilibrium) test
HWE 평형은 어느 집단이 다음의 조건을 만족할 때 성립된다.
  • 집단의 사이즈가 충분히 크다.
  • Random인 교배를 한다.
  • 특정 대립 유전자에 대해서 자연선택이 없다. 즉 유전자형간에 적응도에 차이가 없다.
  • 새로운 돌연변이가 일어나고 있지 않다
  • 타 집단으로부터 또는 타 집단에의 이주가 없다.
HWE에 있는 집단의 Genotype의 빈도 분포는 그 Allele의 빈도 의존성에 일정하게 된다.
이것은 그 후의 해석의 전제 조건이 되기 때문에 HWE가 성립되지 않으면 판정된 SNP를 해석에 이용하는 것은 적절하지 않다.

  * Case-Control Study
어느 단일의 SNP에 control군과 병에 이환하고 있는 case 집단으로 같은 SNP의 출현 빈도 차이의 유무를 통계학적으로 검정하는 것이 Case-Control Study라고 한다. 이 방법을 통해 같은 SNP가 질환과 관련하고 있는지 아닌지를 조사할 수 있다. 통계학적인 검정에는 주로 Chi-square test for independence가 이용된다. 또 Allele에 대해서는 집계할 경우는, Odds ratio(SNP의 Allele를 가지는 사람은 가지지 않는 사람보다 어느 정도 병에 걸리기 쉬운가를 나타내는 지표)를 요구하는 것도 가능하다.

Case-Control Study로 SNP의 출현 빈도에 차이가 있다고 하는 결과를 얻을 경우, SNP 자체가 유전자의 발현에 영향을 주고 있거나, 혹은 SNP가 원인으로 단백질의 성질 변화를 일으키고 있다는 것을 추측하게 되고 이 SNP가 질환과 관련하는 유전자 변이와 Linkage disequilibrium의 관계에 있다고 추측하게 되는데, 아마 후자의 경우 쪽이 많다고 생각된다.

  * Linkage disequilibrium analysis
Linkage disequilibrium은 2개 이상의 유전자 위치에 있어서의 Haplotype의 빈도가 각각의 allele 빈도로부터 예측되는 값과 다른 상태의 것이다.

  * Haplotype analysis
Case-Control Study에서는 원인 돌연변이를 직접 검출하던지 또는 같은 변이와 Linkage disequilibrium의 관계에 있는 SNP를 검출할 수 있는 경우에만 질환 관련 유전자의 분류가 가능하다. 다만, 이 방법은 그다지 효율적이지 않으며, 중요한 관련 유전자를 놓칠 가능성도 있다. 그렇기 때문에 개인의 체질과 깊게 관계하고 있는 Haplotype를 고려한 해석이 중요하다고 생각하고 있다.

예를 들면, 질환 관련 변이와 Linkage disequilibrium에 있는 유전자다형성으로 구성되는 Haplotype은 질환 관련 변이를 가지는 Case군에 많이 관찰될 수 있다고 예측한다. 이 상태를 통계적으로 해석하기 위해서는 Haplotype의 분할표를 정의하여 검정한다. 극단적이게 빈도가 작은 Haplotype을 포함한 경우, 통상의 Chi-square test for independence에서는 큰 오차가 나타나기 때문에 Permutation에 의해 정확한 확률을 요구할 방법이 보고되어 있다.
출처:http://blog.naver.com/jin77k?Redirect=Log&logNo=12291369
http://ko.wikipedia.org/wiki/%ED%95%98%ED%94%8C%EB%A1%9C%ED%83%80%EC%9E%85
http://blog.daum.net/nspcho/8913134 -> 유용함.
http://blog.naver.com/PostView.nhn?blogId=dnaturex&logNo=40089467646&categoryNo=12&viewDate=&currentPage=1&listtype=0 그림설명


Genome에서 하나 이상의 뉴클레오티드 염기가 발견되는 어떤 위치는 돌연변이 혹은 유전자 다형성(polymorphism)이라고 알려져 있다. 이 발견되는 변이 염기를 대립유전자(allele)라 부른다.
한 입구 집단에서 각 대립유전자의 도수(frequency)를 측정할 수 있다. 이 측정치들은 종종 일반적 대립유전자 도수라 불리며, 인구 집단의 개인들에게 어느 대립유전자가 더 자주 나타나는가에 달려있다.

대부분의 유전자는 한 쌍으로 이루어져 있기 때문에 각 개인은 유전자 다형성에 한 쌍의 대립유전자를 갖고 있다.(하나는 아버지, 다른 하나는 어머니).
어떤 변위 위치에 있는 이 한쌍의 대립유전자 조합은 유전자형(genotype)이라고 알려져 있다.
한 인구 집단에서 뉴클레오티드 C와 T가 있는 유전자 다형성에서 어떤 개인은 C/C, C/T, T/T 세 유전형 중 하나를 가지게 될 것이다.
동형 접합자(homozygote): C/C, T/T
이형 접합자(heterozygote): C/T

만약 수십억 명의 사람중 어떤 사람이 유전자의 어떤 위치에서 C대립유전자를 갖고 있고 다른 모든 사람들은 T대립유전자를 갖고 있다면, 이 C대립유전자는 돌연변이로 볼 수 있다.
전 세계 인구의 1%도 안되는 사람들에게 발견되는 매우 드문 대립유전자는 유전질환, 희귀질환의 연구 주제가 되고, 1%이상의 인구에게 발견되는 서열 변이들을 유전자 다형성이라 부르는데, 개별 처방약 및 일반 질환 연구, 임상의학의 주제가 된다.

유전자 다형성은 신체적 형질(physical traits)와 질병 표현형(disease phenotypes)에 미치는 영향에 초점을 맞추고 있다.

+ Recent posts