1. 유전자에 관한 용어

→ locus: 유전자가 위치한 자리
→ allele: 특정 locus에서 가질 수 있는 변이들의 집합

locus: A
genotype: Cc
haplotype: ab
allele 1: A
allele 2: a



→ genotype: 한 개인이 가지고 있는 allele의 쌍(위의 그림에서 genotype은 A/a)
→ haplotype: 같은 chromosome 내에서 함께 유전되는 특정한 allele의 조합
→ Hardy-Weinberg equilibrium(HWE)
  * minor allele A의 frequency가 q일 때 전체 집단의 genotype probability는 다음과 같다.
  * 이러한 probability는 large, random mating, homogenous population일 경우 세대가 계속됨에 따라 안정적으로 유지된다.

genotype
A/A
A/a
a/a
 probability p^2
2p(1-p)
(1-p)^2

→ linkage disequilibrium(LD)
  * 두 곳 이상의 genetic loci에 존재하는 allele들이 독립적으로 유전되지 않고 서로 correlation되어 있을 때, 이 allele들은 LD에 있다고 한다.


2. 확률에 관한 용어

→ probability(p): 전체 집단에서 특정 사건이 일어날 확률(기회)
p = a/(a+b)
    * 해석: 평균적으로 100명 중 100*p 명은 질병에 걸린다.

  질병 있음
질병 없음
전체
 사람 수
a
b
a+b

→ odds: 특정 사건이 일어나지 않을 가능성 대비 일어날 가능성
odds = a/b = p/(1-p)
    * 해석: 질병에 걸릴 확률이 그렇지 않을 경우보다 Odds 배 더 높다.

→ likelihood: 주어진 data가 그 가설을 지지할 확률
  * probability와 유사한 의미로 사용되며, 계산식도 동일함
  * probability가 특정 condition에서 특정 결과가 일어날 가능성을 나타내는 지표라면, likelihood는 특정 결과의 원인이 특정 condition일 가능성을 나타내는 지표임.
  * 즉, 결과를 예측할 경우 probability를, 원인을 예측할 경우 likelihood를 사용함.


3. 질병에 관한 지표

→ prevalence(유병률): 특정 관찰 시점에서 전체 인구 중 질병에 걸린 인구의 비율
→ incidence(발병률): 특정 관찰 기간 동안 특정 인구 집단에서 새롭게 질병에 걸린 사람의 수
→ genetic disease penetrance: 특정 genotype을 가진 사람이 특정 질병에 걸릴 확률


4. models of association

risk allele이 A이고, allele A의 genetic penetrance parameter가 γ라고 한다면
→ multiplicative model: A allele이 하나씩 추가될 때마다 disease risk는 γ배씩 증가함
→ additive model: A allele이 하나씩 추가될 때마다 disease risk는 γ씩 더해짐
→ common recessive risk: genotype이 A/A일 때만 disease risk가 γ배 증가함
→ common dominant risk: A allele이 하나라도 존재(A/A, A/a)이면 disease risk가 γ배 증가함

Basic statistical analysis in genetic case-control studies. Nature, 2011.


5. risk measurement

→ relative risk(RR)
  * 요인을 가진 집단의 disease penetrance과 대조 집단의 disease penetrance의 비
RR = 요인을 가진 집단의 disaese penetrance / 대조집단의 disease penetrance
    * 해석: 요인을 가진 집단은 그렇지 않은 집단보다 질병 발생 확률이 RR배 높다.

→ likelihood ratio(LR)
  * case의 질병 발생률과 control의 질병 발생률의 비
LR = case의 질병 발생률 / control의 질병 발생률 = (a/(a+b)) / (c/(c+d))
  질병 있음
질병 없음
전체
 case a
b
a+b
 control c d
c+d
 전체 a+c
b+d
a+b+c+d

→ odds ratio(OR)
  * case와 control 군의 odds of disease의 비
OR = (a/b) / (c/d)
  * case-control study의 경우 case와 control을 적당한 수만큼 골라 연구를 진행하기 때문에 disease penetrance를 구할 수 없음. 이에 OR을 사용
  * control의 disease prevalence가 Po 이면
RR = OR / 1-Po+Po*OR

Reference
- SNUBI 연구실 백수연씨가 정리한 내용~

+ Recent posts