1. 유전자에 관한 용어
→ locus: 유전자가 위치한 자리
→ allele: 특정 locus에서 가질 수 있는 변이들의 집합
locus: A
genotype: Cc
haplotype: ab
allele 1: A
allele 2: a
→ genotype: 한 개인이 가지고 있는 allele의 쌍(위의 그림에서 genotype은 A/a)
→ haplotype: 같은 chromosome 내에서 함께 유전되는 특정한 allele의 조합
→ Hardy-Weinberg equilibrium(HWE)
* minor allele A의 frequency가 q일 때 전체 집단의 genotype probability는 다음과 같다.
* 이러한 probability는 large, random mating, homogenous population일 경우 세대가 계속됨에 따라 안정적으로 유지된다.
→ linkage disequilibrium(LD)
* 두 곳 이상의 genetic loci에 존재하는 allele들이 독립적으로 유전되지 않고 서로 correlation되어 있을 때, 이 allele들은 LD에 있다고 한다.
2. 확률에 관한 용어
→ probability(p): 전체 집단에서 특정 사건이 일어날 확률(기회)
→ odds: 특정 사건이 일어나지 않을 가능성 대비 일어날 가능성
→ likelihood: 주어진 data가 그 가설을 지지할 확률
* probability와 유사한 의미로 사용되며, 계산식도 동일함
* probability가 특정 condition에서 특정 결과가 일어날 가능성을 나타내는 지표라면, likelihood는 특정 결과의 원인이 특정 condition일 가능성을 나타내는 지표임.
* 즉, 결과를 예측할 경우 probability를, 원인을 예측할 경우 likelihood를 사용함.
3. 질병에 관한 지표
→ prevalence(유병률): 특정 관찰 시점에서 전체 인구 중 질병에 걸린 인구의 비율
→ incidence(발병률): 특정 관찰 기간 동안 특정 인구 집단에서 새롭게 질병에 걸린 사람의 수
→ genetic disease penetrance: 특정 genotype을 가진 사람이 특정 질병에 걸릴 확률
4. models of association
risk allele이 A이고, allele A의 genetic penetrance parameter가 γ라고 한다면
→ multiplicative model: A allele이 하나씩 추가될 때마다 disease risk는 γ배씩 증가함
→ additive model: A allele이 하나씩 추가될 때마다 disease risk는 γ씩 더해짐
→ common recessive risk: genotype이 A/A일 때만 disease risk가 γ배 증가함
→ common dominant risk: A allele이 하나라도 존재(A/A, A/a)이면 disease risk가 γ배 증가함
5. risk measurement
→ relative risk(RR)
* 요인을 가진 집단의 disease penetrance과 대조 집단의 disease penetrance의 비
→ likelihood ratio(LR)
* case의 질병 발생률과 control의 질병 발생률의 비
→ odds ratio(OR)
* case와 control 군의 odds of disease의 비
* control의 disease prevalence가 Po 이면
Reference
- SNUBI 연구실 백수연씨가 정리한 내용~
→ locus: 유전자가 위치한 자리
→ allele: 특정 locus에서 가질 수 있는 변이들의 집합
locus: A
genotype: Cc
haplotype: ab
allele 1: A
allele 2: a
→ genotype: 한 개인이 가지고 있는 allele의 쌍(위의 그림에서 genotype은 A/a)
→ haplotype: 같은 chromosome 내에서 함께 유전되는 특정한 allele의 조합
→ Hardy-Weinberg equilibrium(HWE)
* minor allele A의 frequency가 q일 때 전체 집단의 genotype probability는 다음과 같다.
* 이러한 probability는 large, random mating, homogenous population일 경우 세대가 계속됨에 따라 안정적으로 유지된다.
genotype |
A/A |
A/a |
a/a |
probability | p^2 |
2p(1-p) |
(1-p)^2 |
→ linkage disequilibrium(LD)
* 두 곳 이상의 genetic loci에 존재하는 allele들이 독립적으로 유전되지 않고 서로 correlation되어 있을 때, 이 allele들은 LD에 있다고 한다.
2. 확률에 관한 용어
→ probability(p): 전체 집단에서 특정 사건이 일어날 확률(기회)
p = a/(a+b)* 해석: 평균적으로 100명 중 100*p 명은 질병에 걸린다.
질병 있음 |
질병 없음 |
전체 |
|
사람 수 |
a |
b |
a+b |
→ odds: 특정 사건이 일어나지 않을 가능성 대비 일어날 가능성
odds = a/b = p/(1-p)* 해석: 질병에 걸릴 확률이 그렇지 않을 경우보다 Odds 배 더 높다.
→ likelihood: 주어진 data가 그 가설을 지지할 확률
* probability와 유사한 의미로 사용되며, 계산식도 동일함
* probability가 특정 condition에서 특정 결과가 일어날 가능성을 나타내는 지표라면, likelihood는 특정 결과의 원인이 특정 condition일 가능성을 나타내는 지표임.
* 즉, 결과를 예측할 경우 probability를, 원인을 예측할 경우 likelihood를 사용함.
3. 질병에 관한 지표
→ prevalence(유병률): 특정 관찰 시점에서 전체 인구 중 질병에 걸린 인구의 비율
→ incidence(발병률): 특정 관찰 기간 동안 특정 인구 집단에서 새롭게 질병에 걸린 사람의 수
→ genetic disease penetrance: 특정 genotype을 가진 사람이 특정 질병에 걸릴 확률
4. models of association
risk allele이 A이고, allele A의 genetic penetrance parameter가 γ라고 한다면
→ multiplicative model: A allele이 하나씩 추가될 때마다 disease risk는 γ배씩 증가함
→ additive model: A allele이 하나씩 추가될 때마다 disease risk는 γ씩 더해짐
→ common recessive risk: genotype이 A/A일 때만 disease risk가 γ배 증가함
→ common dominant risk: A allele이 하나라도 존재(A/A, A/a)이면 disease risk가 γ배 증가함
Basic statistical analysis in genetic case-control studies. Nature, 2011.
5. risk measurement
→ relative risk(RR)
* 요인을 가진 집단의 disease penetrance과 대조 집단의 disease penetrance의 비
RR = 요인을 가진 집단의 disaese penetrance / 대조집단의 disease penetrance* 해석: 요인을 가진 집단은 그렇지 않은 집단보다 질병 발생 확률이 RR배 높다.
→ likelihood ratio(LR)
* case의 질병 발생률과 control의 질병 발생률의 비
LR = case의 질병 발생률 / control의 질병 발생률 = (a/(a+b)) / (c/(c+d))
질병 있음 |
질병 없음 |
전체 |
|
case | a |
b |
a+b |
control | c | d |
c+d |
전체 | a+c |
b+d |
a+b+c+d |
→ odds ratio(OR)
* case와 control 군의 odds of disease의 비
OR = (a/b) / (c/d)* case-control study의 경우 case와 control을 적당한 수만큼 골라 연구를 진행하기 때문에 disease penetrance를 구할 수 없음. 이에 OR을 사용
* control의 disease prevalence가 Po 이면
RR = OR / 1-Po+Po*OR
Reference
- SNUBI 연구실 백수연씨가 정리한 내용~
'Informatics > Genome Informatics' 카테고리의 다른 글
Genome / 유전적 복합성(Genetic Heterogeneity) (0) | 2011.12.16 |
---|---|
Genome / dbsnp에서 rsID 추적하기(통합된 것 찾기) (4) | 2011.09.23 |
GEO / GPLRaw Data에서 GSM정보 추출하기 (0) | 2011.08.12 |
Genome / 뉴클레오티드, 뉴클레오티드키나아제 (0) | 2011.06.22 |
Genome / SNP Genotype 표 이해하기 (0) | 2011.06.16 |