GATK로 Variant Calling을 해서 나온 VCF의 Ref, Alt는 모두 Forward Strand 방향이므로,
VCF의 Ref, Alt를 다른 DB와 Mapping 한다고 하면 항상 Strand에 유의해야 한다.
따라서 Strand를 통일 시켜 주기 위해 아래와 같이 코딩하면 간단하다.
import string
def complementary_strand(strand):
return strand.translate(string.maketrans('TAGCtagc', 'ATCGATCG'))
if (strand = "-"):
reverseRef = complementary_strand(ref)
reverseAlt = complementary_strand(alt)
'Informatics > Genome Informatics' 카테고리의 다른 글
시퀀서 / 시퀀서 장비 Throughput 비교 (NextSeq, MiSeq, HiSeq) (1) | 2015.11.25 |
---|---|
ACMG / NGS 기반 개인유전체 분석 시 참조할 만한 변이 분류 가이드라인 (0) | 2015.10.21 |
BEDTOOLS / VCF 파일 내 타겟 BED 영역 추출하기 (0) | 2015.10.20 |
Genome / SNP, MNP, INDEL의 구분과 로직 (0) | 2015.08.06 |
VCF 파일 간단히 추출해보기 (Linux cut 명령어 이용) (0) | 2015.08.04 |