Tandem Repeat Polymorphism과 유전자 발현 조절 메커니즘 (eSTR)

유전학에서 흔하게 이야기하는 용어 중에 Missing Heritability라는 것이 있습니다. 유전적으로 동일한 쌍둥이 연구를 통해, 형질의 차이를 살펴보니 환경적 요인 등 후천적 효과를 제외하면 형질의 최대 7~80 %까지는 유전적으로 설명이 가능하다고 밝혀졌는데, 실제로 SNV와 CNV와 같은 유전적 변이로는 이를 전부 설명하지 못했죠. 특히 최근 광범위하게 연구된 유전학 연구 툴인 GWAS와 NGS를 이용하여서도 이러한 heritability를 전부 설명하지 못했습니다. 연구자들은 이렇게 잃어버린 나머지 유전적 기여의 원인과 메커니즘을 찾기 위해 많은 연구를 진행했고, 오늘 정리할 내용이 Tandem Repeat Polymorphism eSTR (expression Short Tandem Repeat) 입니다.

관련 포스팅 보기 >

[유전학 중요개념 정리] Tandem repeat: STR and VNTR

[유전학 중요개념 정리] eQTL

Tandem Repeat의 개념은 지난 포스팅에서 정리하였는데, Tandem Repeat Polymorphism은 개인별 Tandem Repeat  길이의 차이로 인해 다양한 유전자 발현 정도도 조절이 되어 개인별 차이를 나타낸다는 개념입니다. 유전자 발현을 조절하는 SNP (Single Nucleotide Polymorphism)으로 eQTL에 대해서 정리한 바가 있는데, 최근 연구에 의하면 eSTR도 유전자 발현을 조절하는데 많은 부분 관여하여, Missing Heritability 중 일부를 설명한다고 합니다.

1
[eSTR이 유전자 발현에 미치는 효과] STR의 길이에 따라, 유전자 발현량에 차이를 보이는 STR을 통계적으로 검출하여, 실제로 해당 부위가 유전자 발현량에 영향을 미친다는 것을 확인하였습니다.

 

I. STR이 유전자 발현을 조절하는 메커니즘

2

STR이 유전자 발현에 영향을 미치는 다양한 메커니즘들이 제안되었는데, 현재까지는 1) Transcription factor binding site를 형성하거나, 2) Reculatory element까지의 물리적 거리에 영향을 미치거나, 3) DNA 2차 구조를 형성하는 방법, 4) splicing 과정에 영향 또는 toxic RNA 형성 등을 통해 유전자 발현에 영향을 미친다고 알려져 있습니다.

 

II. Genome wide profiling method for STR

원래 STR을 검출하는 가장 고전적이고 정확한 방법은 해당 부위를 PCR하여, 전기영동을 통해 size (분자량)를 확인하여 몇번 반복되었는지를 확인하는 것입니다. 그러나 시퀀싱 기술이 발달하면서, NGS 기술을 통해서도 STR을 확인하는 다양한 방법들이 제안되었습니다. 그러나 아직까지 NGS를 이용하여 STR을 확인하는 방법에는 아래와 같은 한계가 존재합니다.

  1. 대부분의 STR은 intron 영역에 존재하기 때문에 WGS (whole genome sequencing) data가 필요하다.
  2. Illumina platform 방식의 짧은 read (100~300bp)를 이용한 방식으로는 길게 반복되는 tandem repeat 검출이 어렵다.

그럼에도 불구하고 다양한 Bioinformatics tool 들이 개발되어, 이러한 한계를 극복하고 있습니다. 아래는 NGS data를 이용하여 Tandem Repeat을 검출하는 다양한 툴들을 보여주고 있습니다.

3

 

[References]

Gymrek, Melissa, et al. “Abundant contribution of short tandem repeats to gene expression variation in humans.” Nature genetics 48.1 (2016): 22.

Gymrek, Melissa. “A genomic view of short tandem repeats.” Current opinion in genetics & development 44 (2017): 9-16.

[유전학 중요개념 정리] Tandem repeat: STR and VNTR

최근에 법의학 관련 드라마를 보다가 문득 생각이 나서, 오늘은 Tandem repeat의 개념에 대해서 정리하는 포스팅을 남깁니다. Tandem Repeat은 DNA의 염기 서열 중에서 특정 염기 서열이 계속 반복 되는 영역을 일컫습니다. 대부분은 단백질을 coding하지 않는 non-coding 영역에 분포하고 있는데, 전체 염기 서열의 15~20%를 차지할 정도로 상당한 비중을 차지합니다. 원래 이 영역은 개인간의 차이로 인해, 주로 친자 확인이나 범인의 DNA로 부터 신원 감식을 할 때 주로 사용하였습니다.

 

Tandem (일렬로 쭈욱 나란히 늘어선 상태) + Repeat (반복): DNA의 계속적으로 반복되는 서열을 의미

the-human-genome-project-part-iii-31-638

  • Short Tandem Repeat (STR): 반복되는 서열이 2~7개의 염기로 매우 짧은 경우, 전체 유전체에 걸쳐 3만여개 이상 분포되어 있는 것으로 생각됨. (10kb당 1개 꼴)
  • 특별히 암유전체학에서 암 발생과 연관된 STR을 Microsatellite instability (MSI)라고 합니다.
  • Variable Number Tandem  Repeat (VNTR): 반복 서열 염기가 수십~수백개 정도로 더 긴 경우

 

I. Tandem Repeat의 발생 메커니즘과 진화적 의의

10.1038_nrmicro734-f1_full

DNA가 반복되는 염기 서열 부위는 DNA 합성 과정에서 error가 잘 발생하는 (High mutation rate) 부위입니다. DNA polymerase에 의해 DNA 합성이 발생하다가, 위와 같은 방식으로 반복 부위를 빠뜨리거나 더할 수 있습니다. 위와 같은 메커니즘을 Slipped-strand mispairing이라고 합니다. 이러한 메커니즘으로 인해, 개체별로 Tandem Repeat에도 다양성이 발생하게 되고, 최근 연구에서는 이러한 Tandem Repeat의 다양성이 유전자 발현에도 영향을 미쳐서 다양한 형질에도 영향을 미친다는 것이 밝혀졌습니다. 특히 이러한 메커니즘은 진화에 의해 개체의 형질이 변화하는 것을 설명하는 중요한 근거입니다.

 

II. STR 활용: 신원 감식, 친자 확인, 골수 이식 후 치료 추적 마커

STR 마커는 개인별로 다양하게 나타나기 때문에, 일종의 profile로 이용할 수 있습니다. 따라서, 과거부터 친자 확인이나 범죄 현장의 DNA를 이용하여 용의자를 검거할 경우에 이용해 왔습니다. 또한 임상적으로는 백혈병이나 골수 이상 질환에서 골수 이식 후 치료를 추적하는 마커로도 이용하고 있습니다. 항암치료 후에 골수 이식을 하면, 본인의 골수의 STR 마커는 사라지고 골수 이식 기증자의 STR 마커가 나타나야 하는데, 본인의 STR 마커가 다시 많이 나타나는 것은 암세포 증식을 의미하므로, 치료 잘 되었는지 재발이 되었는지를 판단하는데 도움을 주게 됩니다.

str_med
[STR을 이용한 신원 감식 원리] 개인별로 STR이 나타나는 부위의 반복 서열이 다양하기 때문에, 친자 확인이나 범죄 용의자 수사에 용이하게 이용할 수 있습니다.

0fa38d535b49921271fc5fc2cc12d6a0
[STR을 이용한 범인 감식 원리] 범죄 현장에서 찾아낸 DNA와 용의자의 DNA를 이용하여 특정 부위의 STR의 반복 길이를 비교함으로써 동일인인지를 확인합니다.
A78412_2_En_56_Fig4_HTML
[골수 이식 후 치료 추적 마커로써 STR 활용] 혈액에서 공여자와 환자의 치료전 STR 마커와 이식 후 STR 마커를 비교하여 골수 이식이 성공적으로 일어났는지, 항암 치료 후 골수 암 세포의 증식이 다시 발생하지 않았는지 등을 판단할 수 있습니다.
 

이번 포스팅은 Tandem Repeat의 개념과 활용에 대해서 정리하는 것으로 마치고, 다음 포스팅에서는 실제 유전학 연구에서의 의의를 좀 더 자세히 살펴보도록 하겠습니다.

 

[Reference]

Tandem repeats and morphological variation. Nature Education 1(1):1