[유전학 중요개념 정리] Muller’s morph와 gain of function, loss of function variant

올해의 마지막 포스팅은 매우 기본적이지만 중요한 개념인 Muller’s morph에 대해서 정리하고 마치려고 합니다. 오늘날과 같이 시퀀싱 기술이 보편화된 시대의 유전체 연구의 기본 단위는 변이 (genetic variant)입니다. 그리고 수많은 개별적 변이의 의미를 판독하는 작업은 여전히 진행 중입니다. 하지만 지금과 같이 시퀀싱이 가능하지 않던 시절에는  어떻게 변이에 대해서 연구를 했을까요?

Muller_Hermann

오늘 이야기하고자 하는 Muller’s morph의 주인공인 Hermann J. Muller (1890–1967) 는  X-ray에 의한 돌연변이 발생 기전을 발견한 공로로 1946년 노벨 생리의학상을 받은 것으로 유명합니다. 하지만 그 이전에 초파리 유전학자로 유명한 Thomas Hunt Morgan의 실험실에서 초파리 유전학 (Drosophila genetics) 을 공부했습니다. 다양한 초파리를 키우고, 교배시키면서 나오는 돌연변이를 관찰하다보니, 돌연변이에 대한 분류가 필요 했겠지요. 따라서, Muller의 돌연변이 구분은 초파리 시절 관찰에 근거한 분류 방법입니다. 그러나, 그 본질은 시퀀싱 시대인 오늘 날에도 여전히 쓰이고 있습니다.

 

Morph 는 형태를 의미합니다. Muller는 초파리의 형태를 보고, 돌연변이의 종류를 아래와 같이 크게 5가지 종류로 구분했습니다. 그리고 기능적으로 분류하면, 이러한 변이는 기능을 잃는 변이 (Loss of function)기능을 얻는 변이 (Gain of function)으로 나눌 수 있습니다.

amorph-hypomorph-hypermorph-neomorph-n

Loss of function: Amorph (Null; 완전히 잃는), Hypomorph (Hypo-; 기능이 떨어진)

Gain of function: Hypermorph (Hyper-; 기능이 항진된), Antimorph (Anti-; 반대의 기능을 하는), Neomorph (Neo-; 완전히 새로운 기능을 하는)

 

그렇다면 시퀀싱 변이 판독을 할 때, 어떠한 Muller’s morph 가 제일 많이 나타날까까요? 정확한 답을 알기는 어렵지만, 아래의 PPARG 유전자의 모든 가능한 변이의 조합으로 시행한 Deep Mutational Scan 결과를 보면, 대략적으로 유추를 해 볼 수는 있을 것 같습니다.

pparg
대부분의 아미노산 치환의 효과는 기능에 변화가 없거나 감소하는 쪽으로 발생하게 됩니다.

 

Stop codon이 발생하는 Nonsense mutation이나 Frameshift가 발생하는 Loss of function 변이는 Amorph, 아미노산 치환이 발생하는 Missense 변이는 대부분 Isomorph, Hypomorph의 가능성이 높습니다. 새로운 기능을 얻는 Gain of function 변이는 매우 드물게 나타나지만, 원래의 기능과 반대 기능을 하거나 완전히 새로운 기능을 하는 변이는 병적 변이로 나타날 확률이 높습니다. 그래서 흔히 Gain of function 기전으로 나타나는 병적 변이의 기전을 Dominant Negative 라고 합니다. 더불어, Gain of function은 Gene duplication 또는 일부 Missense 변이에 의해 대부분 나타나게 됩니다.

하지만 Muller’s morph는 매우 단순한 5가지의 분류에 근거하고 있습니다. 생물학은 그때 그때 다르며, 하나의 변이가 경우에 따라서는 loss-of-function 변이일수도, gain-of-function 변이일수도 있습니다. 따라서 개별 변이를 판독하는 과정은 위와 같은 배경 아래에서 다양한 요소들을 함께 고려해야하는 context-dependent한 과정이 될 수 밖에 없습니다.

 

[References]

Majithia, Amit R., et al. “Prospective functional classification of all possible missense variants in PPARG.” Nature genetics 48.12 (2016): 1570.

광고

[유전학 중요 정리] Nonsense-mediated decay (NMD) and Genetic compensation

그동안 시간이 날때마다 유전학 관련하여 중요한 개념을 하나씩 정리했습니다. 오늘은 그동안 정리하지 못했던 매우 중요한 개념인 Nonsense-mediated decay (NMD)와 최근에 Nature에 그 메커니즘이 발표된 NMD의 결과 발생하는 Genetic compensation에 대해서 정리해 보고자 합니다.

Nonsense mutationPremature termination codon (PTC)을 발생시키는 변이로 coding 영역의 전체 단백을 정상적으로 발현시키지 못하고 조기 종결되어, 유전자의 입장에서는 기형 단백 (Truncated protein) 을 발생시키는 결과를 초래합니다. 대부분의 Frameshift mutation 역시 PTC를 발생시키고, 그래서 일반적으로 Nonsense와 Frameshift mutation은 Protein Truncation Variant (PTV)로 변이 판독에 있어 definitely pathogenic variant로 구분 됩니다. 위와 같은 기형 단백의 발현을 대부분 정상 단백의 작동을 방해하는 Dominant negative 방식으로 작동하게 되고, 따라서 세포의 입장에서는 이러한 기형 단백의 발현을 억제하는 기작이 필요하게 되는데, 이러한 정상적인 mRNA만 발현하도록 검열하는 기작Nonsense-mediated decay (NMD) = (nonsense mRNA는 소멸시킨다)라고 합니다. 아래는 NMD의 생물학적인 역할을 정리한 그림입니다. 정상 mRNA의 발현과 유전자 발현을 조절하는 중요한 역할을 하고 있음을 알 수 있습니다.

관련 포스팅 보기>

[유전학 중요개념 정리] Haploinsufficiency와 pLI score, Dominant Negative

13578_2017_153_Fig1_HTML

 

그러나 세포의 입장에서 NMD의 존재는 양날의 검과 같습니다. 즉, NMD에 의해서 기형 단백은 전혀 발현되지 않도록 하면, 기형 단백의 발현으로 인한 방해는 예방할 수 있지만, 전혀 발현되지 않음으로 인한 기능 저하는 감수해야되는 것입니다. 그러나 최근에 생물학적으로 NMD의 결과를 보상하기 위해서, PTC가 발생한 유전자와 유사한 유전자들의 발현을 보상적으로 증가 시킴으로 인해, 그 기능을 일부 대체한다 (Genetic Compensation) 는 사실이 메커니즘적으로 밝혀졌습니다.

d41586-019-00823-5_16573352

이 연구 결과는 그 의의가 매우 중요한데, 특히 CRISPR/Cas9과 같은 tool을 이용하여 유전자를 Knock-out 시켜서 유전자의 기능을 살펴볼 때, 흔히 사용하는 Mouse model에서 나타나는 Phenotype (형질)이 단순한 유전자의 기능 소실의 결과를 그대로 반영하는 것이 아니라는 것입니다. 즉, 위 기전은 많은 경우에 기대하던 유전자를 Knock-Out 시켰는데도 불구하고, 원하던 형질이 나타나지 않는 현상에 대한 설명이 됩니다. 거꾸로 어떤 특정 환자의 질병 원인 유전자를 찾는 관점에서 보면, 환자의 질병은 단순하게 한 두개의 원인 유전자 또는 변이에 의해서 초래되었다기 보다는 위와 같은 다양한 보상 기전에도 불구하고, 질병이 발생했다고 보는 것이 타당합니다.

약물 유전학적 관점에서도 위의 메커니즘은 매우 중요한데, 약물 관련 유전자가 워낙에 유사 유전자 (Paralogue gene) 및 isoform이 많기 때문입니다. 발생 과정과 같은 매우 중추적인 생물학적 과정과 달리 약물의 대사 관련 유전자는 섭식과 약물의 노출 환경에 따라서 매우 다양하게 진화하였기 때문입니다. NMD의 결과 초래된 유전적 보상 메커니즘은 약물 유전체에 따른 다양하고 복잡한 반응을 일부 설명하고, 연구 과정에서도 중요하게 고려해야할 것으로 보입니다.

관련 포스팅 보기>

[실험실 노트] 유전자 가위 CRISPR/Cas9을 이용한 Gene Editing

약물 유전체 연구가 어려운 이유

 

[References]

Nickless, Andrew, Julie M. Bailis, and Zhongsheng You. “Control of gene expression through the nonsense-mediated RNA decay pathway.” Cell & bioscience 7.1 (2017): 26.

Genetic paradox explained by nonsense; Nature NEWS and VIEWS

Ma, Zhipeng, et al. “PTC-bearing mRNA elicits a genetic compensation response via Upf3a and COMPASS components.” Nature (2019): 1.

El-Brolosy, Mohamed A., et al. “Genetic compensation triggered by mutant mRNA degradation.” Nature (2019): 1.

[유전학 중요개념 정리] Haploinsufficiency와 pLI score, Dominant Negative

특정 유전자의 기능과 관련된 연구를 하다 보면, 유전 방식이 전통적인 멘델의 유전 법칙 (Mendelian trait)을 따르는 경우는 많지 않다는 걸 쉽게 발견하게 됩니다. 즉, 유전자의 기능은 교과서에서 배우는 상염색체 우성 또는 열성 (Autosomal dominant or recessive), X 염색체 연관 유전 (X-linked) 방식처럼 자로 잰듯, 딱 맞아 떨어지는 경우는 매우 제한적이고 정형화된 경우라는 것이죠. 따라서 오늘은 유전자의 기능을 설명할 때 나오는 중요한 개념인 Haploinsufficiency의 개념과 pLI score의 의미에 대해서 살펴보고자 합니다.

우선, 단어의 의미부터 짚고 넘어가겠습니다.

Haplo- : Haplo-는 흔히, Halplotype (일배체)에서 많이 들어본 단어입니다. 인간의 경우, 양쪽 부모로 부터 한쪽씩 유전체를 받아 이배체 (Diploidy, 2n)를 이룹니다. 따라서 여기서의 haplo는 두 짝의 유전체 중에 한 짝을 의미합니다.

-insufficiency: 불충분하다.

보통 Haplo-insufficiency는 유전자의 기능을 설명할 때 많이 사용되는데, 그 의미는 글자 그대로 유전자의 기능이 정상적으로 작동하기위해서는 두 쪽의 유전자 중에 한 쪽만 정상으로 가지고 있으면, 유전자 기능을 나타내기에 불충분하다는 뜻이 됩니다.

1
Dominant inheritance를 설명하는 두가지 모델인 HaploinsufficiencyDominant negative

Haploinsufficiency는 흔히 AD (autosomal dominant) 유전 방식을 설명할 때 많이 나오는 개념입니다만, AD 유전 방식을 따르는 유전자들이 항상 haploinsufficient 한 것은 아닙니다. 즉, Dominant 유전 방식을 설명할 때 하나의 모델로서 어떤 유전자가 정상 작동하기위해서는 2 copy의 유전자 모두에서 2 dose에 해당하는 product가 생성되어야 하는데, 그 dose가 줄게되면 정상적으로 기능을 나타내지 못하게 된다는 개념인 것이죠. 또 다른 모델로서 흔히 함께 나오는 것이 위 그림의 Dominant negative 모델입니다. 즉, mutant가 하나라도 나오면 그 것에 의해 기능이 영향을 받는다는 설명입니다.

 

마지막으로 pLI score의 의미와 그 해석에 대해 얘기하고 포스팅을 마치고자 합니다. pLI score에 대해서는 아래와 같이 설명이 되어 있습니다.

  • pLI: The probability of being loss-of-function intolerant (intolerant of both heterozygous and homozygous loss-of-function variants)
2
DECIPHER Genome Browser를 이용한 유전자들을 살펴보면, 유전자들이 pLI score에 따라 다르게 coloring 되어있는 것을 살펴 볼 수 있습니다. 즉, 빨간 색으로 나타난 유전자들은 변이가 발생하면 유전자의 기능을 잃는데 더 취약한 유전자들이라고 볼 수 있습니다.

DECIPHER Genome Browser 바로 가기

pLI는 위에서 언급한 유전자의 유전 양식을 예상할 수 있는 지표가 됩니다. 즉, pLI는 해당 유전자에 LOF (loss-of-function)이 발생했을 때 (=즉 기능적으로 망가졌을 때), 정상적으로 작동하지 않을 확률을 나타낸  것으로 해당 유전자가 Haploinsufficiency를 가질 확률을 대변한다고 생각하면 됩니다. 다른 말로하면 pLI score가 높은 유전자들은 one copy에라도 mutation이 발생하면 기능에 지대한 영향을 미칠 확률이 높다고 볼 수 있겠습니다.

pLI score는 모든 유전자들에 대해 PTV (Protein-truncating variant)를 살펴본 아래 reference 논문의 ExAc dataset을 바탕으로 계산되었습니다. 해당 score는 in-silico tool로 개발하여 예상 및 예측한 값이기 때문에 pLI score가 항상 맞는 것은 아니라는 점은 염두에 두어야겠습니다. 그러나, pLI score는 처음 보는 유전자의 유전 형식 또는 기능을 예상할 때 참고할 때 좋은 용도로 활용할 수 있습니다. 비슷한 개념으로 아래와 같은 score 도 존재하므로 같이 알아두면 유용합니다.

  • pRec : the probability of being intolerant of homozygous
  • pNull : the probability of being tolerant of both heterozygous and homozygous loss-of-function variants

 

[Reference]

Lek, Monkol, et al. “Analysis of protein-coding genetic variation in 60,706 humans.” Nature 536.7616 (2016): 285-291.