[유전학 중요개념 정리] Muller’s morph와 gain of function, loss of function variant

올해의 마지막 포스팅은 매우 기본적이지만 중요한 개념인 Muller’s morph에 대해서 정리하고 마치려고 합니다. 오늘날과 같이 시퀀싱 기술이 보편화된 시대의 유전체 연구의 기본 단위는 변이 (genetic variant)입니다. 그리고 수많은 개별적 변이의 의미를 판독하는 작업은 여전히 진행 중입니다. 하지만 지금과 같이 시퀀싱이 가능하지 않던 시절에는  어떻게 변이에 대해서 연구를 했을까요?

Muller_Hermann

오늘 이야기하고자 하는 Muller’s morph의 주인공인 Hermann J. Muller (1890–1967) 는  X-ray에 의한 돌연변이 발생 기전을 발견한 공로로 1946년 노벨 생리의학상을 받은 것으로 유명합니다. 하지만 그 이전에 초파리 유전학자로 유명한 Thomas Hunt Morgan의 실험실에서 초파리 유전학 (Drosophila genetics) 을 공부했습니다. 다양한 초파리를 키우고, 교배시키면서 나오는 돌연변이를 관찰하다보니, 돌연변이에 대한 분류가 필요 했겠지요. 따라서, Muller의 돌연변이 구분은 초파리 시절 관찰에 근거한 분류 방법입니다. 그러나, 그 본질은 시퀀싱 시대인 오늘 날에도 여전히 쓰이고 있습니다.

 

Morph 는 형태를 의미합니다. Muller는 초파리의 형태를 보고, 돌연변이의 종류를 아래와 같이 크게 5가지 종류로 구분했습니다. 그리고 기능적으로 분류하면, 이러한 변이는 기능을 잃는 변이 (Loss of function)기능을 얻는 변이 (Gain of function)으로 나눌 수 있습니다.

amorph-hypomorph-hypermorph-neomorph-n

Loss of function: Amorph (Null; 완전히 잃는), Hypomorph (Hypo-; 기능이 떨어진)

Gain of function: Hypermorph (Hyper-; 기능이 항진된), Antimorph (Anti-; 반대의 기능을 하는), Neomorph (Neo-; 완전히 새로운 기능을 하는)

 

그렇다면 시퀀싱 변이 판독을 할 때, 어떠한 Muller’s morph 가 제일 많이 나타날까까요? 정확한 답을 알기는 어렵지만, 아래의 PPARG 유전자의 모든 가능한 변이의 조합으로 시행한 Deep Mutational Scan 결과를 보면, 대략적으로 유추를 해 볼 수는 있을 것 같습니다.

pparg
대부분의 아미노산 치환의 효과는 기능에 변화가 없거나 감소하는 쪽으로 발생하게 됩니다.

 

Stop codon이 발생하는 Nonsense mutation이나 Frameshift가 발생하는 Loss of function 변이는 Amorph, 아미노산 치환이 발생하는 Missense 변이는 대부분 Isomorph, Hypomorph의 가능성이 높습니다. 새로운 기능을 얻는 Gain of function 변이는 매우 드물게 나타나지만, 원래의 기능과 반대 기능을 하거나 완전히 새로운 기능을 하는 변이는 병적 변이로 나타날 확률이 높습니다. 그래서 흔히 Gain of function 기전으로 나타나는 병적 변이의 기전을 Dominant Negative 라고 합니다. 더불어, Gain of function은 Gene duplication 또는 일부 Missense 변이에 의해 대부분 나타나게 됩니다.

하지만 Muller’s morph는 매우 단순한 5가지의 분류에 근거하고 있습니다. 생물학은 그때 그때 다르며, 하나의 변이가 경우에 따라서는 loss-of-function 변이일수도, gain-of-function 변이일수도 있습니다. 따라서 개별 변이를 판독하는 과정은 위와 같은 배경 아래에서 다양한 요소들을 함께 고려해야하는 context-dependent한 과정이 될 수 밖에 없습니다.

 

[References]

Majithia, Amit R., et al. “Prospective functional classification of all possible missense variants in PPARG.” Nature genetics 48.12 (2016): 1570.

[유전학 중요개념 정리] Haploinsufficiency와 pLI score, Dominant Negative

특정 유전자의 기능과 관련된 연구를 하다 보면, 유전 방식이 전통적인 멘델의 유전 법칙 (Mendelian trait)을 따르는 경우는 많지 않다는 걸 쉽게 발견하게 됩니다. 즉, 유전자의 기능은 교과서에서 배우는 상염색체 우성 또는 열성 (Autosomal dominant or recessive), X 염색체 연관 유전 (X-linked) 방식처럼 자로 잰듯, 딱 맞아 떨어지는 경우는 매우 제한적이고 정형화된 경우라는 것이죠. 따라서 오늘은 유전자의 기능을 설명할 때 나오는 중요한 개념인 Haploinsufficiency의 개념과 pLI score의 의미에 대해서 살펴보고자 합니다.

우선, 단어의 의미부터 짚고 넘어가겠습니다.

Haplo- : Haplo-는 흔히, Halplotype (일배체)에서 많이 들어본 단어입니다. 인간의 경우, 양쪽 부모로 부터 한쪽씩 유전체를 받아 이배체 (Diploidy, 2n)를 이룹니다. 따라서 여기서의 haplo는 두 짝의 유전체 중에 한 짝을 의미합니다.

-insufficiency: 불충분하다.

보통 Haplo-insufficiency는 유전자의 기능을 설명할 때 많이 사용되는데, 그 의미는 글자 그대로 유전자의 기능이 정상적으로 작동하기위해서는 두 쪽의 유전자 중에 한 쪽만 정상으로 가지고 있으면, 유전자 기능을 나타내기에 불충분하다는 뜻이 됩니다.

1
Dominant inheritance를 설명하는 두가지 모델인 HaploinsufficiencyDominant negative

Haploinsufficiency는 흔히 AD (autosomal dominant) 유전 방식을 설명할 때 많이 나오는 개념입니다만, AD 유전 방식을 따르는 유전자들이 항상 haploinsufficient 한 것은 아닙니다. 즉, Dominant 유전 방식을 설명할 때 하나의 모델로서 어떤 유전자가 정상 작동하기위해서는 2 copy의 유전자 모두에서 2 dose에 해당하는 product가 생성되어야 하는데, 그 dose가 줄게되면 정상적으로 기능을 나타내지 못하게 된다는 개념인 것이죠. 또 다른 모델로서 흔히 함께 나오는 것이 위 그림의 Dominant negative 모델입니다. 즉, mutant가 하나라도 나오면 그 것에 의해 기능이 영향을 받는다는 설명입니다.

 

마지막으로 pLI score의 의미와 그 해석에 대해 얘기하고 포스팅을 마치고자 합니다. pLI score에 대해서는 아래와 같이 설명이 되어 있습니다.

  • pLI: The probability of being loss-of-function intolerant (intolerant of both heterozygous and homozygous loss-of-function variants)
2
DECIPHER Genome Browser를 이용한 유전자들을 살펴보면, 유전자들이 pLI score에 따라 다르게 coloring 되어있는 것을 살펴 볼 수 있습니다. 즉, 빨간 색으로 나타난 유전자들은 변이가 발생하면 유전자의 기능을 잃는데 더 취약한 유전자들이라고 볼 수 있습니다.

DECIPHER Genome Browser 바로 가기

pLI는 위에서 언급한 유전자의 유전 양식을 예상할 수 있는 지표가 됩니다. 즉, pLI는 해당 유전자에 LOF (loss-of-function)이 발생했을 때 (=즉 기능적으로 망가졌을 때), 정상적으로 작동하지 않을 확률을 나타낸  것으로 해당 유전자가 Haploinsufficiency를 가질 확률을 대변한다고 생각하면 됩니다. 다른 말로하면 pLI score가 높은 유전자들은 one copy에라도 mutation이 발생하면 기능에 지대한 영향을 미칠 확률이 높다고 볼 수 있겠습니다.

pLI score는 모든 유전자들에 대해 PTV (Protein-truncating variant)를 살펴본 아래 reference 논문의 ExAc dataset을 바탕으로 계산되었습니다. 해당 score는 in-silico tool로 개발하여 예상 및 예측한 값이기 때문에 pLI score가 항상 맞는 것은 아니라는 점은 염두에 두어야겠습니다. 그러나, pLI score는 처음 보는 유전자의 유전 형식 또는 기능을 예상할 때 참고할 때 좋은 용도로 활용할 수 있습니다. 비슷한 개념으로 아래와 같은 score 도 존재하므로 같이 알아두면 유용합니다.

  • pRec : the probability of being intolerant of homozygous
  • pNull : the probability of being tolerant of both heterozygous and homozygous loss-of-function variants

 

[Reference]

Lek, Monkol, et al. “Analysis of protein-coding genetic variation in 60,706 humans.” Nature 536.7616 (2016): 285-291.