유전학 연구에서의 표현형: Phenotype is king, genotype is queen

유전학 연구자들 사이에서 가장 유명한 격언이 있습니다. “유전형이 여왕이라면, 표현형이 왕이다.” 이 문장은 유전형도 매우 중요하지만, 결국 더 중요한 것은 표현형이라는 내용을 함축적으로 담고 있습니다.

“Phenotype is king, genotype is queen.”

많은 사람들은 유전 정보만 얻으면, 개인 맞춤 치료와 정밀 의료를 실현할 수 있을 것처럼 떠들어 대는 미디어의 광고를 보면서, 이를 곧이 곧대로 받아들이곤 합니다. 그러나 유전 정보를 얻기 쉬워진 현재 시점에서의 진정한 병목 지점 (Bottle neck, rate limiting step)은 오히려 충분하고 효과적이며 꼼꼼한 표현형에 대한 정보 수집입니다. 유전형과 다르게 표현형 정보는 수집이 매우 까다롭고 귀찮습니다. 더불어, 같은 것을 지칭하는 표현형이라 하더라도 객관적인 기술이나 정량화하여 나타내는 것이 어려울 수도 있으며, 측정 자체가 모호한 경우도 많습니다.  그래서 사실 제가 연구실에서 보내는 많은 시간의 노가다도 이런 표현형 정보에 대한 수집 (이라고 쓰고 환자 차트 리뷰 라고 적는다)에 쓰입니다. (여담이지만, 공동 연구를 하시는 임상 선생님들이 전달해주시는 표현형 정보는 많은 경우, 틀리거나 이른바 정밀 의료를 위한 연구에는 부족한 경우가 매우 많습니다. 이 때문에 저는 환자를 전부 다시 리뷰하고 표현형 정보를 수집하곤 합니다. 그러다 빡쳐서 이글을 쓰는 것은 아닙니다..)

유전학 도구들의 기술적 발달로 유전 정보, 이른바 유전형 (Genotype)을 얻는 것은 매우 쉬워졌습니다. 연구자들은 이러한 유전형을 바탕으로 유전자 발현의 변화 (RNA level), 유전자 산물인 단백질의 기능 변화 (Protein level), 세포 및 조직의 변화 (Cell & Tissue), 그리고 최종적으로 도출되는 표현형 (Phenotype)까지의 긴 여정을 유전형 만을 이용해서 예측하는 것을 목표로 많은 연구를 진행하고 있습니다. 위의 긴 여정에서 한 단계씩 차원이 높아질 때마다, 변수와 복잡도는 기하급수적으로 증가하고, 실제로 예측은 점점 더 어려워집니다. 따라서, 이러한 복잡도의 차원을 낮춰서 조금 더 단순하게 개별 과정에서의 변화를 살펴보기 위한 방법이 다양한 Omics 기반의 연구입니다. 하지만 그럼에도 정말로 중요한 유전형의 변화는 심각한 표현형의 변화를 초래하게 되고, 이러한 큰 흐름속에서 질병의 병인 기전을 이해하고, 이를 바탕으로 치료제 개발을 진행하게 됩니다.

Fig-1-Data-integration-from-multiple-Omics-platforms-genomics-transcriptomics_W640
Genome에서 Phenome에 이르기까지의 긴 여정의 실타래를 푸는 일이야 말로, 정밀 의료 실현을 위해 선행되어야할 조건들입니다.

유전학 연구 방법론은 크게 Forward Genetics (정유전학) 와 Reverse Genetics (역유전학)로 구분이 되는데, 전자는 특정 표현형으로 부터 원인 유전자를 찾는 방식이고, 후자는 특정 유전자가 어떠한 표현형의 변화를 초래하는지 찾는 접근 방식으로 아래 그림은 유전형 <-> 표현형의 관계와 연구 접근 방식을 잘 나타내주고 있습니다. 전통적으로 유전 정보를 찾기 어려웠던 과거에는 표현형으로 부터 연관된 유전자를 찾는 정유전학적 접근이 대부분이었다면, 유전 정보를 쉽게 얻을 수 있는 오늘 날에는 기능이 밝혀지지 않은 많은 유전자들이 어떠한 표현형에 관여하는지를 찾는 역유전학 연구 방법이 대세가 되었습니다.

Fig-2-Forwards-vs-reverse-genetics-tools-for-the-identification-and-characterization_W640
[유전학 연구 방법론] Forward and Reverse Genetics에서의 표현형과 유전형의 관계
최근에는 이에 따라, 표현형의 중요성이 점점 더 부각되고 있으며, 표현형 (Phenotype)의 모음을 Phenome 이라고 부릅니다. GWAS 접근법과 유사하게, 특정 유전자 위치 (고정 변수)에 대해 모든 표현형을 탐색하여 연관 관계를 찾는 분석 방법을 Phenome wide association study (이른바, PheWAS)라고 부릅니다. 이를 위해서는 적절한 Phenome database가 구축되어야 하는데, 이러한 Database 중에 유전학 연구에 많이 사용되는 대표적인 곳으로는 Human Phenotype Ontology (HPO), Mouse Phenome Database (MPO) 등이 있습니다.

Human Phenotype Ontology (HPO) > 바로가기

Mouse Phenome Database (MPO) > 바로가기

 

마지막으로 다시 한번 표현형의 중요성에 대해 언급하고, 이번 포스팅을 마치고자 합니다. 아래의 논문에 소개된 사례는  잘못된 유전자 검사로 인한 오진단 사례와 관련하여, 표현형이 얼마나 중요한지를  단적으로 잘 보여주고 있습니다.

They concluded, “Remember the mantra that ‘phenotype is king, genotype is queen,’ and if the subjectively and objectively ascertained phenotype is not matching the alleged genotype, stop and reassess. In other words, phenotyping still matters most.

McCarthy, Michael. “Phenotype is king, researchers say, after 20 family members have condition misdiagnosed.” (2016): i5884.

Ackerman, Jaeger P., et al. “The promise and peril of precision medicine: phenotyping still matters most.” Mayo Clinic Proceedings. Vol. 91. No. 11. Elsevier, 2016.

관련 포스팅 보기>

[유전학 중요개념 정리] Muller’s morph와 gain of function, loss of function variant

NGS 결과의 임상 적용: Genotype-phenotype correlation

전장 유전체 연관 분석, GWAS란 무엇인가?

 


[References]

Ben-Amar, Anis, et al. “Reverse genetics and high throughput sequencing methodologies for plant functional genomics.” Current Genomics 17.6 (2016): 460-475.

Oti, Martin, Martijn A. Huynen, and Han G. Brunner. “The biological coherence of human phenome databases.” The American Journal of Human Genetics 85.6 (2009): 801-808.

광고

NGS 결과의 임상 적용: Genotype-phenotype correlation

최근에 병원의 의료 현장에서 NGS 타겟 시퀀싱 패널을 이용하면서 다양한 유전자들을 동시에 검사하는 건수가 폭발적으로 증가하고 있습니다. 다만 안타깝게도 많은 경우에 실제로 그 유전체 정보와 데이터를 충분히 활용하지 못하고 있음을 많이 느낍니다. 즉, 돈을 들여서 구축된 파이프 라인을 통해서 유전체 데이터 생산은 되는데, 이후에 변이들에 대한 적절한 해석을 하고, 환자에 적용하는데 까지는 아직 더 경험이 필요한 것 같습니다. 그래서 이번 글에서는 매우 중요한 개념인 유전형-표현형 일치 (Genotype-Phenotype correlation; G-P correlation)에 대한 포스팅을 남기고자 합니다.

관련 포스팅 보기>

NGS 검사: Whole Genome & Exome, Targeted Sequencing 비교

임상의를 위한 NGS 레포트 해석의 이해

 

I. Genotype-Phenotype correlation 의 개념

NGS 검사를 직접 해보면, 환자 한명에서도 엄청나게 많은 수의 변이들이 쏟아져 나옵니다. 여러가지 컴퓨터 예측 알고리즘이나 기존에 보고되어 구축된 유전체 데이터 베이스를 통해, 해당 변이가 실제로 질병을 일으키는 변이인지에 대해서 확인을 하고, 해당 결과가 NGS 검사 결과 보고서를 통해서 임상 의사에게 보고됩니다. 그러나, 이때 보고서의 다양한 변이 리스트를 보고, 실제로 환자에서 질병을 일으키는 유전자 이상이 무엇인지를 판단하는 것은 의사의 몫입니다.

이때 가장 중요한 것은 환자가 나타내는 임상 양상이 실제로 해당 유전자의 이상으로 발생하는 임상 양상과 일치하는가? 입니다. 나의 환자가 NGS 검사를 통해 확인된 유전형(Genotype)으로 인해 특정 유전자의 이상이 의심되고, 해당 유전자의 이상으로 알려진 질병 또는 임상 양상이 실제 나의 환자에서 나타나는 임상 양상(표현형, phenotype)과 일치하는가를 판단하는 전반적인 과정이 바로 G-P correlation이 되겠습니다. 원래는 해당 질병의 전문가가 종합적으로 판단하여야 하는데, 임상 유전학자들의 수는 매우 제한적이기 때문에, 환자의 주치의도 이러한 판단을 할 수 있어야 하기 때문에, 기본적인 유전학적 지식이 필수로 요구됩니다.

 

II. Genotype-Phenotype correlation의 접근 과정

NGS 검사를 통해 환자의 다양한 변이 정보를 얻었고, 임상 증상과 의심되는 질병도 있습니다. 이때 진단을 위한 마지막 퍼즐을 풀 차례입니다. 제일 먼저 할 과정은 환자에서 검출된 병적 변이에 의해서 실제로 보고된 임상 양상과 질병이 무엇인가를 확인하는 것입니다. 다양한 데이터 베이스가 있으나, 가장 광범위하고 무난하게 활용할 수 있는 곳은 아래의 두곳입니다. 아래 사이트에서 가장 먼저 확인해야할 것은 유전 양식(AD, AR, XLD, XLR 등등)과 질병을 일으킨 것으로 알려진 병적 변이에 대한 정보 입니다.

1

  • Online Mendelian Inheritance in Men (OMIM) : 사람의 유전질환들에 대한 다양한 데이터를 제공하기 위해 만들어졌습니다. 유전 양상과 대표적인 케이스 논문들에 대해서 바로 링크를 제공하기 때문에 유용합니다.
  • Gene Reviews : 좀 더 다양한 임상 양상들에 대해서 유전자 단위로 좀 더 상세하고 종합적으로 서술되어 있어, 배경 지식을 얻는데 더 좋습니다.

위의 사이트에서 우리 환자에서 검출된 유전자로 검색을 해서, 실제로 어떤 질병과 임상 양상이 보고되었었는가를 확인합니다. 또한 해당 유전자가 나타내는 임상 양상의 특징이 무엇인지를 파악해야합니다.

 

III. Genotype-Phenotype correlation이 안될 경우의 해석법

위와 같은 과정을 여러번 거치다 보면 다양한 상황에 마주하게 됩니다. 실제 병적 변이도 확인하고, 임상 양상도 잘 일치해서 환자를 진단하면 가장 좋겠지만, 여전히 모호한 경우를 많이 마주하게 됩니다.

  • 유전 양식이 잘 일치하는가? : 환자에서 변이가 homozygote 인지, heterozygote인지 그리고 알려진 질병 발생이 상염색체 우성 (AD)인지 상염색체 열성(AR)인지 잘 살펴본다. AR로 알려진 질병은 경우에 따라서 Compound heterozygote의 가능성도 있으므로, 추가적으로 다른 변이도 검출되지 않았은지 따져 본다.

> [유전학 중요개념 정리] Compound Heterozygote

  • 임상 양상과 해당 유전자가 의심되지만, 환자에서 검출된 변이가 실제로 병적 변이인지 모호한 경우: 1) 변이 빈도를 확인한다. : 인구 집단에서 흔한 변이이면 크게 의미가 없다. > 매우 드물거나 보고된 적이 없는 변이의 경우, 2) 환자의 부모에서 해당 변이 존재 유무를 확인하는 가족 검사를 실시한다. 만약 부모도 같은 변이를 가지고 있고 정상이라면, 질병과 관계가 없을 가능성이 높다. 그러나 일부는 투과도 (Penetrance)가 100%가 아니기 때문에 항상 그런 것은 아니다. 3) 관련 논문을 검색한다. > 논문을 잘 찾아보면 최소한의 실마리를 얻을 수 있다.

 

Genotype-Phenotype correlation 과정 자칫 환자를 잘못 진단하는 결과를 일으킬 수 있기때문에 매우 중요한 과정입니다. 그러나 이러한 과정을 통해 NGS 검사 결과를 적절히 해석하고 임상 진료에 활용하는 의사는 매우 제한적입니다. 임상 진료 현장에서 많은 의사들이 이러한 유전체 데이터를 활용하여 환자들을 적절히 진단하고 치료 하기를 소망합니다. 위에서 언급한 것 외에도 다양한 접근법이 있을 수 있으나, 분량이 너무 길어지기 때문에 이번 포스팅은 여기서 마무리하도록 하겠습니다.