NGS 결과의 임상 적용: Genotype-phenotype correlation

최근에 병원의 의료 현장에서 NGS 타겟 시퀀싱 패널을 이용하면서 다양한 유전자들을 동시에 검사하는 건수가 폭발적으로 증가하고 있습니다. 다만 안타깝게도 많은 경우에 실제로 그 유전체 정보와 데이터를 충분히 활용하지 못하고 있음을 많이 느낍니다. 즉, 돈을 들여서 구축된 파이프 라인을 통해서 유전체 데이터 생산은 되는데, 이후에 변이들에 대한 적절한 해석을 하고, 환자에 적용하는데 까지는 아직 더 경험이 필요한 것 같습니다. 그래서 이번 글에서는 매우 중요한 개념인 유전형-표현형 일치 (Genotype-Phenotype correlation; G-P correlation)에 대한 포스팅을 남기고자 합니다.

관련 포스팅 보기>

NGS 검사: Whole Genome & Exome, Targeted Sequencing 비교

임상의를 위한 NGS 레포트 해석의 이해

 

I. Genotype-Phenotype correlation 의 개념

NGS 검사를 직접 해보면, 환자 한명에서도 엄청나게 많은 수의 변이들이 쏟아져 나옵니다. 여러가지 컴퓨터 예측 알고리즘이나 기존에 보고되어 구축된 유전체 데이터 베이스를 통해, 해당 변이가 실제로 질병을 일으키는 변이인지에 대해서 확인을 하고, 해당 결과가 NGS 검사 결과 보고서를 통해서 임상 의사에게 보고됩니다. 그러나, 이때 보고서의 다양한 변이 리스트를 보고, 실제로 환자에서 질병을 일으키는 유전자 이상이 무엇인지를 판단하는 것은 의사의 몫입니다.

이때 가장 중요한 것은 환자가 나타내는 임상 양상이 실제로 해당 유전자의 이상으로 발생하는 임상 양상과 일치하는가? 입니다. 나의 환자가 NGS 검사를 통해 확인된 유전형(Genotype)으로 인해 특정 유전자의 이상이 의심되고, 해당 유전자의 이상으로 알려진 질병 또는 임상 양상이 실제 나의 환자에서 나타나는 임상 양상(표현형, phenotype)과 일치하는가를 판단하는 전반적인 과정이 바로 G-P correlation이 되겠습니다. 원래는 해당 질병의 전문가가 종합적으로 판단하여야 하는데, 임상 유전학자들의 수는 매우 제한적이기 때문에, 환자의 주치의도 이러한 판단을 할 수 있어야 하기 때문에, 기본적인 유전학적 지식이 필수로 요구됩니다.

 

II. Genotype-Phenotype correlation의 접근 과정

NGS 검사를 통해 환자의 다양한 변이 정보를 얻었고, 임상 증상과 의심되는 질병도 있습니다. 이때 진단을 위한 마지막 퍼즐을 풀 차례입니다. 제일 먼저 할 과정은 환자에서 검출된 병적 변이에 의해서 실제로 보고된 임상 양상과 질병이 무엇인가를 확인하는 것입니다. 다양한 데이터 베이스가 있으나, 가장 광범위하고 무난하게 활용할 수 있는 곳은 아래의 두곳입니다. 아래 사이트에서 가장 먼저 확인해야할 것은 유전 양식(AD, AR, XLD, XLR 등등)과 질병을 일으킨 것으로 알려진 병적 변이에 대한 정보 입니다.

1

  • Online Mendelian Inheritance in Men (OMIM) : 사람의 유전질환들에 대한 다양한 데이터를 제공하기 위해 만들어졌습니다. 유전 양상과 대표적인 케이스 논문들에 대해서 바로 링크를 제공하기 때문에 유용합니다.
  • Gene Reviews : 좀 더 다양한 임상 양상들에 대해서 유전자 단위로 좀 더 상세하고 종합적으로 서술되어 있어, 배경 지식을 얻는데 더 좋습니다.

위의 사이트에서 우리 환자에서 검출된 유전자로 검색을 해서, 실제로 어떤 질병과 임상 양상이 보고되었었는가를 확인합니다. 또한 해당 유전자가 나타내는 임상 양상의 특징이 무엇인지를 파악해야합니다.

 

III. Genotype-Phenotype correlation이 안될 경우의 해석법

위와 같은 과정을 여러번 거치다 보면 다양한 상황에 마주하게 됩니다. 실제 병적 변이도 확인하고, 임상 양상도 잘 일치해서 환자를 진단하면 가장 좋겠지만, 여전히 모호한 경우를 많이 마주하게 됩니다.

  • 유전 양식이 잘 일치하는가? : 환자에서 변이가 homozygote 인지, heterozygote인지 그리고 알려진 질병 발생이 상염색체 우성 (AD)인지 상염색체 열성(AR)인지 잘 살펴본다. AR로 알려진 질병은 경우에 따라서 Compound heterozygote의 가능성도 있으므로, 추가적으로 다른 변이도 검출되지 않았은지 따져 본다.

> [유전학 중요개념 정리] Compound Heterozygote

  • 임상 양상과 해당 유전자가 의심되지만, 환자에서 검출된 변이가 실제로 병적 변이인지 모호한 경우: 1) 변이 빈도를 확인한다. : 인구 집단에서 흔한 변이이면 크게 의미가 없다. > 매우 드물거나 보고된 적이 없는 변이의 경우, 2) 환자의 부모에서 해당 변이 존재 유무를 확인하는 가족 검사를 실시한다. 만약 부모도 같은 변이를 가지고 있고 정상이라면, 질병과 관계가 없을 가능성이 높다. 그러나 일부는 투과도 (Penetrance)가 100%가 아니기 때문에 항상 그런 것은 아니다. 3) 관련 논문을 검색한다. > 논문을 잘 찾아보면 최소한의 실마리를 얻을 수 있다.

 

Genotype-Phenotype correlation 과정 자칫 환자를 잘못 진단하는 결과를 일으킬 수 있기때문에 매우 중요한 과정입니다. 그러나 이러한 과정을 통해 NGS 검사 결과를 적절히 해석하고 임상 진료에 활용하는 의사는 매우 제한적입니다. 임상 진료 현장에서 많은 의사들이 이러한 유전체 데이터를 활용하여 환자들을 적절히 진단하고 치료 하기를 소망합니다. 위에서 언급한 것 외에도 다양한 접근법이 있을 수 있으나, 분량이 너무 길어지기 때문에 이번 포스팅은 여기서 마무리하도록 하겠습니다.

NGS Targeted Gene Panel 디자인을 위한 고려 사항

과거에 생거 시퀀싱으로 유전자의 일부에서 변이를 검출하던 단계에서 벗어나, 최근의 유전자 서열의 검사는 대부분 NGS로 넘어갔습니다. 특히 병원의 검사실에서는 저렴해진 시퀀싱 비용을 바탕으로 특정 질병에 대한 선택적인 유전자 패널 (Customized Targeted Gene Panel)을 구성하여, 해당 환자에서 유전자 변이와 질병과의 관계를 검사하고 있는 상황입니다. 이에 오늘은 이러한 Targeted Gene Panel을 디자인할 때 고려해야할 내용들에 대해서 포스팅하고자 합니다.

 

I. Target gene vs. Exome panel

Fig 1

Target gene panel은 특정 질병 또는 형질과 관련된 유전자 (최소 수개~최대 수백개)를 대상으로 구성된 패널을 말하고, Exome 패널은 전체 모든 Exon 영역(Whole Exome), 임상적 질환과 관련된 모든 유전자의 Exon 영역 (Clinical Exome), 또는 임상 연구와 관련된 모든 유전자의 Exon 영역 (Research Exome)으로 구성된 패널을 말합니다. 일반적으로 Target gene panel의 유전자 수가 더 적기 때문에 더 좋은 퀄리티의 데이터(high depth, wide coverage)를 저렴하게 얻을 수 있는 반면, Exome panel은 좀 더 다양한 유전자에 대한 광범위한 데이터를 얻기에 용이합니다.

관련 포스팅 보기 > NGS 검사: Whole Genome & Exome, Targeted Sequencing 비교

 

II. 얼마나 많은 수의, 그리고 어떤 유전자를 포함할 것인가?

일반적으로 유전자 수가 많아질수록, 더 많은 후보 유전자의 변이를 검출할 수 있어 민감도는 높아지지만, 시퀀싱의 depth가 낮아지고 분석 과정에서 불필요한 위양성 결과를 얻을 확률도 높아집니다. 더불어 유전자 수가 많아질수록 분석에 필요한 비용 및 시간도 높아지게 됩니다. 반면 꼭 필요한 유전자만 포함할 경우에는 검사의 특이도가 높아지고, 불필요한 비용과 시간을 절약할 수 있습니다. 그러나, 패널의 검사 비용이 유전자수에 비례하여 똑같이 증가하는 것은 아니기 때문에, 적절한 유전자를 포함하는 패널을 디자인하는 것이 중요합니다.

Fig 2
[유전자 수 변화에 따른 NGS 검사 비용] NGS 패널은 초기 비용이 가장 크게 들어가고, 이후 타깃 유전자 개수 증가에 따른 추가 비용의 증가폭은 크지 않습니다. 따라서 효율적인 패널 디자인을 위해서는, 적절한 수의 유전자 개수를 포함시키는 것이 중요합니다.
  1. 검사 목적 – 임상 검사용 vs. 연구용 : 유전자 선정에 가장 중요한 것은 해당 유전자와 형질(질병) 간의 명확한 관계가 정립되어 있는가?에 있습니다. 검사 목적이 임상 환자의 진단에 있다면 이러한 유전자들만 포함하는 것이 맞습니다. 그러나, 검사 목적이 연구용으로 새로운 유전자의 역할을 규명하거나 아직 명확하게 정립되어 있지 않은 후보 유전자의 역할에 있다면, 이러한 유전자들도 추가적으로 포함시킬 수 있습니다.
  2. 유전자 선정 과정 : 타깃 시퀀싱 패널을 디자인할 때, 어떠한 유전자를 포함하고, 포함하지 않을 것인지는 상당히 중요한 이슈입니다. 이 과정은 실제 환자를 보는 임상의의 의견과 실제 검사실에서의 다양한 고려 사항 (기술적 고려사항, 검사 결과의 QC 등) 을 종합적으로 판단하는 것이 좋습니다. 또한 검사 이후의 판독의의 의견도 중요한 고려 사항입니다. 또한 다른 검사실의 실제 경험과 결과를 참고하여, 해당 유전자의 변이의 검출률, 진단률 등을 고려하는 것이 좋습니다.
  3. 타깃 유전자 프로브 간의 상호 작용: 유전자 영역 선정이 끝난 이후 실제 타겟 영역의 프로브를 디자인하는 경우, 각 프로브 간의 상호 작용 또는 간섭이 발생할 수 있습니다. 다음과 같은 지표들에 영향이 없는지를 고려하여 유전자 간의 조합도 적절하게 조정하는 것이 필요합니다.  표적내 시퀀싱 비율 (On target %), 최소 시퀀싱 깊이 (Minimal Depth of Coverage), 최소요구 depth 이상 비율 (% Target regions above minimal depth), 염기 질 지수 (Base calling Quality)
  4. Copy Number Variant 분석을 포함할 것인가?: NGS를 이용한 Copy Number Variant (이하 CNV) 분석에 대해서는 아직 그 임상적 활용에 대해 명확히 정립된 바가 없으나, 보조적으로 NGS 결과를 참고하는 추세입니다. 이 경우, 해당 영역의 coverage 및 depth data가 중요하게 됩니다. 이러한 데이터를 활용하고자 한다면, 좀 더 해당 데이터의 퀄리티 확보에 대해, 패널 디자인에서 함께 생각해보는 것이 좋습니다.

 

III. 실제 패널 디자인 과정

  1. 문헌 조사 (Literature review): 관련 질환 및 포함 시킬 유전자들에 대한 문헌 (논문 등)을 조사합니다. 많은 경우, 실제로 어떤 유전자를 포함하여 패널을 구성하고 검사를 했는지에 관한 보고된 논문 자료가 많기 때문에 해당 내용을 참고하기 용이합니다.
  2. 유전자 검사 기관에서 시행하고 있는 NGS 패널 서비스 확인: 최근에는 많은 유전자 검사 기관에서 대표적인 질환에 대한 패널을 서비스를 제공하고 있습니다. 따라서 각 유전자 검사 기관에서 어떤 질환과 유전자들에 대해서 서비스하고 있는지 확인해봅니다. 많은 기관에서 공통적으로 검사하는 유전자들은 무엇인지, 추가된 유전자들은 무엇인지 확인해볼 수 있습니다.
  3. 기타 유용한 웹 자료: 이외에도 다양한 자료 source를 활용할 수 있는데, 그 중에서도 Panel App에 대해서 소개해 보고자 합니다. 아래 사이트는 여러가지 질환과 유전자들에 대해서 패널을 구성하고자 할 때, 전문가들이 그 근거에 대해서 curation 된 결과를 제공해줍니다. 따라서 어떠한 유전자를 포함할 것인가? 말 것인가? 에 대해 고민할 경우 참고할만합니다. 이미 많은 질환에 대해서 구성된 패널이 큰 골격이 짜여져 있으며, 해당 유전자 정보도 다운 받을 수 있기 때문에 패널 디자인시 참고하기 좋습니다.

PanelApp 사이트 방문하기: Genomics England PanelApp

약물유전체 정밀의료의 실현, F-CAP 프로젝트

오늘은 어제 소개해드렸던 PGRN (Pharmacogenomic Research Network)에서 진행 중인 프로젝트 중 하나인 F-CAP(Functionalization of Variants in Clinical Actionable Pharmacogenes)에 대해서 소개하고자 합니다.

최근 유전자 시퀀싱 기술의 발달로 개인별로 많은 차이를 보이는 SNV (Single Nucleotide Variant)를 가진다는 것을 알게 되었고, (사실 전체 염기서열에 비하면, SNV의 비율을 매우 적은 편이긴 합니다만,) 약물 대사에 관여되는 단백질을 coding 하는 유전자의 변이가 결국 약물의 농도나 반응, 부작용 등에 관여하는 것이 밝혀지면서 약물 유전체학의 연구는 이쪽으로 집중되고 있습니다. 특히 최근에는 약물 대사 관련 유전자들을 한번에 검사 가능한 NGS 패널도 개발되면서, 많은 변이들을 한번에 찾아낼 수 있게 되었죠.

그림1
[F-CAP 프로젝트] 개인별 약물 반응을 예측하기 위해서는 개인별로 발견된 변이가 약물 유전자에 어떤 기능적 차이를 만들어내는지 알아야합니다. 이를 위해서는 모든 가능한 변이에 대한 기능적 변화를 측정한 데이터 베이스 구축이 필요합니다.
그러나 이러한 데이터가 점점 쌓이면서, 해석에 문제가 생기게 되었습니다. 즉 이전에 보고되지 않은 많은 변이들이 발견되었는데, 이게 약물 대사 효소의 기능에 어떠한 영향을 미치는지 정확하게 알기 어려운 상황에 직면하게 된 것입니다. 사실 이전에 보고된 논문에서 실험을 통해 확인되었던 변이들은 어느 정도 그 효과를 예상할 수 있었지만, 처음 발견되는 변이들이 너무 많다보니 변이의 효과를 제대로 예측하기 불가능했던 것입니다. 그래서 F-CAP 프로젝트는 약물 유전자에 가능한 모든 단백질의 변이들에 대해서 그 기능적 변화를 측정하여, 데이터 베이스를 구축하고자 하는 프로젝트입니다. 이렇게 되면 새로운 변이가 발견되었을 때도 그 효과를 기존 데이터베이스를 통해서 예측할 수 있게 되니까요. 일종의 유전자 지도에 상응하는 기능적 지도를 만들고자하는 시도라고 볼 수 있죠. 사실 이것은 정밀 의료의 실현 측면에서 매우 중요한 의미를 가집니다. PGRN에서는 우선적으로 약물 대사에 중요한 유전자들에 대해서 이러한 시도를 시작했지만, 더 나아가 인간의 유전자 염기 서열 지도처럼, 결국은 모든 유전자들에 대해서 이러한 기능적 지도가 있어야 정밀 의료가 가능하다는 셈이죠.

그림2

F-CAP 프로젝트는 다음과 같은 5가지 단계로 기획되어 있습니다.

  1. Target Gene Prioritization: 약물 대사와 유전자 관계가 명확하며, 임상적 의의가 큰 CPIC Level A 약물-유전자 쌍에 대해, 우선적으로 연구를 진행하고 있습니다.
  2. Large-Scale Functional Assays: 모든 유전자 변이에 대해서 기능 검사를 해야하기 때문에, 매우 큰 스케일의 검사를 효율적이고 빠르게 시행할 수 있는 기술을 개발하고 적용해야 합니다.
  3. Variant Impact Score Calculation: 위에서 측정한 검사 결과를 토대로, 변이가 실제 정상에 비해 어느 정도의 영향을 미치는지를 표준화된 score로 계산해냅니다.
  4. Impact Score Validation: 이렇게 얻어낸 스코어를 통해 예측한 결과가 실제 임상 데이터에 유용하게 쓰일 수 있는지를 검증합니다.
  5. Data dissemination: 유전자 변이와 스코어를 하나의 커다란 데이터베이스로 구축하여, 누구나 열람할 수 있도록 합니다.

 

그림3.png
2017년 3월 현재, CPIC 가이드라인에서 제시하는 Level A (유전자와 약물 반응 간의 관계가 분명하게 입증된 수준) 유전자와 약물 쌍입니다.

한 가지 더 부연 설명을 추가하면, 2017년 3월 현재 CPIC 가이드 라인에서 유전자와 약물 대사 간의 명확한 관계가 입증된 쌍은 위의 16쌍이며, 계속적으로 추가가 되고 있습니다. 특히 약물 대사의 많은 부분은 Cytochrome P450이 관여하기 때문에, CYP 관련 유전자들이 많은 것을 볼 수 있습니다. 즉 F-CAP 프로젝트의 1단계는 CYP 관련 유전자에 대해서, 얼마나 효율적으로 모든 변이의 기능 변화를 측정하는가 하는 방향으로 진행될 것을 예상할 수 있습니다.

F-CAP 프로젝트는 현재 진행형이며, 아마 조만간 관련 논문이 나올 것으로 생각됩니다. 약물 유전자 기능 지도가 완성되면, NGS 검사를 통한 개인의 변이 검사 및 이를 임상에 활용하는 측면에서도 많은 도움이 기대가 됩니다. 또한 정밀 의료 실현의 측면에서도 약물 유전자 뿐 아니라 여러 질병 유전자들에 대해서도 비슷한 연구가 활발히 진행되어, 많은 유전자-형질 및 기능 관계가 밝혀지기를 기대합니다. 다음 번 포스팅에서는 실제로 이러한 연구가 진행된 사례와 그 연구 방법론에 대해서 글을 써 보도록 하겠습니다.

[참고 문헌]

Bush, William S., et al. “Genetic variation among 82 pharmacogenes: The PGRNseq data from the eMERGE network.” Clinical Pharmacology & Therapeutics 100.2 (2016): 160-169.

http://www.pgrn.org/functional-pharmacogenes.html