제 14차 CBMC 희귀질환 센터 화상 컨퍼런스 강의 자료

[07.15(수)]_제14차_CBMC_희귀질환_센터_화상_컨퍼런스

COVID-19는 학회와 강의의 풍경도 많이 바꾸어 놓은 것 같습니다. 개인적으로는 Zoom을 이용하여 화상 인터뷰 및 미팅 등은 한 적이 있는데, 온라인 강의는 이번이 처음입니다.

의국 선배님으로 부터 NGS에 대한 기초적인 개괄에 대한 강의를 부탁받아, 분당 차병원 임상과 선생님들을 대상으로 강의 자료를 준비하였습니다. 강의 자료가 필요하신 분들을 위해 블로그에도 업로드 합니다. (사용은 자유롭게 하시되, 출처만 명시해주시기 바랍니다.)

관련 포스팅 보기>

임상의를 위한 NGS 레포트 해석의 이해

바이오 연구자를 위한 Genome Browser 비교 및 활용

NGS 결과의 임상 적용: Genotype-phenotype correlation

NGS 분석 파이프 라인의 이해: GATK Best Practice

Annovar: Population frequency, in-silico prediction tool 및 기타 database 활용

강의 자료 다운로드 > CBMC conference

광고

NGS 결과의 임상 적용: Genotype-phenotype correlation

최근에 병원의 의료 현장에서 NGS 타겟 시퀀싱 패널을 이용하면서 다양한 유전자들을 동시에 검사하는 건수가 폭발적으로 증가하고 있습니다. 다만 안타깝게도 많은 경우에 실제로 그 유전체 정보와 데이터를 충분히 활용하지 못하고 있음을 많이 느낍니다. 즉, 돈을 들여서 구축된 파이프 라인을 통해서 유전체 데이터 생산은 되는데, 이후에 변이들에 대한 적절한 해석을 하고, 환자에 적용하는데 까지는 아직 더 경험이 필요한 것 같습니다. 그래서 이번 글에서는 매우 중요한 개념인 유전형-표현형 일치 (Genotype-Phenotype correlation; G-P correlation)에 대한 포스팅을 남기고자 합니다.

관련 포스팅 보기>

NGS 검사: Whole Genome & Exome, Targeted Sequencing 비교

임상의를 위한 NGS 레포트 해석의 이해

 

I. Genotype-Phenotype correlation 의 개념

NGS 검사를 직접 해보면, 환자 한명에서도 엄청나게 많은 수의 변이들이 쏟아져 나옵니다. 여러가지 컴퓨터 예측 알고리즘이나 기존에 보고되어 구축된 유전체 데이터 베이스를 통해, 해당 변이가 실제로 질병을 일으키는 변이인지에 대해서 확인을 하고, 해당 결과가 NGS 검사 결과 보고서를 통해서 임상 의사에게 보고됩니다. 그러나, 이때 보고서의 다양한 변이 리스트를 보고, 실제로 환자에서 질병을 일으키는 유전자 이상이 무엇인지를 판단하는 것은 의사의 몫입니다.

이때 가장 중요한 것은 환자가 나타내는 임상 양상이 실제로 해당 유전자의 이상으로 발생하는 임상 양상과 일치하는가? 입니다. 나의 환자가 NGS 검사를 통해 확인된 유전형(Genotype)으로 인해 특정 유전자의 이상이 의심되고, 해당 유전자의 이상으로 알려진 질병 또는 임상 양상이 실제 나의 환자에서 나타나는 임상 양상(표현형, phenotype)과 일치하는가를 판단하는 전반적인 과정이 바로 G-P correlation이 되겠습니다. 원래는 해당 질병의 전문가가 종합적으로 판단하여야 하는데, 임상 유전학자들의 수는 매우 제한적이기 때문에, 환자의 주치의도 이러한 판단을 할 수 있어야 하기 때문에, 기본적인 유전학적 지식이 필수로 요구됩니다.

 

II. Genotype-Phenotype correlation의 접근 과정

NGS 검사를 통해 환자의 다양한 변이 정보를 얻었고, 임상 증상과 의심되는 질병도 있습니다. 이때 진단을 위한 마지막 퍼즐을 풀 차례입니다. 제일 먼저 할 과정은 환자에서 검출된 병적 변이에 의해서 실제로 보고된 임상 양상과 질병이 무엇인가를 확인하는 것입니다. 다양한 데이터 베이스가 있으나, 가장 광범위하고 무난하게 활용할 수 있는 곳은 아래의 두곳입니다. 아래 사이트에서 가장 먼저 확인해야할 것은 유전 양식(AD, AR, XLD, XLR 등등)과 질병을 일으킨 것으로 알려진 병적 변이에 대한 정보 입니다.

1

  • Online Mendelian Inheritance in Men (OMIM) : 사람의 유전질환들에 대한 다양한 데이터를 제공하기 위해 만들어졌습니다. 유전 양상과 대표적인 케이스 논문들에 대해서 바로 링크를 제공하기 때문에 유용합니다.
  • Gene Reviews : 좀 더 다양한 임상 양상들에 대해서 유전자 단위로 좀 더 상세하고 종합적으로 서술되어 있어, 배경 지식을 얻는데 더 좋습니다.

위의 사이트에서 우리 환자에서 검출된 유전자로 검색을 해서, 실제로 어떤 질병과 임상 양상이 보고되었었는가를 확인합니다. 또한 해당 유전자가 나타내는 임상 양상의 특징이 무엇인지를 파악해야합니다.

 

III. Genotype-Phenotype correlation이 안될 경우의 해석법

위와 같은 과정을 여러번 거치다 보면 다양한 상황에 마주하게 됩니다. 실제 병적 변이도 확인하고, 임상 양상도 잘 일치해서 환자를 진단하면 가장 좋겠지만, 여전히 모호한 경우를 많이 마주하게 됩니다.

  • 유전 양식이 잘 일치하는가? : 환자에서 변이가 homozygote 인지, heterozygote인지 그리고 알려진 질병 발생이 상염색체 우성 (AD)인지 상염색체 열성(AR)인지 잘 살펴본다. AR로 알려진 질병은 경우에 따라서 Compound heterozygote의 가능성도 있으므로, 추가적으로 다른 변이도 검출되지 않았은지 따져 본다.

> [유전학 중요개념 정리] Compound Heterozygote

  • 임상 양상과 해당 유전자가 의심되지만, 환자에서 검출된 변이가 실제로 병적 변이인지 모호한 경우: 1) 변이 빈도를 확인한다. : 인구 집단에서 흔한 변이이면 크게 의미가 없다. > 매우 드물거나 보고된 적이 없는 변이의 경우, 2) 환자의 부모에서 해당 변이 존재 유무를 확인하는 가족 검사를 실시한다. 만약 부모도 같은 변이를 가지고 있고 정상이라면, 질병과 관계가 없을 가능성이 높다. 그러나 일부는 투과도 (Penetrance)가 100%가 아니기 때문에 항상 그런 것은 아니다. 3) 관련 논문을 검색한다. > 논문을 잘 찾아보면 최소한의 실마리를 얻을 수 있다.

 

Genotype-Phenotype correlation 과정 자칫 환자를 잘못 진단하는 결과를 일으킬 수 있기때문에 매우 중요한 과정입니다. 그러나 이러한 과정을 통해 NGS 검사 결과를 적절히 해석하고 임상 진료에 활용하는 의사는 매우 제한적입니다. 임상 진료 현장에서 많은 의사들이 이러한 유전체 데이터를 활용하여 환자들을 적절히 진단하고 치료 하기를 소망합니다. 위에서 언급한 것 외에도 다양한 접근법이 있을 수 있으나, 분량이 너무 길어지기 때문에 이번 포스팅은 여기서 마무리하도록 하겠습니다.

임상의를 위한 NGS 레포트 해석의 이해

최근에 친한 선배께서 환자의 NGS 검사 레포트를 보면서, 저에게 이것 저것 물어보는 일이 잦아졌습니다. 항상 귀찮게 해서 미안하다고 하시지만, 저의 지식이 도움이 될 수 있다는 즐거움과 이렇게 좋은 쓸 거리를 제공해주셔서, 이 자리를 빌어 감사의 말을 드립니다. 이번 포스팅은 최근 병원에서 검사 건수가 많이 늘어난 NGS 검사의 결과 레포트를 보기 위한, 기본적인 이해와 해석을 위한 지식을 포스팅해보고자 합니다.

NGS 검사는 워낙 최근에 새로 생겨난 검사이다 보니, 의사 선생님들이라 하더라도 결과 레포트 해석에 많은 어려움을 토로하고 있습니다 (의대에서 가르치지 않는 지식). 이전에 생거 시퀀싱으로 단일 유전자를 검사 하는 경우는 있었지만, 매우 드물고 검출된 변이 수가 적었기에 크게 문제가 되지 않았습니다. 그러나 NGS의 시대가 도래하면서, 환자로 부터 타깃 시퀀싱을 통해 100여개의 유전자를 한꺼번에 검사하다 보니 거기서 나오는 변이의 수도 많고, 그 임상적 의미에 대해서도 복잡하여 해석이 어려운 경우가 많습니다.

관련 포스팅 보기>

휴먼 게놈 프로젝트, 그 이후.. 그리고 정밀 의료시대까지

NGS 검사: Whole Genome & Exome, Targeted Sequencing 비교

 

HGVS (Human Genome Variation Society) nomenclature

: 유전자의 변이를 기술하는 약속입니다. 레포트가 의미하는 바를 알기위해서 기본적인 HGVS nomenclature 숙지가 필요합니다. 더 자세한 정보는 http://varnomen.hgvs.org/recommendations/general/에서 찾으시길 바랍니다.

gr2

  • c.1526C>T: c는 coding sequence를 의미합니다. 즉, 어떤 유전자의 아미노산을 코딩하는 1526번째 염기가 C에서 T로 바뀌었다는 의미입니다.
  • c.154-10G>T, c.194+7G>T: (-) 표시와 (+) 표시의 의미. c는 coding sequence를 나타내므로, 엑손 영역만 나타나게 됩니다. intron 영역의 염기를 표현할 때는 가장 가까운 엑손 영역의 염기를 기준으로 (-) 표시와 (+) 표시로 나타낼수 있습니다. c.154-10G>T은 154번째 코딩 유전자로부터 인트론 영역으로 10개의 bp 위쪽, c.194+7G>T는 194번째 코딩 유전자로부터 7개의 bp 아래쪽을 의미합니다.
  • c.92_94del, c.92_94delGGA: coding sequence 중에 92번째부터 94번째까지 3개의 염기 (GGA)에서 결손(deletion)이 일어났다.
  • c.92_94dup, c.92_94dupGGA: coding sequence 중에 92번째부터 94번째까지 3개의 염기 (GGA)가 중복(duplication)되어 나타난다.
  • c.51_52insT: 51번째와 52번째 coding sequence의 사이에 T가 삽입(insertion)되었다.

 

  • p.Ala132Pro, p.A132P: p는 protein을 의미합니다. 즉, 132번째 아미노산이 Ala에서 Pro으로 바뀌었다. 이 경우, missense variant에 해당합니다.
  • p.Ala132=: 132번째 아미노산이 Ala이며, 아미노산에 변화가 없다. 이 경우 synonymous variant에 해당합니다.
  • p.(Arg97Profs*23), p.(Arg97ProfsTer23): fs는 frame shift를 의미합니다. 즉, 프레임이 전체적으로 바뀌면서 97번째 아미노산이 Arg에서 Pro으로 바뀌고, 새로 바뀐 프레임에 의해 뒤로 23번째에 (120번째 위치) 종결 코돈 (Termination; Ter)이 나타난다는 의미입니다.

reportingMutations

 

Variant Interpretation

  • rsID (ex. rs3952537): rs는 Reference SNP을 의미합니다. 즉, reference 시퀀스를 기준으로 다른 변이에 하나의 ID를 부여했다고 할 수 있습니다. 이러한, rsID를 이용하면 해당 변이의 위치, 염색체, 해당 유전자, 인종별 분포 등 다양한 정보를 검색하기 용이합니다. 2018년 10월에 공개된 dbSNP152 database는 총 6억5천만개의 변이에 대한 정보를 제공하고 있습니다.
  • 유전 정보 검색 브라우져를 통한 변이 정보 검색: 네이버나 구글과 같은 검색 툴처럼 유전 정보에 대한 검색 툴도 많이 개발되어 있습니다. 대표적으로 Ensemble Genome browser, ExAC browser, UCSC browser 등이 있습니다. 해당 홈페이지에서 위의 rsID를 이용하면, 다양한 추가적인 정보를 얻을 수 있습니다. 저는 개인적으로 VarSome 이라는 사이트가 보기 편해서, VarSome을 주로 이용하고 있습니다.

 

 

acmg
ACMG 가이드라인에 따른 변이의 5단계 분류. 결과 보고지에는 보통 VUS 이상의 변이가 포함됩니다.
  • ACMG Classification: Pathogenic, Likely Pathogenic, VUS (Variant of Uncertain Significance) – ACMG (American College of Medical Genetics)라는 단체에서 정한 변이 분류 기준에 따라 해당 변이를 분류한 것입니다.
  • VUS : 쉽게 말해, 해당 변이의 의미를 정확히 모르겠다. 라고 생각하면 됩니다. ‘아직까지 명확한 임상적 증거가 없는, 잘 모르겠는 애매한 변이입니다’ 라는 뜻으로 해석하시면 됩니다. 사실 질병과 변이의 관계가 명확하게 밝혀진 것은 전체 변이의 1% 정도 밖에 되지 않습니다. 때문에, 대부분의 변이가 VUS로 분류될 수 밖에 없습니다.
  • In silico tool score – SIFT, PolyPhen-2 등등: 아미노산의 치환에 의해 단백질 구조와 기능이 영향을 받을지 예측하는 컴퓨터 알고리즘이 100개 이상 존재합니다. 시퀀싱 레포트에서 종종 추가적으로 이러한 툴을 이용하여 예측한 해당 변이의 기능 정보를 추가하고 있습니다. SIFT는 0에 가까울수록, PolyPhen-2는 1에 가까울수록 문제가 있는 병적 변이일 가능성이 높다고 예측합니다. 다만 이러한 정보는 참고를 위한 정보이기 때문에, 진료를 위해 활용하기는 어렵습니다.

 

PMC2875051_ddq16201
변이 빈도가 중요한 이유는, 드문 변이일수록 형질에 영향을 더 크게 미칠 확률이 높아지기 때문입니다.
  • Allele frequency: 해당 변이의 일반 인구 집단에서의 분포 빈도를 나타냅니다. 보통 1% 미만의 변이를 rare variant, 그보다 큰 경우는 common variant로 분류합니다. 변이 빈도가 중요한 이유는 rare variant 일수록, effect size가 커서 실제 병적 변이로 의심해봐야할 가능성이 높아지기 때문입니다. 그러나 변이 빈도를 산출해낸 인구 집단의 크기와 조성(ExAC, gnomAD 등)에 따라, 인종 및 성별에 따라 변이 빈도는 천차 만별인 경우도 많음을 유의해야합니다. 우리 나라에서는 대규모 한국인에서의 변이 빈도를 참고하는 것이 좋겠지만, 아쉽게도 한국인의 인구 집단 데이터 (KRGDB, KOVA 등)는 아직 크기가 작아서 참고용으로 많이 사용되고 있습니다.
  • Inheritance pattern – AD (Autosomal Dominant, 상염색체 우성), AR (Autosomal Recessive, 상염색체 열성), XD (X-linked Dominant, X 염색체 우성), XR (X-linked Recessive, X 염색체 열성) 등의 대표적 멘델 유전 양식을 나타냅니다.
  • De novo variant란? (라틴어로 de novo는 ‘of new’를 의미) 즉, 부모로부터 유전되지 않고, 정확한 원인을 모르지만 환자에서 새로이 나타난 변이를 일컫습니다. 환자에서 De novo variant가 있는 경우에는 환자의 질병의 원인이 되는 변이로 의심해볼 가능성이 높아집니다. 이런 경우에는 부모로부터 유전되었는지, de novo 인지를 확인하기 위해 유전 상담 및 부모의 가족 검사를 추천하기도 합니다.

 

관련 포스팅 보기>

바이오 연구자를 위한 Genome Browser 비교 및 활용

NGS 결과의 임상 적용: Genotype-phenotype correlation

아미노산 치환의 효과 예측: In silico tool의 원리와 종류

[유전학 중요개념 정리] De novo mutation의 발생 기전과 질병 발생학적 의의

 

Conclusion: 음.. 어떻게 해석할까?

임상 선생님들은 간결하고 명확한걸 좋아합니다. 하지만 생각보다 변이와 질병 관계가 명확한게 별로 없고 모르는게 많습니다. 그러다보니 검출된 변이는 많이 보고하지만, 그에대한 해석은 결국 환자의 임상 증상에 맞게 통합적으로 내릴수 밖에 없습니다. 이 부분은 임상의의 경험과 안목이 필요합니다. 일반적으로 이러한 과정을 Genotype-Phenotype correlation (유전형-표현형 일치) 라고 하는데, 현재도 많은 연구자들이 이 관계를 밝히기 위해 노력하고 있습니다.

 


[References]

Richards, Sue, et al. “Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology.” Genetics in medicine 17.5 (2015): 405-423.

Rehm, Heidi L., et al. “ACMG clinical laboratory standards for next-generation sequencing.” Genetics in medicine 15.9 (2013): 733-747.