암유전체 분석: Driver mutation prediction tools

이전 포스팅에서 암에서 발생하는 mutation을 driverpassenger로 구분하는 개념에 대해서 언급했습니다. 이번에는 실제로 시퀀싱을 진행했을 때 검출되는 많은 변이들을 실제 암 발생의 driver와 passenger를 구분하는 방법과 다양한 툴들에 대해서 정리해 보고자합니다.

관련 포스팅 보기>

[유전학 중요개념 정리] Driver vs. Passenger mutation in cancer

[유전학 중요개념 정리] Mutational signature

사실 Somatic mutation이나 Germline mutation이나 질병 발생의 원인 유전자와 변이를 찾는 방법이라는 데에서 큰 틀의 접근 방법은 동일합니다.  Germline 변이를 판독하는 큰 틀을 제시하는 가이드라인이 ACMG guideline이라고 한다면, Cancer 변이 판독의 기준으로는 흔히 AMP/ASCO/CAP guideline의 Tier system이 사용되고 있습니다. 즉, 개별 변이들을 아래와 같이 증거 수준과 임상적 중요도 등에 따라 Tier 1~4로 구분을 하여, 중요도가 높은 변이들을 임상적으로 활용하는 것이지요. 하지만, 이 역시도 한계가 많고 구분도 모호하기 때문에, 실질적으로 검출된 변이들의 driver mutation을 예측할 수 있는 다양한 툴들이 개발되고 있습니다.

1
[Somatic variant 변이 판독을 위한 AMP/ASCO/CAP guideline에 따른 Tier classification]

NGS를 시행하게 되면, 다양한 변이들이 쏟아져 나오게 됩니다. 이때 해당 변이의 판독은 크게 아래와 같은 접근법을 이용하게 됩니다.

  1. 기존의 암에서 자주 보고된 알려진 변이인가? Database에 이미 널리 알려진 변이 (매우 소수)
  2. Database에 등록 되어 있지는 않지만, 정상 인구 집단에서는 관찰되지 않는 매우 드문 변이인가? (Population genetics 관점에서 allele frequency)
  3. 여러가지 in-silico prediction tool이 해당 변이의 deleterious effect를 예측하고 있고, 해당 변이가 단백질의 매우 중요한 3차원적 위치에 있는 경우 (Mutational hot-spot, Functional genetics 관점에서 protein의 기능 및 domain)

 

이러한 접근법에 근거하여 다양한 tool들이 개발되고 있으며, 대표적으로 널리 쓰이는 몇가지 tool들을 소개하며, 이번 포스팅은 마치고자 합니다. NGS 검사를 통해 검출된 변이에 아래의 DB에서 제공하는 다양한 정보를 annotation하고, 이에 근거하여 driver mutation을 예측하게 됩니다.

I. COSMIC (https://cancer.sanger.ac.uk/cosmic)

Wellcome Sanger Institute에서 제공하고 있는 암 유전체 관련 DB입니다. 보통 개별 변이마다 DB에 등록되면서 COSMIC ID가 부여되는데, 가장 방대한 DB를 구축하고 있어서 새로운 변이들을 확인할 때 가장 먼저 살펴보게 되는 DB입니다.

 

II. cBioPortal (http://www.cbioportal.org/)

다양한 암종과 TCGA cancer genome 데이터를 기반으로 하여, 보고된 다양한 mutation에 대한 정보들을 제공하고 있습니다. 대표적이고 유명한 paper들에 사용된 cancer genome DB를 포함하고 있고, 실제 유전자들의 functional domain과 hot-spot 정보들을 함께 제공하고 있어서 유용하게 이용할 수 있는 DB입니다.

 

III. OncoKB (https://oncokb.org/)

Memorial Sloan Kattering Cancer Center에서 구축한 DB로 조금 더 임상적으로 중요한 변이들이 명확하게 curation 되어 있습니다. 임상적으로 중요하고 근거 수준이 명확한 변이들을 Level에 따라서 잘 정리한 장점이 있으나, 변이 데이터는 상대적으로 조금 빈약한 편입니다.

 

IV. Cancer Genome Interpreter (https://www.cancergenomeinterpreter.org)

이미 구축된 다양한 DB와 기존 논문 보고 데이터들을 통합하여, 변이들의 driver mutation 여부를 종합적으로 잘 판독해주는 툴로 유용하게 사용할 수 있습니다. 다만, 프로그램이 공개되어 있지 않고 서버에 직접 본인의 데이터를 업로드하여야 하고 한번에 업로드할 수 있는 변이의 수가 5,000개로 제한되어 있는 점은 단점이라고 할 수 있습니다.

 

V. MutaGene (https://www.ncbi.nlm.nih.gov/research/mutagene/)

가장 최근에 개발된 tool로 Python package도 제공되어 있어, 따로 서버에 자료를 올리지 않고 설치해서 바로 사용할 수 있는 장점이 있습니다. Driver mutation 예측 외에도 Mutational signature 분석도 함께 할 수 있어서, 유용한 정보를 제공하고 있습니다.

 

위의 내용을 살펴보면, 아직까지 완벽한 변이 판독 방법은 없구나 하는 것을 느끼게 됩니다. 사실 이전에 약물 유전자와 관련된 연구에 대해 포스팅 했었는데, 비슷한 연구가 암 관련 유전자에 대해서도 함께 진행 중입니다. 따라서 최근의 연구 추세는 다양한 변이의 임상적 판독을 위한 충분한 정보를 제공할 수 있는 대용량 변이 판독 방법에 집중되고 있으며, Functional genomics 분야의 큰 부분을 차지하며 연구비가 몰리고 있는 상황입니다.

관련 포스팅 보기>

약물유전체 정밀의료의 실현, F-CAP 프로젝트

유전자 변이의 해석: 대용량 기능 검사의 필요성

 

[References]

Li, Marilyn M., et al. “Standards and guidelines for the interpretation and reporting of sequence variants in cancer: a joint consensus recommendation of the Association for Molecular Pathology, American Society of Clinical Oncology, and College of American Pathologists.” The Journal of molecular diagnostics 19.1 (2017): 4-23.

[유전학 중요개념 정리] Driver vs. Passenger mutation in cancer

암유전체 분석 과정에서 가장 어려운 점은 과연 어떤 유전적 변화가 암 발생의 원인이 되었는가를 밝혀내는 것입니다. 왜냐하면 대부분 검출되는 유전적 변화는 살아가면서 누적된 체세포 변이들의 결과로 암 발생의 직접적 원인이 아니기 때문입니다. 그래서 이번 글에서는 암유전체 중요 개념인 Passenger mutationDriver mutation에 대해서 정리해 보고자 합니다.

관련 포스팅 보기>

[유전학 중요개념 정리] Germline vs. Somatic mutation

우리는 살아가면서 다양한 환경에 노출 (햇빛, 담배, 매연, 약물 등등)되고, 체세포들은 변이들을 누적 (Somatic mutation) 시킵니다. 삶은 곧 변이인 셈이지요. 이렇게 누적된 변이들은 정상적으로 노화라는 과정을 거치게 됩니다. 그러나 운이 나쁘게도 변이가 발생하는 과정이 암 발생과 연관된 유전자의 스위치를 키게되면, 그때부터 암으로 진행될 수도 있죠.

즉, 암의 발생과 진행을 촉진하고 이끌어 나가는 돌연변이Driver mutation이 되고, 암의 발생과 분열에는 영향이 없지만 Driver mutation에 의해 암이 진행되는데 함께 따라오는 mutation들을 Passenger mutation이라고 합니다. 아래의 일련의 tumor progression 과정을 생각해보면, 왜 이름을 Driver와 Passenger라고 부르는지 쉽게 이해할 수 있습니다.

cancer driver

Driver mutation에 관여되는 유전자는 크게 OncogeneTumor suppressor gene으로 구분할 수 있습니다. 즉, 기능적으로 항진되면 직접적으로 암 발생을 촉진시키는 유전자Oncogene, 암 발생을 억제 시키고 있던 수문장과 같은 역할이 Tumor suppressor가 됩니다. 즉, Driver mutation은 Oncogene에 발생하는 Gain of Function 또는 Tumor suppressor gene에 발생하는 Loss of Function에 의해서 유발될 수 있습니다. 암의 분화에는 다양한 driver mutation들이 관여하고, driver mutation의 종류에 따라 점차 다양한 능력을 획득하게 됩니다. 예를 들면, 암 발생 초기에는 전이의 능력이 없다가, 암 발생 후기에는 장기 이곳 저곳으로 전이하는 능력을 갖는다던지 하는 식이죠.

최근의 연구에 따르면, Passenger mutation은 오히려 암 발생과 진행을 억제하는 역할이 있다고 합니다. 운전자(Driver)가 데려가야할 승객들(Passenger)이 많아지면 Driver의 입장에서는 더 버거울 수도 있겠죠. 대부분의 Passenger mutation은 유전적 불안정성 (Genomic instability)에 기인하여 발생하게 되는데, Passenger mutation이 너무 많이 쌓이면, 암으로 진행되어 증식되기보다는 사멸하는 방향으로 갈 확률이 높아질 것이기 때문에, 어찌보면 당연하게 생각됩니다.

 

다음 포스팅에서는 유전체 분석 과정에서 어떻게 Driver와 Passenger를 구분하는지에 대해서 다루도록 하고, 이번 포스팅은 여기서 마치도록 하겠습니다.

 

[Reference]

Pon, Julia R., and Marco A. Marra. “Driver and passenger mutations in cancer.” Annual Review of Pathology: Mechanisms of Disease 10 (2015): 25-50.

McFarland, Christopher D., et al. “The damaging effect of passenger mutations on cancer progression.” Cancer research (2017).