[책 소개] 유전자 사냥꾼, Genome: The Story of the Most Astonishing Scientific Adventure of Our Time–The Attempt to Map All the Genes in the Human Body

지난 한달 동안 육군훈련소로 기초 군사 훈련을 다녀왔습니다.  늦은 나이에 띠동갑 동생들과 군사 훈련을 받는게 육체적으로는 참 힘들었는데, 그래도 생각을 비우고 새롭게 다시 시작할 수 있는 계기가 된 것 같습니다. 논산 훈련소에서 새벽 3시에 복도에서 불침번을 서다가 우연히 책장에서 눈에 띈 책이 있는데, 그 책이 오늘 소개하고자 하는 ‘유전자 사냥꾼‘ 이라는 책입니다. 우연히 발견한 책이 제게 주말 시간의 단비 같은 존재가 되었는데, 주말 개인 정비 시간을 이용해서 참 재밌게 읽을 수 있었습니다.

이 책의 한국어판 제목은 ‘유전자 사냥꾼‘, 영문판 제목은 ‘Genome: The Story of the Most Astonishing Scientific Adventure of Our Time–The Attempt to Map All the Genes in the Human Body‘ 입니다.  이 책은 유전자의 발견과 유전자 지도를 작성하고자 하는 사람들의 노력을 그 당시 시대 상황과 함께 생생하게 그려내고 있습니다. 한국어판 초판 발행 일자를 살펴보니 무려 1995년!입니다 (영문판은 1990년). 25년 이상 지난 매우 오래된 책이지만, 유전자 지도를 완성하고자 하는 연구자들의 노력은 지금도 진행되고 있기에, 책의 내용은 아직까지도 유효한 것 같습니다.

이 책은 분자 생물학적 기법의 발견과 활용에 대한 역사적인 사건들을 소개함과 동시에, 이를 활용하여 사람들이 어떠한 시도를 했는지, 그리고 어떠한 실패와 좌절 속에서 지금에 이르렀는지를 담담하게 그려내고 있습니다. 오늘 날에 비추어 보면, 기법 상으로는 많이 뒤떨어져 있지만, 뒤떨어진 기법 (대부분 시퀀싱 대신에 유전체상의 tandem repeat 길이의 차이에 따른 RFLP 기법을 이용합니다.) 만을 활용해서도 어떻게 특정 유전자를 발견하고 이를 입증했는지를 보면서 당시의 노력에 감탄하게 됩니다.

대표적으로 소개하는 이야기 속에는 헌팅턴병과 근위축증, 그리고 가족성 암에 대한 이야기가 있는데, 교과서 속에서 딱딱하게 소개되었던 질병들이 실제로는 어떠한 배경 속에서 연구되었는지를 현실감 있게 그려내어 이해하는데 많은 도움을 주는 책입니다. 사실 지금도 기법만 시퀀싱으로 바뀌었을 뿐이지, 아직도 정확한 기전을 이해하지 못하고 있는 무수히 많은 질병에 대해서 연구자들은 비슷한 시도를 하고 있기에, 해당 이야기들은 연구자에게도 많은 영감을 준다고 생각합니다. 마치 역사 속에서 미래를 예측하고 배운다고 하는 것과 비슷한 맥락이라고 할까요?

관련 포스팅 보기>

[유전학 중요개념 정리] Tandem repeat: STR and VNTR

닥터 프리즈너 속 헌팅턴병의 유전학: 삼염기 반복 질환과 Anticipation

휴먼 게놈 프로젝트, 그 이후.. 그리고 정밀 의료시대까지

책의 마지막 부분은 Human Genome Project에 대한 이야기와 시퀀싱 및 유전체 기술의 진보로 미래에 어떠한 변화가 일어날지에 대해서 예상하고, 대비해야할 부분들에 대한 언급이 있는데, 이미 25년이 지난 지금 시점에서 과거에 예측했던 부분들이 얼마나 맞았는지, 그리고 어떻게 다른지를 생각해보면서 책을 읽었습니다. 이러한 부분들에서 거꾸로 앞으로 25년 후에는 어떠할지를 예측해보는 것도 재미난 포인트 인 것 같습니다.

해당 책은 비록 지금은 절판되어 구매가 불가능 하지만, 아마존 등을 통해서 영문판을 구매하거나, 중고 서점에서 한국어판을 구할 수 있는 것 같습니다. 관심이 있는 분들께는 꼭 한번 읽어보시라고 추천하고 싶습니다.

 

[Reference]

Waldholz, Michael, and J. Bishop. Genome: the story of the most astonishing scientific adventure of our time–the attempt to map all the genes in the human body. Simon and Schuster, 1990.

 

암유전체 분석: Driver mutation prediction tools

이전 포스팅에서 암에서 발생하는 mutation을 driverpassenger로 구분하는 개념에 대해서 언급했습니다. 이번에는 실제로 시퀀싱을 진행했을 때 검출되는 많은 변이들을 실제 암 발생의 driver와 passenger를 구분하는 방법과 다양한 툴들에 대해서 정리해 보고자합니다.

관련 포스팅 보기>

[유전학 중요개념 정리] Driver vs. Passenger mutation in cancer

[유전학 중요개념 정리] Mutational signature

사실 Somatic mutation이나 Germline mutation이나 질병 발생의 원인 유전자와 변이를 찾는 방법이라는 데에서 큰 틀의 접근 방법은 동일합니다.  Germline 변이를 판독하는 큰 틀을 제시하는 가이드라인이 ACMG guideline이라고 한다면, Cancer 변이 판독의 기준으로는 흔히 AMP/ASCO/CAP guideline의 Tier system이 사용되고 있습니다. 즉, 개별 변이들을 아래와 같이 증거 수준과 임상적 중요도 등에 따라 Tier 1~4로 구분을 하여, 중요도가 높은 변이들을 임상적으로 활용하는 것이지요. 하지만, 이 역시도 한계가 많고 구분도 모호하기 때문에, 실질적으로 검출된 변이들의 driver mutation을 예측할 수 있는 다양한 툴들이 개발되고 있습니다.

1
[Somatic variant 변이 판독을 위한 AMP/ASCO/CAP guideline에 따른 Tier classification]

NGS를 시행하게 되면, 다양한 변이들이 쏟아져 나오게 됩니다. 이때 해당 변이의 판독은 크게 아래와 같은 접근법을 이용하게 됩니다.

  1. 기존의 암에서 자주 보고된 알려진 변이인가? Database에 이미 널리 알려진 변이 (매우 소수)
  2. Database에 등록 되어 있지는 않지만, 정상 인구 집단에서는 관찰되지 않는 매우 드문 변이인가? (Population genetics 관점에서 allele frequency)
  3. 여러가지 in-silico prediction tool이 해당 변이의 deleterious effect를 예측하고 있고, 해당 변이가 단백질의 매우 중요한 3차원적 위치에 있는 경우 (Mutational hot-spot, Functional genetics 관점에서 protein의 기능 및 domain)

 

이러한 접근법에 근거하여 다양한 tool들이 개발되고 있으며, 대표적으로 널리 쓰이는 몇가지 tool들을 소개하며, 이번 포스팅은 마치고자 합니다. NGS 검사를 통해 검출된 변이에 아래의 DB에서 제공하는 다양한 정보를 annotation하고, 이에 근거하여 driver mutation을 예측하게 됩니다.

I. COSMIC (https://cancer.sanger.ac.uk/cosmic)

Wellcome Sanger Institute에서 제공하고 있는 암 유전체 관련 DB입니다. 보통 개별 변이마다 DB에 등록되면서 COSMIC ID가 부여되는데, 가장 방대한 DB를 구축하고 있어서 새로운 변이들을 확인할 때 가장 먼저 살펴보게 되는 DB입니다.

 

II. cBioPortal (http://www.cbioportal.org/)

다양한 암종과 TCGA cancer genome 데이터를 기반으로 하여, 보고된 다양한 mutation에 대한 정보들을 제공하고 있습니다. 대표적이고 유명한 paper들에 사용된 cancer genome DB를 포함하고 있고, 실제 유전자들의 functional domain과 hot-spot 정보들을 함께 제공하고 있어서 유용하게 이용할 수 있는 DB입니다.

 

III. OncoKB (https://oncokb.org/)

Memorial Sloan Kattering Cancer Center에서 구축한 DB로 조금 더 임상적으로 중요한 변이들이 명확하게 curation 되어 있습니다. 임상적으로 중요하고 근거 수준이 명확한 변이들을 Level에 따라서 잘 정리한 장점이 있으나, 변이 데이터는 상대적으로 조금 빈약한 편입니다.

 

IV. Cancer Genome Interpreter (https://www.cancergenomeinterpreter.org)

이미 구축된 다양한 DB와 기존 논문 보고 데이터들을 통합하여, 변이들의 driver mutation 여부를 종합적으로 잘 판독해주는 툴로 유용하게 사용할 수 있습니다. 다만, 프로그램이 공개되어 있지 않고 서버에 직접 본인의 데이터를 업로드하여야 하고 한번에 업로드할 수 있는 변이의 수가 5,000개로 제한되어 있는 점은 단점이라고 할 수 있습니다.

 

V. MutaGene (https://www.ncbi.nlm.nih.gov/research/mutagene/)

가장 최근에 개발된 tool로 Python package도 제공되어 있어, 따로 서버에 자료를 올리지 않고 설치해서 바로 사용할 수 있는 장점이 있습니다. Driver mutation 예측 외에도 Mutational signature 분석도 함께 할 수 있어서, 유용한 정보를 제공하고 있습니다.

 

위의 내용을 살펴보면, 아직까지 완벽한 변이 판독 방법은 없구나 하는 것을 느끼게 됩니다. 사실 이전에 약물 유전자와 관련된 연구에 대해 포스팅 했었는데, 비슷한 연구가 암 관련 유전자에 대해서도 함께 진행 중입니다. 따라서 최근의 연구 추세는 다양한 변이의 임상적 판독을 위한 충분한 정보를 제공할 수 있는 대용량 변이 판독 방법에 집중되고 있으며, Functional genomics 분야의 큰 부분을 차지하며 연구비가 몰리고 있는 상황입니다.

관련 포스팅 보기>

약물유전체 정밀의료의 실현, F-CAP 프로젝트

유전자 변이의 해석: 대용량 기능 검사의 필요성

 

[References]

Li, Marilyn M., et al. “Standards and guidelines for the interpretation and reporting of sequence variants in cancer: a joint consensus recommendation of the Association for Molecular Pathology, American Society of Clinical Oncology, and College of American Pathologists.” The Journal of molecular diagnostics 19.1 (2017): 4-23.

[유전학 중요개념 정리] Mutational signature

암 발생의 대부분은 Somatic mutation으로 생각하고 있습니다. 사람이 살아가면서 다양한 주변 환경에 노출되고 이로 인해 DNA 손상을 받게되면서, 돌연변이가 축적이 되고 어느 한계를 넘어서는 순간 암세포로 자라나게 된다는 개념이지요. 이러한 암유전체 분야에서는 다양한 암종에서 어떤한 돌연변이가 발생하는지에 대한 Mutational signature 연구가 많이 되어 있는데, 2013년에 Nature에 관련 논문이 실린 이후 암 유전체 분야에서 Mutational signature 연구는 거의 필수로 요구되는 분위기인 듯 합니다.

여기서 Mutational signature특정 암종에서 발생하는 돌연변이의 종류에는 특정 패턴이 존재한다는 개념입니다. 구체적으로 돌연변이의 발생 원인 (mutagen exposure)에 노출된 후, 이러한 특정 DNA 손상 기전에 의해 아래와 같은 패턴(Mutational signature)이 나타나고, 결과적으로 암종으로 발생한다는 개념인 것이죠.

nature12477-f2
[Mutational Signature] 암종별로 발생하는 염기 치환 돌연변이들을 특징별로 다양한 패턴으로 나타낸 그림입니다.

이러한 연구는 아래 Science에 실린 논문과 같이 흡연에 의한 특정 암 발생의 위험도가 증가하는 것을 설명하는 많은 근거를 제공해줍니다. 즉, DNA 손상이 어떠한 기전에 의해서 발생했는지에 대한 흔적을 통해서, 암 발생의 원인과 기전에 대한 유추를 가능하게 합니다. 따라서 최근의 대부분의 암유전체 분석 논문에서는 거의 필수적으로 해당 분석 결과를 제시하는 추세입니다.

Picture1
[Mutational signature 활용 예] 흡연에 의한 대표적인 돌연변이 발생 패턴과 이를 통해, 관련 암종들의 발생 위험도가 증가함을 설명해준 논문의 Figure 입니다.

이러한 Mutational signature에 대한 정보는 아래의 Sanger Institute에서 제공하는 COSMIC 웹 사이트에서 더 자세하게 나와 있습니다.

COSMIC 웹사이트 방문하기: Signatures of Mutational Processes in Human Cancer

다음 포스팅에서는 이러한 Mutational signature 분석과 관련된 R package와 코드에 대해서 정리하기로 하고, 이번 포스팅은 여기에서 마치도록 하겠습니다.

 


[Reference]

Alexandrov, Ludmil B., et al. “Signatures of mutational processes in human cancer.” Nature 500.7463 (2013): 415.

Alexandrov, Ludmil B., et al. “Mutational signatures associated with tobacco smoking in human cancer.” Science 354.6312 (2016): 618-622.