[논문 소개] 담관암(Biliary Tract Cancer)의 정밀 의료 실현을 위한 연구

작년부터 미국에 오기 직전까지 부랴부랴 리비젼을 하느라 너무 힘들었던 논문이 드디어 온라인 게제가 되어서, 소개를 해볼까합니다. 사실 이 프로젝트는 2017년부터 무려 햇수로는 4년간 끌어왔던 프로젝트인데, 그래도 이렇게 마무리를 짓고 소개를 할 수 있어서 다행입니다. 유전체 연구로 박사 과정을 막 시작하면서, 평소에 알고 지내던 김민환 교수님으로 부터 담관암 (Biliary Tract Cancer) 공동연구를 제안 받게 되었고, 매우 힘들고 지난했던 시간들을 겪으면서 마무리를 짓게 되었습니다.

[관련 논문 보기]

https://aasldpubs.onlinelibrary.wiley.com/doi/abs/10.1002/hep.31862

논문의 제목은 “Molecular Characterization of Biliary Tract Cancer Predicts Chemotherapy and PD‐1/PD‐L1 Blockade Responses“으로, 우리 나라를 포함한 동아시아에 호발하는 담관암의 약물 치료 (화학항암제와 면역항암제) 반응에 관한 유전체 연구입니다. 사실 이 블로그에도 이 연구를 진행하면서, 공부했던 많은 흔적들이 남아있기도 합니다.

[관련 포스팅 보기]

담관암은 그 해부학적 위치 때문에 매우 이질적이고, 같은 종류의 암도 유전적 특성이 다양합니다. 매우 불량한 예후와 달리, 약물 치료 옵션은 매우 제한적이고, 아직까지 어떤 환자가 어떤 치료제에 잘 반응을 할지 예측하기가 어렵습니다. 이번 연구는 이러한 어려움을 겪는 담관암 환자들에게 도움이 되기를 바라는 마음에서 진행했습니다. 개인적으로는 병원에서 인턴 생활을 하면서, 너무나 힘들게 투병 생활을 하셨던 담관암 환자 분이 기억에 나서, 그 분을 생각하면서 진행했던 연구이기도 합니다.

이번 연구에서는 수술적으로 절제가 불가능하거나 재발하여 항암 치료를 받는 담도암 환자들을 대상으로 환자의 치료 반응과 종양의 어떤 유전적 변화가 관련이 있는지를 종합적으로 분석했습니다. 담도암은 해부학적 위치에 따라, 간내담관암 (Intrahepatic cholangiocarcinoma, ICC), 간외담관암 (Extrahepatic cholangiocarcinoma, ECC), 담낭암 (Gallbladder cancer, GBC), 그리고 바터팽대부암 (Ampullar of Vater cancer, AOV) 으로 구분합니다. 특히, 같은 간내담관암 (ICC)도 병리학적 & 분자생리학적으로 완전히 다른 대담관 (large-duct)소담관 (small-duct) 유형으로 구분을 할 수 있는데, 이 두 유형의 확연히 다른 항암제 반응에 착안하여 항암제 반응과 연관된 유전적 변화를 발굴하는 실마리를 얻을 수 있었습니다. 더불어 최근 매우 중요한 치료 옵션으로 각광받고 있는 면역 항암제의 경우, 담관암에서는 반응성을 보이는 경우가 매우 드문데, 치료에 반응하지 않는 저항성과 연관된 유전적 변화를 발굴하여, 이를 바탕으로 어떠한 환자에게 면역 항암제가 효과적으로 쓰일 수 있을지를 제시할 수 있었습니다.

개인적으로는 연구를 진행하면서 Somatic mutation panel을 경험하며, NGS 분석에 더 많은 내공을 쌓을 수 있는 좋은 기회가 되었던 것 같습니다. 이번 연구 결과가 많은 담관암 환자들이 최적의 치료를 받을 수 있는 치료 전략을 수립하는데 기여할 수 있기를 바랍니다.

[BRIC 관련 인터뷰] https://www.ibric.org/myboard/read.php?Board=tr_interview&id=245031

[관련 기사 보기]

Genomics of Drug Sensitivity in Cancer (GDSC): 항암제에 대한 암세포주 반응 Database

종양학 (Oncology)에서의 정밀 의료암세포의 돌연변이 프로필 (Mutational Profile)에 대한 정보를 얻고, 이를 바탕으로 항암제 또는 기타 약물의 효과를 예측해서, 환자에게 최적의 치료 효과를 낼 수 있는 치료를 하는 것이 목적입니다. 하지만, 종양 세포가 가지고 있는 복잡하고 다양한 돌연변이로 인해서, 특정 바이오 마커를 이용하여 실제 임상 현장에서 약물의 치료 효과를 예측하고 활용하는데에는 많은 한계가 존재합니다. 특히, 이를 위해서는 실제로 약물의 효과를 예측하는 효과적인 바이오마커가 발굴되어야 하는데, 이러한 작업은 다양한 변수들로 인해서 쉽지가 않습니다. 오늘 포스팅할 내용은 이러한 노력의 연장선에서,  약  1000여개의 확립된 인간 암세포주들에 대해 500여개의 항암제로 처리하여 각각의 세포를 죽일 수 있는 농도 (IC50 values, 50%의 세포가 죽는 농도)를 스크리닝하고, 각각의 세포주가 가지고 있는 돌연변이 프로필에 대한 정보를 제공하고 있는 Database인 Genomics of Drug Sensitivity in Cancer (https://www.cancerrxgene.org/)에 대해서 소개하고자 합니다. 이러한 대규모 스크리닝과 통계적 접근을 통해서, 어떠한 돌연변이가 어떠한 약물에 효과가 있는지 또는 저항성을 보이는지에 대한 분석이 가능하고, 궁극적으로 약물 효과를 예측하는 바이오 마커를 찾아내는게 가능해지게 됩니다.

title

overview
GDSC Website (https://www.cancerrxgene.org/)에서는 다양한 암종의 Pathway를 타겟으로 하는 약물에 대한 암세포주의 스크리닝 결과를 제공하고 있습니다.

위의 사이트에 들어가면, 다양한 세포주 정보, 돌연변이 정보, 그리고 약물 스크리닝 결과를 항목별로 조회할 수 있으면, 해당 데이터도 다운로드가 가능합니다.

kras

위의 그림은 KRAS 돌연변이를 가지고 있는 세포주들에 대해서 통계적으로 유의미하게 효과가 있거나, 저항성을 나타내는 약물에 대한 Volcano plot을 보여주고 있습니다. 이러한 세포주 결과를 통해서, KRAS 돌연변이 암세포에 대해서는 효과를 나타내는 약물 (위 그림의 초록색)을 타겟 치료의 후보로 생각해 볼 수 있습니다.

scatter

또한 비슷하게, 개별 약물에 대해서 조회를 하면, 세포주 중에서 해당 돌연변이를 가지고 있는 세포주와 가지고 있지 않은 세포주의 반응을 통계적으로 분석하여 Scatter Plot으로 제공해주고 있기도 합니다. 위의 그림은 Ibrutinib에 대해서 KRAS 돌연변이를 가지고 있는 세포들이 더 높은 IC50를 가져서, 저항성이 높다는 것을 보여주고 있습니다.

현재 위와 같은 시도는 인간 유래의 확립된 세포주 (Human Cancer Cell Lines)들에 대해서 스크리닝이 진행되고 있습니다.  추후에는 궁극적으로는 환자 개개인의 암 세포 또는 종양 오가노이드 (Organoid)를 이용하여 비슷한 접근을 한 후에, 치료 효과를 판정하고, 이를 바탕으로 치료제를 선택하는 날이 올 것으로 기대되고 있습니다. 다만, 위의 방법은 약물에 의해 세포를 직접적으로 죽이는 효과이기 때문에 면역항암제와 같이 환자 체내에서 일어나는 면역 반응을 이용하는 치료제에 대해서는 효과를 보기 어렵다는 단점이 있습니다. 위의 GDSC 프로젝트에 대해서자세히 나와있는 논문들을 Reference에 남기며, 이번 포스팅은 마무리하도록 하겠습니다.

 

관련 포스팅 보기>

DNA 손상 복구 기전과 타겟 치료 항암제

[실험실 노트] Organoid의 기본 개념과 활용

면역 항암제, Immune checkpoint inhibitor의 원리 및 종류

동반 진단, Companion diagnostics란 무엇인가?

 


[References]

Yang, Wanjuan, et al. “Genomics of Drug Sensitivity in Cancer (GDSC): a resource for therapeutic biomarker discovery in cancer cells.” Nucleic acids research 41.D1 (2012): D955-D961.

Garnett, Mathew J., et al. “Systematic identification of genomic markers of drug sensitivity in cancer cells.” Nature 483.7391 (2012): 570-575.

Iorio, Francesco, et al. “A landscape of pharmacogenomic interactions in cancer.” Cell 166.3 (2016): 740-754.

DNA methylation과 CpG island

지난 포스팅에서는 Epigenetics에 대한 기본 개념과 이해를 위한 Chromatin과 Histone 단백의 구조에 대해서 정리했습니다. 오늘은 그 연장선에서 Epigenetics의 중심을 이루는 DNA의 메틸화 (Methylation)에 관여하는 분자들과 CpG island, 그 조절 기전에 대해서 조금 더 자세하게 다뤄볼까 합니다.

관련 포스팅 보기>

Epigenetics의 개념과 Chromatin structure, Histone modification

DNA 손상 복구 기전과 타겟 치료 항암제

 

I. DNA Methylation이 일어나는 장소와 관여하는 분자들

Mammalian genome 대부분의 DNA 메틸화는 CG dinucleotide의 Cytosine의 5번 탄소에서 일어납니다. Cytosine과 Guanine이 phosphate로 연결되어 있기 때문에, 흔히 CpG site라고 부르기도 합니다. 이러한 DNA 메틸화는 Cytosine 5-Methylcytosine (5-mC)으로 만듭니다.  5mC는 다른 DNA 분자보다 불안정하여 mutation이 일어나기 쉽고, spontaneous deamination에 의해서, Thymine으로 잘 바뀝니다.

600px-Cytosine_becomes_thymine

따라서, 우리 몸에는 DNA 메틸화를 시키는데 관여하는 효소와 함께, 메틸기를 빠르게 떼어주거나 C > T로 바뀐 염기를 원래대로 복구 시켜주는데 관여하는 효소가 함께 존재하게 됩니다. 아래 그림의 DNMT (DNA Methyl Transferase) 효소들이 DNA를 메틸화시켜주는 효소로, TET (ten–eleven translocation) enzyme이 DNA를 따시 떼어내는 효소로 작용하고, C > T로 바뀐 염기를 원래대로 복구 시켜주는 기전에는 AID/APOBEC (activation-induced cytidine deaminase/apolipoprotein B mRNA-editing enzyme complex) Base Excision Repair (BER) 메커니즘이 관여하게 됩니다.

1

3

2

II. CpG island

위에서 언급한 CpG site 들은 유전체 내에서 random 하게 분포하는 것이 아니라, 특정한 패턴을 이루는데, 특히 몰려있으면서 마치 섬을 이루는 곳CpG island라고 부릅니다. 최근에는 아래의 조건을 만족하는 경우를 CpG island로 부르게 되었습니다.

  1. 길이가 200bp 이상
  2. GC content가 50% 이상
  3. observed to expected CpG ratio 가 0.6 이상

DNAme_landscape

대부분의 CpG island는 유전자 자체의 코딩 영역에는 거의 존재하지 않고, upstream의 조절 부위 (regulatory region), 특히 Promoter 영역에 존재하여, 유전자의 발현과 밀접하게 관련이 됩니다. 일반적으로 CpG island의 메틸화가 되면 유전자 발현에 관여하는 여러 transcription factor의 접근을 막고, 동시에 메틸화된 CpG site에 결합하는 MBD (Methyl-CpG-binding domain proteins) 단백들이 유전자 발현을 억제하게 됩니다.

 

III. 발생 과정의 DNA 메틸화와 암 발생에서의 CpG island

4

발생 과정은 다양한 유전자가 발현하면서, 형태를 만들어 가는 과정입니다. 따라서, 발생 과정은 그 어느 때보다도 다양하고 복잡하게 DNA 메틸화가 일어나게 됩니다. 위 그림은 발생 시기와 성별, 그리고 조직의 종류에 따라 DNA 메틸화가 어떻게 나타나는지를 간략하게 나타내주고 있습니다. 이러한 유전자의 발현 패턴에 영향을 미치는 DNA의 메틸화의 이상은 발생 과정의 이상에 의한 여러 가지 질병과 기형을 유발할 수 있습니다.

 

1-s2.0-S0168952513001959-gr1

발생 과정과 비슷하게, CpG island는 암 발생 과정에도 관여하게 되는데, 흔히 암 억제 유전자 (Tumor suppressor gene, TSG)의 CpG island에 과다한 메틸화에 의해 발현이 억제되거나, 암 발생 유전자 (Oncogene)의 발현이 증가되는데, CpG island의 잘못된 메틸화가 관여할 수 있습니다.

 

[References]

Moore, Lisa D., Thuc Le, and Guoping Fan. “DNA methylation and its basic function.” Neuropsychopharmacology 38.1 (2013): 23-38.

Ambrosi, Christina, Massimiliano Manzo, and Tuncay Baubec. “Dynamics and context-dependent roles of DNA methylation.” Journal of molecular biology 429.10 (2017): 1459-1475.

Greenberg, Maxim VC, and Deborah Bourc’his. “The diverse roles of DNA methylation in mammalian development and disease.” Nature reviews Molecular cell biology (2019): 1-18.

Stirzaker, Clare, et al. “Mining cancer methylomes: prospects and challenges.” Trends in Genetics 30.2 (2014): 75-84.

DNA 손상 복구 기전과 타겟 치료 항암제

지난번 포스팅에서는 de novo mutation의 발생과 의의에 대해서 정리하였습니다. 관련 연구를 진행하다보니, 조금 더 근본적으로 de novo mutation을 발생시키는 DNA의 손상과 복구 기전에 대한 깊은 이해가 필요함을 느꼈습니다. (공부는 끝이 없습니다.) 사실 DNA 복구 기전의 문제는 많은 질환과 관련이 있는데, 대표적으로 암은 이러한 DNA 복구에 문제가 있는 것으로 잘 알려진 질환입니다. 그래서 DNA 손상과 복구에 대한 대부분의 연구는 암을 중심으로 이루어져 왔습니다. 그렇지만 암 이외에도 많은 유전 질환 또한 DNA 복구 문제와 연관성이 보고되고 있습니다. 그래서 이번 포스팅은 DNA가 손상되었을 때 이를 복구하는 여러가지 방법과 관련 단백을 정리하고, 암종의 맞춤 치료에 대한 의의에 대해 정리해보고자 합니다.

 

DNA 손상의 종류

DNA damage

생명체의 중요한 유전 정보를 지니고 있는 DNA는 이중 가닥으로 이루어져 있기 때문에, 손상의 종류에 따라서 복구되는 기전도 차이가 나게 됩니다. DNA의 손상은 DNA 복제 과정의 에러와 같은 세포의 내인적 요인과 외부의 환경적 요인에 노출되면서 발생하는 다양한 손상 (Environmental mutagen) 등이 복합적으로 작용하여 일어나게 됩니다. 이때, 가닥의 한쪽만 손상 (Single-strand break; SSB)이 이루어진 경우는 상보적인 반대쪽 가닥의 정보를 이용하여 복구를 할 수 있지만, 양쪽 가닥이 모두 손상 (Double-strand break; DSB)된 경우는 인접한 상동 염색체의 정보를 이용하여야 복구가 가능해집니다. 이외에도 이전에 정리했던 Chromothripsis나 Kataegis와 같은 event가 발생하면, 훨씬 더 복잡한 패턴의 대규모의 손상이 발생할 수 있습니다.

 

DNA 복구 기전과 관련된 주요 분자

아래 그림은 DNA의 손상을 복구하는 여러 기전과 관련 분자들을 정리하여 보여주고 있습니다. 암 유전학에서 재미있는 것은 이러한 손상 복구 기전과 연관된 분자들 중 어떠한 것에 문제가 있는가에 따라서 질환의 경과나 치료제의 반응 정도 등에 차이가 난다는 점입니다. 사실 암과 관련된 맞춤 치료 및 표적 치료제 (Targeted agent)도 이러한 개념에 근거하여, 관련 암종의 분자 프로파일 (molecular profile)을 작성하고 최적의 치료 옵션을 찾는데에 있습니다.

  • Base excision repair: DNA의 산화적 손상 (ROS)을 복구하는 가장 기본적인 기전으로, 손상된 염기를 잘라내고 다시 복구합니다.
  • Nucleotide excision repair (NER): 여러 개의 base로 이루어진 조금 더 큰 nucleotide 단위의 손상을 복구하는 기전으로, UV, Tobacco, ROS, Radiation과 같은 다양한 환경적인 mutagen에 대응하는 복구 기전입니다.
  • Mismatch mediated repair (MMR): DNA 복제 과정에서 필연적으로 발생하는 replication error에 대한 복구 기전으로, 잘못 복제된 DNA를 교정해줍니다. 이러한 기전에 문제가 있는 경우, Lynch syndrome 또는 HNPCC (Hereditary nonpolyposis colorectal cancer)라고 하는 가족성 암 증후군을 일으키는 것으로 잘 알려져 있습니다.
  • DNA double-strand break repair: 이중 가닥 손상에 대해서는 다양한 복구 기전이 존재하는데, 크게 NHEJ (Non-homologous end joining)HDR (Homology directed repair) 기전이 존재합니다. 간단히 정리하면 NHEJ는 손상된 부분을 그냥 연결해주는 방식이고, 그렇기 때문에 INDEL이 발생하게 됩니다. 유전자 가위인 CRISPR-Cas9 이 이러한 방식으로 INDEL을 유도하게 됩니다. 반대로, HDR은 인접한 상동 염색체의 동일 부분의 유전 정보를 활용하여 복구하는 기전으로, BRCA1/2 또는 FANC family가 주요한 역할을 하는데, 안젤리나 졸리의 예방적 유방 절제술로 유명해진 유전성 유방 난소암 증후군 (Hereditary Breast Ovarian Cancer; HBOC)이나 판코니 빈혈 (Fanconi Anemia)이 이러한 분자의 문제로 발생하는 것이 잘 알려져 있습니다.

DNA repair

DNA repair_2

 

DNA 복구 기전 문제와 암종의 타겟 맞춤 치료

DNA 손상을 제대로 복구하지 못하여 발생한 암은 문제가 있는 기전에 따라서, 타겟 치료제에 대한 반응성도 달라지게 됩니다. 아래 그림은 이러한 기전과 타겟 치료제의 관계를 보여주고 있습니다. 가장 대표적으로 Homolgy directed repair (HDR)에 문제가 있어서 발생한 암종들은 Platinum 계열의 항암제PARP inhibitor에 잘 듣는 것으로 알려져 있고, Mismatch repair (MMR)에 문제가 있는 암종들은 면역 항암제 (Immune Checkpoint Inhibitor)에 대한 반응성이 좋은 것으로 보고 되고 있습니다. 이러한 분자 기전과 연관된 분자에 따라서, 환자의 반응성을 예측하고 치료 옵션을 수립하는 것이 환자별 맞춤 치료와 정밀 의료의 방향성으로 제시되고 있습니다.

F1.large

 

관련 포스팅 보기>

[유전학 중요개념 정리] De novo mutation의 발생 기전과 질병 발생학적 의의

[유전학 중요개념 정리] Complex DNA rearrangement: Chromothripsis, Chromoanasynthesis, and Chromoplexy

닥터 프리즈너 속 헌팅턴병의 유전학: 삼염기 반복 질환과 Anticipation

면역 항암제, Immune checkpoint inhibitor의 원리 및 종류

 

[References]

Jalal, Shadia, Jennifer N. Earley, and John J. Turchi. “DNA repair: from genome maintenance to biomarker and therapeutic target.” Clinical cancer research 17.22 (2011): 6973-6984.

Morgan, Meredith A., and Theodore S. Lawrence. “Molecular pathways: overcoming radiation resistance by targeting DNA damage response pathways.” Clinical Cancer Research 21.13 (2015): 2898-2904.

Corcoran, Niall M., et al. “Molecular pathways: Targeting DNA repair pathway defects enriched in metastasis.” Clinical Cancer Research 22.13 (2016): 3132-3137.

Tumor Mutation Burden의 계산과 영향을 미치는 인자들

이전에 언급했던 면역항암제 (Immunotherapy) 의 성공과 더불어, 최근에는 어떠한 암 환자에서 면역 항암제가 효과적으로 쓰일 수 있을지를 예측하는 동반 진단 (Companion Diagnostics) 마커 발굴에 많은 관심이 쏠리고 있습니다. 지금까지 알려진 바로는 다양한 요인들이 면역항암제의 반응성에 영향을 미친다고 보고되고 있는데, 대표적인 인자로 알려진 것들에는 현미부수체 불안정성 종양 (MSI-H; Micro-satellite instability high tumor), PD-L1 발현 종양, 종양 돌연변이 부하 (Tumor Mutation Burden; TMB)가 높은 종양, 환자의 면역 인자 (특정 HLA-allele 등)이 반응성과 잘 연관되어 있다고 알려져 있습니다.

특히, Tumor Mutation Burden의 경우, TMB이 높을수록, 단백질의 변이에 의한 신항원(Neo-antigen)의 발현 확률도 높아지고, 이질적인 항원 발현에 의한 면역 반응으로 종양 세포가 제거될 확률도 높아지게 될 것이기 때문에, 이미 이전부터 당연하게 예측되는 결과 이기도 했습니다. 이러한 면역 항암제의 반응성과의 연관성 때문에, 최근에는 많은 연구에서 계산된 TMB을 함께 요구하고, 임상적으로도 환자 치료시 활용하려고 시도하고 있습니다. 이에 Tumor Mutation Burden의 의미와 영향을 미치는 인자들, 그리고 계산 방법에 대해서 정리해보겠습니다.

F2.large

관련 포스팅 보기>

면역 항암제, Immune checkpoint inhibitor의 원리 및 종류

동반 진단, Companion diagnostics란 무엇인가?

TMB은 종양 내에 얼마나 많은 돌연변이가 발생했는가?를 수치화한 것으로 얼핏 생각하면 매우 단순한 개념처럼 보이기도 합니다. 그러나 매우 이질적이도 다양한 종양처럼, TMB을 정의하는 것도 그렇게 단순하지가 않습니다.

 

I. Tumor Mutation Burden의 정의

TMB은 원래 처음 전장 엑솜 시퀀싱 (Exome sequencing)에 의해서, 1Mb당 검출된 모든 종양 돌연변이의 개수를 수치화한 값으로 정의하였습니다. 즉, (분자 = 돌연변이의 총 갯수)/(분모 = 엑손 영역의 총 길이)가 됩니다. 여기서 문제가 발생하는데, 아직까지 표준화된 정의가 없습니다.

  1.  분자항의 변이의 영역을 어디까지 포함할 것인가? : 논문에 따라서 변이를 counting할 때, Non-synonymous variant만 포함하는 논문도 있고, Non-sense, frame-shift를 전부 포함하는 논문도 존재합니다. (그렇다면 small insertion과 deletion은요??)
  2. 분모항의 엑손 영역은 어떻게 정의할 것인가? : 엑솜 영역은 전체 유전체의 약 2% 정도로 단백질을 코딩하는 부위로 정의를 하는데, 이전에 언급한대로 엑솜 시퀀싱은 타겟시퀀싱과 동일하게 enrichment kit를 사용하여, 해당 엑손 부위만 증폭 시킵니다. 그러나 문제는 시중에 나와있는 다양한 회사의 키트들에서 엑손 영역이라고 말하는 부위가 서로 100% 일치하지 않습니다. 즉, 어떤 회사의 엑손 키트를 사용하였는가에 따라서도, 분모의 값이 달라지게 됩니다. (사실 아직까지도 100% 유전자라고 하는 부위의 정의도 확립되어 있지 않습니다.) 일반적으로 엑솜 영역의 크기는 5~60 Mb 정도 됩니다.

관련 포스팅 보기>

NGS Target enrichment method: Hybridization vs. Amplicon capture

NGS 검사: Whole Genome & Exome, Targeted Sequencing 비교

[유전학 중요개념 정리] Germline vs. Somatic mutation

 

II. Tumor Mutation Burden에 영향을 미치는 인자들

다음으로, TMB의 개념은 시퀀싱에 기반한 방법이기 때문에, 검사의 민감도가 결과에 절대적으로 영향을 미칩니다. 종양은 종양 이질성 (Tumor heterogeneity)으로 인해, 다양한 변이를 가진 미세 군집이 존재하게 됩니다. 따라서, 검체의 어떤 부분을 시퀀싱하는가?, 얼마나 더 민감하게 검사를 하는가?에 따라서, 해당 변이가 검출될수도, 되지 않을수도 있습니다. 따라서 종양 세포의 비율과 순도 (purity), DNA 추출 과정, 그리고 시퀀싱의 측면에서 Coverage 또는 Depth가 매우 중요하게 작용합니다. 즉, 일반적으로 Depth가 높아지면, 더 민감하게 검출이 되므로 TMB 값은 커지기 마련입니다. 다음으로, 검사 자체의 측면 이외에도 시퀀싱 데이터를 처리하면서 Bioinformatics pipeline에서 분석을 할 때, VAF (Variant allele frequency) cut-off를 얼마로 설정할 것인가에 따라서도 값이 매우 달라지게 됩니다. 즉, 시퀀싱 에러와 미세 군집 사이를 적절하게 구분짓는 최적의 cut-off 설정 또한 검사자에게 요구 됩니다. 더불어, matched normal sample의 유무에 따라, 적절하게 Germline variant를 filtering 하는 것도 매우 중요하다고 할 수 있겠습니다.

 

III. Target panel을 이용한 Tumor Mutation Burden 계산

최근에는 엑솜 시퀀싱이 아닌, 일부 유전자를 타겟으로 하는 타겟 패널에서 TMB을 계산하기도 합니다. 전체 유전자는 대략 2만여개 정도로 알려져 있는데, 수백개의 유전자로 이루어진 패널에서 이를 같은 방식으로 계산하는 것이기 때문에, 일부가 전체를 대표하게 됩니다. 따라서, 패널의 크기가 크면 클수록 엑솜 시퀀싱과 비슷한 결과를 보이게 됩니다. 여기서 최소 몇개의 유전자로 이루어진 얼마나 큰 패널로 검사를 시행해야 거의 동일하고 비슷한 값을 얻을 수 있는가?에 대한 문제가 발생하게 됩니다. 아래는 다양한 타겟 패널과 분석 플랫폼을 비교한 표입니다. 여기서 가장 중요한 것은 어떤 플랫폼으로 검사하는가에 따라서 검사 결과가 매우 다르다는 점입니다. 아래 그림은 서로 다른 영역을 타겟으로 하는 다양한 패널에서 계산되는 TMB의 차이를 나타내주고 있습니다.

mdy495f2

2

 

따라서, 마지막으로 임상의사 선생님들께 남기고 싶은 얘기는 TMB의 절대값은 의미가 없다 라는 점입니다. 즉, 어떠한 플랫폼에서 어떠한 검사 기준을 적용하여, 어떻게 검체를 처리했는가에 따라서 TMB의 값은 매우 크게 달라질 수 있기 때문에, 같은 플랫폼 내에서 서로를 비교하는 상대값으로써 더 의미가 크다고 할 수 있겠습니다. 또한, TMB을 임상적으로 활용하기 위해서는 검사실에서 SOP를 수립하고, 표준화된 정의와 기준을 수립하는 것도 앞으로 매우 중요하겠습니다.

 


[Reference]

Chan, Timothy A., et al. “Development of tumor mutation burden as an immunotherapy biomarker: utility for the oncology clinic.” Annals of Oncology 30.1 (2018): 44-56.

Meléndez, Bárbara, et al. “Methods of measurement for tumor mutational burden in tumor tissue.” Translational lung cancer research 7.6 (2018): 661.

Braun, David A., Kelly P. Burke, and Eliezer M. Van Allen. “Genomic approaches to understanding response and resistance to immunotherapy.” Clinical Cancer Research 22.23 (2016): 5642-5650.

암유전체 분석: Driver mutation prediction tools

이전 포스팅에서 암에서 발생하는 mutation을 driverpassenger로 구분하는 개념에 대해서 언급했습니다. 이번에는 실제로 시퀀싱을 진행했을 때 검출되는 많은 변이들을 실제 암 발생의 driver와 passenger를 구분하는 방법과 다양한 툴들에 대해서 정리해 보고자합니다.

관련 포스팅 보기>

[유전학 중요개념 정리] Driver vs. Passenger mutation in cancer

[유전학 중요개념 정리] Mutational signature

사실 Somatic mutation이나 Germline mutation이나 질병 발생의 원인 유전자와 변이를 찾는 방법이라는 데에서 큰 틀의 접근 방법은 동일합니다.  Germline 변이를 판독하는 큰 틀을 제시하는 가이드라인이 ACMG guideline이라고 한다면, Cancer 변이 판독의 기준으로는 흔히 AMP/ASCO/CAP guideline의 Tier system이 사용되고 있습니다. 즉, 개별 변이들을 아래와 같이 증거 수준과 임상적 중요도 등에 따라 Tier 1~4로 구분을 하여, 중요도가 높은 변이들을 임상적으로 활용하는 것이지요. 하지만, 이 역시도 한계가 많고 구분도 모호하기 때문에, 실질적으로 검출된 변이들의 driver mutation을 예측할 수 있는 다양한 툴들이 개발되고 있습니다.

1
[Somatic variant 변이 판독을 위한 AMP/ASCO/CAP guideline에 따른 Tier classification]
 

NGS를 시행하게 되면, 다양한 변이들이 쏟아져 나오게 됩니다. 이때 해당 변이의 판독은 크게 아래와 같은 접근법을 이용하게 됩니다.

  1. 기존의 암에서 자주 보고된 알려진 변이인가? Database에 이미 널리 알려진 변이 (매우 소수)
  2. Database에 등록 되어 있지는 않지만, 정상 인구 집단에서는 관찰되지 않는 매우 드문 변이인가? (Population genetics 관점에서 allele frequency)
  3. 여러가지 in-silico prediction tool이 해당 변이의 deleterious effect를 예측하고 있고, 해당 변이가 단백질의 매우 중요한 3차원적 위치에 있는 경우 (Mutational hot-spot, Functional genetics 관점에서 protein의 기능 및 domain)

 

이러한 접근법에 근거하여 다양한 tool들이 개발되고 있으며, 대표적으로 널리 쓰이는 몇가지 tool들을 소개하며, 이번 포스팅은 마치고자 합니다. NGS 검사를 통해 검출된 변이에 아래의 DB에서 제공하는 다양한 정보를 annotation하고, 이에 근거하여 driver mutation을 예측하게 됩니다.

I. COSMIC (https://cancer.sanger.ac.uk/cosmic)

Wellcome Sanger Institute에서 제공하고 있는 암 유전체 관련 DB입니다. 보통 개별 변이마다 DB에 등록되면서 COSMIC ID가 부여되는데, 가장 방대한 DB를 구축하고 있어서 새로운 변이들을 확인할 때 가장 먼저 살펴보게 되는 DB입니다.

 

II. cBioPortal (http://www.cbioportal.org/)

다양한 암종과 TCGA cancer genome 데이터를 기반으로 하여, 보고된 다양한 mutation에 대한 정보들을 제공하고 있습니다. 대표적이고 유명한 paper들에 사용된 cancer genome DB를 포함하고 있고, 실제 유전자들의 functional domain과 hot-spot 정보들을 함께 제공하고 있어서 유용하게 이용할 수 있는 DB입니다.

 

III. OncoKB (https://oncokb.org/)

Memorial Sloan Kattering Cancer Center에서 구축한 DB로 조금 더 임상적으로 중요한 변이들이 명확하게 curation 되어 있습니다. 임상적으로 중요하고 근거 수준이 명확한 변이들을 Level에 따라서 잘 정리한 장점이 있으나, 변이 데이터는 상대적으로 조금 빈약한 편입니다.

 

IV. Cancer Genome Interpreter (https://www.cancergenomeinterpreter.org)

이미 구축된 다양한 DB와 기존 논문 보고 데이터들을 통합하여, 변이들의 driver mutation 여부를 종합적으로 잘 판독해주는 툴로 유용하게 사용할 수 있습니다. 다만, 프로그램이 공개되어 있지 않고 서버에 직접 본인의 데이터를 업로드하여야 하고 한번에 업로드할 수 있는 변이의 수가 5,000개로 제한되어 있는 점은 단점이라고 할 수 있습니다.

 

V. MutaGene (https://www.ncbi.nlm.nih.gov/research/mutagene/)

가장 최근에 개발된 tool로 Python package도 제공되어 있어, 따로 서버에 자료를 올리지 않고 설치해서 바로 사용할 수 있는 장점이 있습니다. Driver mutation 예측 외에도 Mutational signature 분석도 함께 할 수 있어서, 유용한 정보를 제공하고 있습니다.

 

위의 내용을 살펴보면, 아직까지 완벽한 변이 판독 방법은 없구나 하는 것을 느끼게 됩니다. 사실 이전에 약물 유전자와 관련된 연구에 대해 포스팅 했었는데, 비슷한 연구가 암 관련 유전자에 대해서도 함께 진행 중입니다. 따라서 최근의 연구 추세는 다양한 변이의 임상적 판독을 위한 충분한 정보를 제공할 수 있는 대용량 변이 판독 방법에 집중되고 있으며, Functional genomics 분야의 큰 부분을 차지하며 연구비가 몰리고 있는 상황입니다.

관련 포스팅 보기>

약물유전체 정밀의료의 실현, F-CAP 프로젝트

유전자 변이의 해석: 대용량 기능 검사의 필요성

 

[References]

Li, Marilyn M., et al. “Standards and guidelines for the interpretation and reporting of sequence variants in cancer: a joint consensus recommendation of the Association for Molecular Pathology, American Society of Clinical Oncology, and College of American Pathologists.” The Journal of molecular diagnostics 19.1 (2017): 4-23.

[유전학 중요개념 정리] Driver vs. Passenger mutation in cancer

암유전체 분석 과정에서 가장 어려운 점은 과연 어떤 유전적 변화가 암 발생의 원인이 되었는가를 밝혀내는 것입니다. 왜냐하면 대부분 검출되는 유전적 변화는 살아가면서 누적된 체세포 변이들의 결과로 암 발생의 직접적 원인이 아니기 때문입니다. 그래서 이번 글에서는 암유전체 중요 개념인 Passenger mutationDriver mutation에 대해서 정리해 보고자 합니다.

관련 포스팅 보기>

[유전학 중요개념 정리] Germline vs. Somatic mutation

우리는 살아가면서 다양한 환경에 노출 (햇빛, 담배, 매연, 약물 등등)되고, 체세포들은 변이들을 누적 (Somatic mutation) 시킵니다. 삶은 곧 변이인 셈이지요. 이렇게 누적된 변이들은 정상적으로 노화라는 과정을 거치게 됩니다. 그러나 운이 나쁘게도 변이가 발생하는 과정이 암 발생과 연관된 유전자의 스위치를 키게되면, 그때부터 암으로 진행될 수도 있죠.

즉, 암의 발생과 진행을 촉진하고 이끌어 나가는 돌연변이Driver mutation이 되고, 암의 발생과 분열에는 영향이 없지만 Driver mutation에 의해 암이 진행되는데 함께 따라오는 mutation들을 Passenger mutation이라고 합니다. 아래의 일련의 tumor progression 과정을 생각해보면, 왜 이름을 Driver와 Passenger라고 부르는지 쉽게 이해할 수 있습니다.

cancer driver

Driver mutation에 관여되는 유전자는 크게 OncogeneTumor suppressor gene으로 구분할 수 있습니다. 즉, 기능적으로 항진되면 직접적으로 암 발생을 촉진시키는 유전자Oncogene, 암 발생을 억제 시키고 있던 수문장과 같은 역할이 Tumor suppressor가 됩니다. 즉, Driver mutation은 Oncogene에 발생하는 Gain of Function 또는 Tumor suppressor gene에 발생하는 Loss of Function에 의해서 유발될 수 있습니다. 암의 분화에는 다양한 driver mutation들이 관여하고, driver mutation의 종류에 따라 점차 다양한 능력을 획득하게 됩니다. 예를 들면, 암 발생 초기에는 전이의 능력이 없다가, 암 발생 후기에는 장기 이곳 저곳으로 전이하는 능력을 갖는다던지 하는 식이죠.

최근의 연구에 따르면, Passenger mutation은 오히려 암 발생과 진행을 억제하는 역할이 있다고 합니다. 운전자(Driver)가 데려가야할 승객들(Passenger)이 많아지면 Driver의 입장에서는 더 버거울 수도 있겠죠. 대부분의 Passenger mutation은 유전적 불안정성 (Genomic instability)에 기인하여 발생하게 되는데, Passenger mutation이 너무 많이 쌓이면, 암으로 진행되어 증식되기보다는 사멸하는 방향으로 갈 확률이 높아질 것이기 때문에, 어찌보면 당연하게 생각됩니다.

 

다음 포스팅에서는 유전체 분석 과정에서 어떻게 Driver와 Passenger를 구분하는지에 대해서 다루도록 하고, 이번 포스팅은 여기서 마치도록 하겠습니다.

 

[Reference]

Pon, Julia R., and Marco A. Marra. “Driver and passenger mutations in cancer.” Annual Review of Pathology: Mechanisms of Disease 10 (2015): 25-50.

McFarland, Christopher D., et al. “The damaging effect of passenger mutations on cancer progression.” Cancer research (2017).

암유전체 분석: GISTIC을 이용한 Somatic Copy Number Alteration 분석

암유전체 분석은 크게 SNV/INDEL 수준의 Mutation 분석과 Chromosome/CNV 수준의 Somatic Copy number Alteration (SCNA) 분석으로 나눌 수 있습니다. 과거에 SCNA는 주로 SNP array 또는 Array CGH과 같은 Microarray를 이용하여 시행하였지만, 최근에는 NGS 데이터를 활용하여 2가지 분석을 모두 시행할 수가 있습니다. 이번 포스팅은 NGS 데이터를 활용하여, SCNA를 분석하는 Genomic Identification of Significant Targets in Cancer (GISTIC) 분석 방법에 대해서 정리해보고자 합니다.

관련 포스팅 보기>

암유전체 분석: Waterfall plot

NGS 데이터를 이용한 CNV 분석


f1.large
[GISTIC 분석의 원리] 여러 환자의 sample에서 공통적으로 발생하는 CN 변화의 위치를 통계적으로 구해서, 유의하게 발생하는 위치에서 Cancer 발생의 Driver mutation을 찾는 것이 원리입니다.
GISTIC 분석을 위해서는 아래와 같은 Input 파일이 필요합니다.

ftp://ftp.broadinstitute.org/pub/GISTIC2.0/GISTICDocumentation_standalone.htm

Segmentation File (-seg)

(1)  Sample           (sample name)

(2)  Chromosome  (chromosome number)

(3)  Start Position  (segment start position, in bases)

(4)  End Position   (segment end position, in bases)

(5)  Num markers      (number of markers in segment)

(6)  Seg.CN       (log2() -1 of copy number)

원래 GISTIC은 Array 기반으로 개발된 프로그램이기 때문에, Probe 정보를 받아들이게 되는데 NGS 데이터는 Probe 정보가 없습니다. 따라서, 타겟 영역의 엑손 하나 하나를 일종의 Probe로 간주하고 데이터를 변환하여 넣어주면 분석을 할 수가 있습니다.

NGS를 통해 생산된 Bam 파일을 이용하여, 타겟 영역의 Copy number 정보를 구하고 이 데이터를 활용해서 아래와 같이, 1차적으로 Segmentation을 해줍니다. 그리고 여러 샘플의 이러한 정보를 합쳐서, 통계적으로 유의미한 CN 수 변화가 발생한 곳을 검출하게 됩니다. 최근에는 유용한 R package가 많이 있는데, DNA copy를 이용한 아래 코드는 segmentation과 데이터 변환에 유용하여 함께 올립니다.

1469941517095.gif
[Segmentation 과정] 각각의 영역의 CN를 일종의 신호 세기로 인식해서, 통계적으로 Segmentation에 변화가 발생한 곳을 검출해서 나눕니다.

#Preparing CopywriteR output for GISTIC 2.0 analysis

library(DNAcopy)

load("/PATH/TO/segment.Rdata")
segmentation.values <- segment.CNA.object$output
colnames(segmentation.values) <- c("Sample", "Chromosome", "Start Position", "End Position",
                                   "Num markers", "Seg.CN")
write.table(segmentation.values, file = "/PATH/TO/segmentation_values.tsv", quote = FALSE,
            row.names = FALSE, sep = "\t")

markers <- data.frame(paste(segment.CNA.object$data$chrom, segment.CNA.object$data$maploc,
                            sep = ":"),
                      segment.CNA.object$data$chrom, segment.CNA.object$data$maploc)
colnames(markers) <- c("Marker Name", "Chromosome", "Marker Position")
write.table(markers, file = "/PATH/TO/markers.tsv", quote = FALSE, row.names = FALSE,
 sep = "\t")

 

위와 같은 데이터 변환 후 Input 데이터 변환이 끝나면, GISTIC 분석을 위한 모든 준비가 끝나게 됩니다. GISTIC은 Matlab 기반 프로그램이지만, 다행히 cloud를 통해 GenePattern에서 웹기반으로도 이용할 수 있습니다. 마지막으로, GISTIC을 이용하여, 4,934개의 암 샘플을 분석한 Nature genetics의 논문을 소개하며, 포스팅을 마치도록 하겠습니다.

2

[GISTICS 분석 결과] 유의하게 amplification 또는 deletion이 발생한 위치에 존재하는 Tumor driver gene을 발굴함으로써, 암 발생에 대한 연구를 할 수 있습니다.

 

[References]

Beroukhim, Rameen, et al. “Assessing the significance of chromosomal aberrations in cancer: methodology and application to glioma.” Proceedings of the National Academy of Sciences 104.50 (2007): 20007-20012.

Mermel, Craig H., et al. “GISTIC 2.0 facilitates sensitive and confident localization of the targets of focal somatic copy-number alteration in human cancers.” Genome biology 12.4 (2011): R41.

Zack, Travis I., et al. “Pan-cancer patterns of somatic copy number alteration.” Nature genetics 45.10 (2013): 1134.

면역 항암제, Immune checkpoint inhibitor의 원리 및 종류

최근 종양학 분야에서의 신약 개발 및 암치료에 대한 관심사는 온통 면역 항암제, Immune checkpoint inhibitor에 쏠려 있습니다. 그래서 이번 포스팅은 면역항암제의 작동 원리와 종류, 및 신약 개발 등에 대해서 정리해 보고자 합니다. 사실 면역 항암제가 핫하게 떠오른 것은 최근의 일이지만, 기본적인 작동 기작에 대해서는 이미 오래전부터 알려져 있었습니다.

 

우리 몸의 면역 체계는 자기는 인식해서 보호하고, 외부의 항원 (Antigen) 또는 침입자 (Invader)를 인식해서 공격하는 검문의 기능 (Checkpoint)을 하고 있습니다. 이때 중요한 역할을 하는 세포가 T 세포인데, 정상적인 면역 반응 체계에서 T세포는 돌연변이가 발생하여 문제가 있는 종양 세포를 공격해서 제거하게 됩니다. 그러나 암세포는 이러한 면역 반응으로부터 벗어나서 증식하기 위해, 아군으로 위장하는 방법으로 PD-L1 (Programmed Death Ligand-1) 을 발현시키고 정상적인 면역 반응으로부터 회피하게 됩니다.

cdr774646-750.jpg
[PD-1, PD-L1 결합을 통한 T cell의 자가 인식 과정] 암세포는 면역 세포의 공격을 PD-L1을 발현함으로써 자기로 인식하도록 하여, 공격을 피하는 escape mechanism을 가지고 있는데, 면역 항암제는 이러한 PD-1과 PD-L1 간의 결합을 방해함으로써 정상적인 면역 반응을 통해 암세포가 제거될 수 있도록 합니다.
 

위와 같은 암세포의 면역 체계 회피 반응을 무력화하기 위해서 개발된 신약들은 크게 3군데를 타겟으로 하게 되는데, 아래 그림의 CTLA-4, PD-1, PD-L1이 해당됩니다. 신약들은 해당 타겟에 대한 specific antibody (특이 항체)로, 타겟과 결합하여 신호 전달을 차단하고 자아로 인식하여 면역회피를 하지 못하게 함으로써, 암세포가 정상적으로 T cell에 의해 제거될 수 있도록 하는 전략을 씁니다. 즉 이러한 신약은 면역 체계가 정상적일 경우에만 효과적으로 작동할 수 있습니다.

2
[암종별 면역 항암제 반응 정도] Hodgkin 종양, melanoma, MSI-high 종양의 면역 항암제 반응률이 좋은 편입니다. 기타 두경부암, 소화기계 암들의 반응률은 20% 내외임을 알 수 있습니다.
1

 

위와 같은 면역 항암제로 개발된 약물의 종류는 다음과 같습니다.

PD-1 inhibitors

  • Pembrolizumab (Keytruda)
  • Nivolumab (Opdivo)
  • Cemiplimab (Libtayo)

PD-L1 inhibitors

  • Atezolizumab (Tecentriq)
  • Avelumab (Bavencio)
  • Durvalumab (Imfinzi)

CTLA-4 blocker

  • Atezolimumab

3
[암종별 면역 항암제의 개발 및 FDA 승인 시기]
 

앞으로 면역 항암제 분야의 신약 개발은 암종별로 효과적이고 특이적인 약물 선별 및 기타 항암제와의 병용 투여의 효과, 특정 돌연변이별로 반응 정도를 예측하여 효과적으로 치료가 예상되는 대상군을 선별하는 동반 진단 마커의 개발 등에 관심이 가고 있습니다.

관련 포스팅 보기>

동반 진단, Companion diagnostics란 무엇인가?

신약 개발과 임상 시험, 그리고 시판 후 조사

 

마지막으로 면역 항암제의 작동 기전에 대해서 잘 정리한 유튜브 영상이 있어, 첨부합니다.

 

 

[References]

Ribas, Antoni, and Jedd D. Wolchok. “Cancer immunotherapy using checkpoint blockade.” Science 359.6382 (2018): 1350-1355.

면역 치료 ACS 정리: https://www.cancer.org/treatment/treatments-and-side-effects/treatment-types/immunotherapy/immune-checkpoint-inhibitors.html

[유전학 중요개념 정리] Mutational signature

암 발생의 대부분은 Somatic mutation으로 생각하고 있습니다. 사람이 살아가면서 다양한 주변 환경에 노출되고 이로 인해 DNA 손상을 받게되면서, 돌연변이가 축적이 되고 어느 한계를 넘어서는 순간 암세포로 자라나게 된다는 개념이지요. 이러한 암유전체 분야에서는 다양한 암종에서 어떤한 돌연변이가 발생하는지에 대한 Mutational signature 연구가 많이 되어 있는데, 2013년에 Nature에 관련 논문이 실린 이후 암 유전체 분야에서 Mutational signature 연구는 거의 필수로 요구되는 분위기인 듯 합니다.

여기서 Mutational signature특정 암종에서 발생하는 돌연변이의 종류에는 특정 패턴이 존재한다는 개념입니다. 구체적으로 돌연변이의 발생 원인 (mutagen exposure)에 노출된 후, 이러한 특정 DNA 손상 기전에 의해 아래와 같은 패턴(Mutational signature)이 나타나고, 결과적으로 암종으로 발생한다는 개념인 것이죠.

nature12477-f2
[Mutational Signature] 암종별로 발생하는 염기 치환 돌연변이들을 특징별로 다양한 패턴으로 나타낸 그림입니다.
 

이러한 연구는 아래 Science에 실린 논문과 같이 흡연에 의한 특정 암 발생의 위험도가 증가하는 것을 설명하는 많은 근거를 제공해줍니다. 즉, DNA 손상이 어떠한 기전에 의해서 발생했는지에 대한 흔적을 통해서, 암 발생의 원인과 기전에 대한 유추를 가능하게 합니다. 따라서 최근의 대부분의 암유전체 분석 논문에서는 거의 필수적으로 해당 분석 결과를 제시하는 추세입니다.

Picture1
[Mutational signature 활용 예] 흡연에 의한 대표적인 돌연변이 발생 패턴과 이를 통해, 관련 암종들의 발생 위험도가 증가함을 설명해준 논문의 Figure 입니다.
 

이러한 Mutational signature에 대한 정보는 아래의 Sanger Institute에서 제공하는 COSMIC 웹 사이트에서 더 자세하게 나와 있습니다.

COSMIC 웹사이트 방문하기: Signatures of Mutational Processes in Human Cancer

다음 포스팅에서는 이러한 Mutational signature 분석과 관련된 R package와 코드에 대해서 정리하기로 하고, 이번 포스팅은 여기에서 마치도록 하겠습니다.

 


[Reference]

Alexandrov, Ludmil B., et al. “Signatures of mutational processes in human cancer.” Nature 500.7463 (2013): 415.

Alexandrov, Ludmil B., et al. “Mutational signatures associated with tobacco smoking in human cancer.” Science 354.6312 (2016): 618-622.