유전체 연구 – 두마디 정밀의료

Mila 이야기와 Antisense oligonucleotides 치료제

Mila 이야기와 Milasen 약물에 대해서는 언젠가 한번 정리하고 싶었던 내용이었는데, 때마침 최근에 개최되었던 2021년 미국 인간유전학회 (ASHG)에서는 Mila 이야기에 관한 최신 업데이트 내용이 발표되었습니다. 이에 관련 내용에 대한 포스팅을 작성하려고 합니다. 제가 현재 속해 있는 보스턴 어린이 병원 (Boston Children’s Hospital) 의 연구진들은 Mila라는 희귀 질환 환우를 위한 맞춤 치료 (Personalized therapy) 를 제공하기 위해 치료제를 개발하게 되는데, 이 과정이 Mila의 이야기, 그리고 치료제는 ASO 약물인 Milasen이 됩니다.

Mila 이야기와 Milasen

보스턴 어린이 병원 (Boston Children’s Hospital) 소속 Timothy Yu 박사와 소아 희귀 질환인 Batten Disease 환아인 Mila, 그리고 Mila의 엄마

Mila는 전장 유전체 시퀀싱 (Whole-genome sequencing) 을 통한 유전자 검사를 통해, MFSD8 (CLN7) 유전자의 문제로 발생하는 희귀 질환인 Batten 병을 진단 받게 됩니다. 이에 연구진들을 Antisense oligonucleotides (ASO) 라는 물질을 이용하여, Mila의 유전병이 발생하는 원인을 차단하여 증상을 개선시키는 Mila만을 위한 치료제를 개발하는데 착수하였습니다. 이는 Mila가 가지고 있는 특정 돌연변이를 타겟으로 하는 환자 맞춤 치료 약물 (Personalized drug) 이기에, 약물의 이름도 Mila의 이름을 따서 Milasen이라고 붙여지게 됩니다. 이에 따라 이 약물의 임상 시험도 “n of 1 clinical trial” (다수의 환자 중 단 한명을 위한 임상 시험)이라고 부르게 됩니다. (참고로 본 연구는 현재 KAIST에 계시는 김진국 교수님께서 1저자로 참여하여 진행되었습니다.)

Mila는 2016년 위와 같이 해당 질병을 진단받고, 질병의 발생 메커니즘을 이해하고, 이를 치료하기 위한 기전에 맞는 약물을 개발하여, 임상 시험에 들기까지 연구진의 많은 노력 끝에 Milasen이라는 약물이 탄생하게 됩니다. 그러나 Mila는 맞춤 치료제에도 불구하고, 최근 안타깝게도 사망하였다고 합니다.

2021년 미국 인간유전학회 (ASHG)에서 Yu 박사의 발표에 따르면, 이러한 희귀 질환은 더 이른 시기에 빠른 진단을 통해서 치료가 빨리 이뤄져야하기에, 이러한 안타까운 결과가 나오지 않았는가 생각된다 합니다. Mila의 이야기는 비록 해피 엔딩으로 끝나지는 못했지만, 다수의 많은 희귀 질환 (Rare disease) 환자들에게 새로운 희망을 줄 수 있는 개별 맞춤 치료제에 대해 많은 부분들을 시사해줍니다. 이러한 교훈을 바탕으로, 최근에는 더 많은 환자들에게 해당 치료제를 개발하고 안전하게 적용할 수 있는 많은 임상시험들이 진행되고 있습니다.

Mila에 이어, ASO 약물 치료를 시작하게된 많은 희귀 질환 환자 중 한명인 Kuzu. 위 환아는 신경계 이상 질환인 Ataxia-telangiectasia를 3세에 진단받고, Mila보다 조금 더 이른 시기에 치료를 시작하였고, 현재까지 해당 질환의 많은 이상 증상들이 나타나지 않고 있다고 합니다. 연구진에 의하면 아직까지 약물 치료제가 완벽한 성공을 거두었다고 말하기에는 이르지만, 기대가 되는 결과 임에는 분명합니다.

Antisense Oligonucleotides 약물의 작용 기전

Antisense Oligonucletides (ASO)는 위와 같은 기전을 통해, 유전자의 발현을 교정함으로써 이루어지게 됩니다. 돌연변이를 가지고 있는 환자의 이중 나선 DNA에 달라붙는 ASO를 디자인하여, 문제가 있는 유전자의 발현을 교정하는 것이지요. 이상이 있는 단백질이 많이 발현하는 경우에는, 1) 이상 단백의 발현이 일어나지 않게 ASO와 결합하여 분해를 유도 (RNAse H cleavage, RNA interference) 하거나, 2) 이상 단백의 발현을 구조적으로 방해 (Steric hindrance) 하게 됩니다. 반대로, 기능이 망가진 단백질이 발현하는 경우에는 정상 단백질의 발현을 유도하기 위해, 3) 유전자 발현 과정 중 Splicing 위치를 교정 (Splice modulation) 함으로써, 이상 단백질의 발현을 정상화 시킵니다. 위에서 언급한 Mila의 경우에는, 위 그림 중 splicing의 이상이 발생한 경우로 Milasen을 2b)의 기전을 통해 Splice modulation을 함으로써 치료제로 작용하게 됩니다.

다만, 위와 같은 치료제는 어떻게 환자의 이상이 발생하는 부위만 특이적으로 타겟할 것인가? 와 어떻게 효율적으로 환자의 이상이 있는 부위에 전달하는가?와 같은 기술적 문제를 포함하게 됩니다. 특히 ASO의 경우, 외부 물질로 인식이 되기에 면역 반응을 유도할 수 있고, 주사 부위 염증 반응 등의 부작용을 흔하게 발생시키게 됩니다. (Mila의 경우에는 척수강 내에 주입하여, 치료제를 전달하였다고 합니다.)

Milasen의 치료제 개발 및 검증을 위한 전략 및 과정을 보여주는 그림

관련 포스팅 보기

Splicing 과정과 splicing site 변이 해석

앞으로는 유전자 검사가 점점 보편화 되면서, 희귀 질환 환자의 유전 질환의 진단률이 점점 높아질 것으로 보입니다. 이와 더불어 해당 질환의 진단을 통해, 질환의 발생 메커니즘을 이해하게 되면, 이를 통해 환자에게 점점 맞는 맞춤 치료법들도 함께 개발될 수 있을 것으로 기대됩니다. 다만, 이러한 치료제들이 개발되기에는 많은 현실적 장벽들이 남아 있으며, 특히 Mila의 이야기는 환우회, 지역사회 등이 재단을 설립하고, 병원 및 연구소 등이 협력하여 치료제를 개발함으로써 앞으로의 희귀 질환 치료가 나아가야할 방향을 제시해주고 있다는 점에서 많은 시사점을 던져주고 있습니다.

References

Mila 재단 홈페이지: https://www.milasmiracle.org/

Kim, Jinkuk, et al. “Patient-customized oligonucleotide therapy for a rare genetic disease.” New England Journal of Medicine 381.17 (2019): 1644-1652.

Dhuri, Karishma, et al. “Antisense oligonucleotides: an emerging area in drug discovery and development.” Journal of Clinical Medicine 9.6 (2020): 2004.

구조 변이 annotation tool: AnnotSV

유전체 정보로 부터 임상적으로 중요한 변이를 검출하기 위해서는 NGS 시퀀싱 기기의 read 정보로부터 변이 검출까지의 파이프 라인 못지 않게, 얻어낸 수많은 변이로 부터 병인에 중요한 역할을 할 것으로 생각되는 후보 변이를 필터링하는 전략이 매우 중요하게 됩니다. 따라서 적절한 데이터 베이스로 부터 Annotation을 하는 과정은 매우 중요하게 되는데, 이번 포스팅은 다양한 변이 중에서 구조 변이 (Structural variation; SV)을 대상으로 Annotation을 할 수 있는 도구 중에 하나인 AnnotSV에 대해서 소개하고자 합니다. AnnotSV는 이전에 소개했던 Annovar의 CNV (copy number variant) 버젼에 해당한다고 볼 수 있습니다.

[관련 포스팅 보기]

AnnotSV는 다양한 구조 변이의 Annotation 기능 뿐만 아니라, ACMG (American College of Medical Genetics)에서 권장하는 구조 변이의 판독 기준에 따라서, 해당 변이의 중요도를 5가지 카테고리로 구분해줍니다. Input으로는 bed 파일 또는 vcf 파일을 받으며, 다양한 유전자, 조절 인자, 기존에 알려진 병적 변이, 질병과의 연관성 등을 기준으로 ACMG class를 보고해줍니다. 위 그림은 AnnotSV의 이러한 분석 과정을 보여주고 있습니다.

**[bed 파일의 기본 구조]** bed 파일은 1) 염색체 번호 (Chromosome), 2) 시작 지점 (Start), 3) 끝 지점 (End)의 3가지 기본적인 정보를 토대로 유전체 내의 특정 범위에 대한 정보를 제공해줍니다.

구조 변이 (CNV)의 경우, 적은 수의 염기 변이 (SNV)보다 short-read sequencing을 이용하는 경우, 기술적으로 검출하는 해상도의 한계가 있으며 (deletion보다 duplication 검출이 어려움. 충분한 Depth와 Supporting read가 확보되어야 하며, 이 때문에 translocation도 검출이 어려움.) 변이의 해석도 더 어려운 경우가 많습니다. 따라서, 적절한 한계점을 인지하고 적절한 분석 방법론을 적용하는 것이 중요하며, 현재도 많은 부분들이 현재 진행형으로 연구가 되고 있는 분야입니다.

다만, 최근 ACMG에서 구조 변이의 임상적 해석을 위한 Criteria를 제시해주어, 많은 부분 임상적으로 활용이 가능해진 부분이 있습니다. (아래 참고 논문: Riggs, Erin Rooney, et al. Genetics in Medicine 22.2 (2020): 245-257) 그동안 구조 변이의 해석에 여러가지 어려운 점들이 많았는데, 최근 이 쪽 분야도 많은 툴들과 방법론 들이 개발되고 있는 것 같습니다. 그런 점에서 AnnotSV는 구조 변이를 연구하고 해석하는 입장에서 매우 유용한 툴임이 분명합니다.

[References]

AnnotSV Github: https://github.com/lgmgeo/AnnotSV

AnnotSV Homepage: https://www.lbgi.fr/AnnotSV/

Geoffroy, Véronique, et al. “AnnotSV: an integrated tool for structural variations annotation.” Bioinformatics 34.20 (2018): 3572-3574.

Geoffroy, Véronique, et al. “AnnotSV and knotAnnotSV: a web server for human structural variations annotations, ranking and analysis.” Nucleic Acids Research (2021).

Riggs, Erin Rooney, et al. “Technical standards for the interpretation and reporting of constitutional copy-number variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics (ACMG) and the Clinical Genome Resource (ClinGen).” Genetics in Medicine 22.2 (2020): 245-257.

GTEx portal: eqtl, sqtl database

최근의 많은 연구는 Multi-omics data를 활용하여, 대부분 non-coding region에 존재하는 GWAS에서 발굴한 질환 관련 loci가 유전자 발현 수준 (Transcriptome) 또는 발현 조절 (Epigenome)과 관련된 곳임을 입증함으로써, 질병 메커니즘을 설명하려는 방향으로 나가고 있습니다. 특히, 그동안 설명이 되지 않았던 많은 Complex Trait Disease의 경우, 이러한 접근 방법이 추가적으로 많은 생물학적 이해를 가져왔습니다.

[관련 포스팅 보기]

특히, 유전자의 발현과 조절의 경우에는 세포 특이적 (cell type-specific)으로 일어나는 경우가 많기 때문에, 위와 같은 연구를 위해서는 질환 발생을 설명할 수 있는 적절한 세포 수준에서의 Multi-omics 데이터가 확보되어야 합니다. 이러한 연구를 위해 가장 널리 활용되고 있는 곳은 GTEx portal (https://gtexportal.org/) 인데, 현재까지 54개의 조직에서의 유전자 발현량과 유전형과의 관계에 대한 database 를 제공해주고 있습니다.

특히, GTEx의 경우에는 누적된 샘플들을 이용하여, 통계적으로 유전자의 발현과 관계된 Expression Quantitative Trait Loci (eQTL) 과 sQTL (Splicing Quantitative Trait Loci)을 계산하여, 제공하고 있습니다. 추가로, cis-eQTL이 존재하는 eGene과 cis-sQTL이 존재하는 sGene에 대한 정보도 제공합니다.

다만, 대부분 유전자의 발현량과 조절은 세포의 종류에 따라 달라지게 됩니다. 따라서, bulk RNA-seq에서 계산한 eQTL과 sQTL과 달리, 최근에는 세포의 종류를 구분하여 eQTL과 sQTL을 계산하고, 이를 구분하여 cell-type interaction이 있기 때문에 ieQTL과 isQTL이라고 부르고 있습니다. 아래 그림의 C는 전체적으로는 유전자 발현량에 영향이 없지만, Keratinocyte에서 CNTN1의 발현량이 달라지는 ieQTL의 효과를 보여주고 있습니다. 현재 GTEx에서는 조직 수준으로 이를 구분하여 제공하고 있지만, 추후에는 single-cell resoulution으로 모든 세포의 종류에 따른 개별 eQTL과 sQTL database가 구축되지 않을까 기대해 봅니다.

[Reference]

GTEx portal (https://gtexportal.org/)

GTEx Consortium. “The GTEx Consortium atlas of genetic regulatory effects across human tissues.” Science 369.6509 (2020): 1318-1330.

Kim-Hellmuth, Sarah, et al. “Cell type–specific genetic regulation of gene expression across human tissues.” Science 369.6509 (2020).

AlphaFold를 이용한 단백질 구조 예측

최근 Alphafold의 소스 코드와 전체 단백질 예측 구조 데이터 베이스가 공개되면서, 정말 다양한 방면에 활용이 가능할 것으로 생각되고 있습니다. 유전체 연구자의 입장에서는 Alphafold를 이용하면 수 많은 변이들의 in-silico structural prediction이 가능하기에, 과거에 존재하던 variant prediction tool들 보다 훨씬 강력하고 정확한 예측 도구가 나타날 것으로 생각됩니다. 이번 포스팅은 공개된 Alphafold2의 소스 코드와 데이터 베이스 자료를 정리해보고자 합니다.

Alphafold2의 경우, 기존에 실험적으로 17% 정도만 알려져있던 단백질의 3차원적인 구조를 딥러닝 기법을 활용하여, 존재하는 거의 모든 단백질에 대해서 높은 정확도로 예측하여 해당 구조를 데이터베이스로 제공하고 있습니다. 이는 과거에 알지 못했던 많은 단백질의 3차원 구조들에 대한 높은 예측을 제공하기 때문에, 완전히 새로운 필드를 열었다고 해도 과언이 아닙니다. 특히나 단백질의 3차원 모델화가 가능하다는 것은 이 모델을 활용하여 추후에 파생되는 약물 상호 작용이나 변이의 효과에 대한 예측도 가능하다는 이야기가 되기 때문에, 그 파급력은 더욱 클 것으로 생각됩니다.

현재 AlphaFold Protein Structure Database는 약 2만개의 단백질에 대한 정상 구조를 예측되어 제공하고 있지만, 개인적으로는 인간의 유전체에 존재하는 수 많은 변이 (Missense & Indel variants) 에 대해, mutant protein 들의 예측도 포함하는 Database가 update가 되길 기대해 봅니다. 현재까지의 아미노산 서열의 변화에 대한 많은 예측 Tool이 개발되었지만, 임상적으로 해석하고 활용하기에는 많은 한계가 있었는데, 최종 변이 단백질의 구조를 높은 정확도로 예측할 수 있다면, 그 해석과 활용도 용이해지기 때문입니다. 단백질 하나에 존재할 수 있는 아미노산 변이의 종류는 수만가지가 넘을 것이기 때문에 (아미노산 20종 x 단백질 서열 크기 500~2,000개 아미노산), 이러한 Database를 구축하기 위해서 컴퓨터가 연산해야할 데이터량이 무지막지하겠지만, 결국에는 이러한 in-silico saturated mutagenesis proteome Database도 추후에 구축되지 않을까 예상합니다. (~~비트 코인 채굴하는 자원이면, 금방 될 듯 합니다…~~)

[관련 포스팅 보기]

[References]

Deepmind Blog 소개 글: https://deepmind.com/blog/article/putting-the-power-of-alphafold-into-the-worlds-hands

Open source github 자료: https://github.com/deepmind/alphafold/

AlphaFold Protein Structure Database: https://alphafold.ebi.ac.uk/

Ju mper, John, et al. “Highly accurate protein structure prediction with AlphaFold.” Nature (2021): 1-11.

Jumper, J., Evans, R., Pritzel, A. et al. “Highly accurate protein structure prediction with AlphaFold”. Nature (2021).

Epigenomic profiling을 위한 ATAC-seq

최근 많은 연구들에서 유전자 자체의 염기 서열과 발현량 못지 않게, 유전자 발현을 조절하는 Epigenetics가 다양한 생물학적 메커니즘에 매우 중요하게 작용하는 것으로 밝혀지고 있습니다. 이번 포스팅은 지난 번 포스팅에 이어, Epigenetics 정보를 얻는데 널리 쓰이는 Assays for Transposase Accessible Chromatin with high-throughput sequencing (ATAC-seq)에 대해서 정리해 보고자 합니다.

Epigenetics와 관련된 정보를 얻는 방법은 매우 다양합니다. 아래 그림과 같이, 일종의 표지자로 작동하는 DNA methylation 정보나 염색질의 접근도, 전사 인자의 결합력, 유전체의 3차원적인 구조 변화 등이 모두 유전자 발현과 관련된 후성 유전학적 정보들을 제공해주게 됩니다. 그러나, 최근에 가장 널리 쓰이는 Epigenome 시퀀싱 방법은 염색질의 접근도 (Chromatin Accessibility) 와 관련된 정보를 제공하는 ATAC-seq입니다.

[관련 포스팅 보기]

먼저, ATAC-seq의 단어의 의미를 살펴보면, 다음과 같습니다.

Assays for Transposase Accessible Chromatin with high-throughput sequencing = Transposase 가 접근 가능한 염색질 (chromatin)을 검사하는 높은 처리량의 시퀀싱 기법

유전자가 발현하기 위해서는 실타래와 같이 뭉쳐있던 염색질 (Chromatin) 구조에 변화가 일어나야 합니다. 즉, Heterochromatin 상태 (closed) 에서 Euchromatin 상태 (open) 로 변화가 일어나면서, 유전자 발현과 관계된 다양한 transcription factor들이 물리적으로 접근을 하게 됩니다. ATAC-seq은 Tn5 transposase라고 하는 인공적으로 합성하여 활성을 높힌 transposase를 사용하여, Open chromatin 상태의 염색질들에 Adaptor를 붙히고, 시퀀싱을 하게 됩니다.

Open chromatin 상태의 염기 서열들은 Transposase가 붙인 Adaptor로 인해, 시퀀싱이 많이되어 read가 만들어지고, 반대로 Closed chromatin 부위는 read가 생산되지 않게 됩니다. 즉, 아래 그림과 같이 시퀀싱을 통해, 증폭 부위의 정보를 얻게되면, 거꾸로 어떤 부위가 Open chromatin 상태이고, 어떤 부위가 Closed chromatin 상태인지에 대한 정보를 얻을 수 있게 됩니다.

최근에는 Single cell sequencing 기술과 접목하여, single cell ATAC sequencing (scATAC-seq)을 통해 세포 개별 Chromatin Accessibility 정보를 얻는데 많이 사용하고 있습니다. 더불어, single cell RNA sequencing (scRNA-seq) 과 함께 시행하여 다양한 세포군을 구분하고, 발생 과정에 따른 유전자 발현 패턴을 알아보는데 상호 보완적으로 사용하기도 합니다. 다양한 시공간 상에서 일어나는 생명 현상을 기술적 발전을 통해 점점 다양한 차원에서 분석함으로써, 질병의 발생 메커니즘을 이해하고, 치료하는데 응용하기 위한 다양한 생물학 분야의 연구가 진행되고 있습니다. 이러한 시도는 정밀 의료를 위한 다양한 연구의 밑거름으로 중요하게 생각되고 있습니다.

single cell ATAC-seq과 RNA-seq을 동시에 시행하여, 세포 발생 과정에서 유전자의 발현을 분석하는 SHARE-seq 방법.

[ References ]

Buenrostro, Jason D., et al. “Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position.” Nature methods 10.12 (2013): 1213-1218.

Luo, Cheng, Alisdair R. Fernie, and Jianbing Yan. “Single-cell genomics and epigenomics: technologies and applications in plants.” Trends in Plant Science 25.10 (2020): 1030-1040.

Ma, Sai, et al. “Chromatin potential identified by shared single-cell profiling of RNA and chromatin.” Cell 183.4 (2020): 1103-1116.

[유전학 중요개념 정리] 오믹스 (Omics) 와 단일 세포 시퀀싱 (Single cell sequencing)

현재 있는 미국의 연구실은 다양한 Omics 데이터를 종합적으로 분석하여, 소아 신증후군의 정밀 의료 실현을 위한 연구를 진행하고 있습니다. 아래의 관련 포스팅과 같이, 다양한 유전체 연구 결과 대부분의 복합질환 질병 발생은 유전체의 유전자 발현을 조절하는 부분, 그리고 non-coding 영역에 존재함을 확인하게 되었습니다. 이에 연구자들은 이러한 부분이 어떠한 기작을 통해서, 질병을 발생을 시키는지에 대한 연구를 진행하고 있으며, 이러한 연구 방법론의 하나로 다양한 오믹스 관련 생명 정보들을 통합적으로 분석하고 있습니다. 오늘은 (~~최근에 미국의 PI와 관련 리뷰 논문을 준비하게 되어,~~) 오믹스 관련 분석 중에서 중요한 단일 세포 시퀀싱 (Single Cell Sequencing) 기술에 대해서 정리하는 포스팅을 남기고자 합니다.

[관련 포스팅 보기]

Omics의 개념

단일 세포 시퀀싱을 언급하기에 앞서, Omics 의 개념에 대해서 간단히 정리하고자 합니다. -ome은 집합체 (집단, 묶음)를 의미하는 접미어로 Genome (유전자의 집합체 = 유전체), Epigenome (후성 유전인자의 집합체 = 후성유전체), Transcriptome (전사인자의 집합체 = 전사체), Proteome (단백질의 집합체 = 단백체) 등 일반적으로 생물 유래의 집합체를 모두 총칭합니다. 아래 그림과 같이, 이외에도 Metabolome (대사체), Microbiome (미생물군유전체) 등을 포함하고 있습니다. 인간의 유전자 서열 (Genome)은 고정되어 있지만, 조직과 세포 종류에 따라서 유전자의 발현이 달라지고, 그에 따라 단백질의 양과 기능도 달라지게 됩니다. 즉, 유전자 서열을 해독하는 것 이상으로 훨씬 더 복잡한 유전자의 조절 기작을 이해하는 것이 질병 발생 메커니즘을 밝혀, 치료에 적용하는데 매우 중요하게 됩니다. 따라서, 유전자 서열 만으로는 설명이 되지 않는 많은 부분들은 그 보다 더 높은 차원에 존재하는 다양한 Omics들을 분석함으로써 이해하고자 하는 것이 Omics의 목표입니다.

단일 세포 분석이 왜 중요한가? Bulk vs. Single cell

우리 몸의 모든 세포는 체세포 변이 (Somatic mutation)를 제외하고 기본적으로 동일한 유전자의 염기 서열 (Germline)을 공유하고 있습니다. 그러나 조직과 기관에 따라 다양한 세포군이 서로 다른 기능을 수행하면서 생명현상을 이어나가고 있습니다. 따라서 세포의 종류에 따라 세포 특이적인 유전자의 발현 패턴의 차이를 확인하는 것은 매우 중요하게 됩니다. 그러나 전통적인 Bulk RNA-seq (전사체 시퀀싱)의 경우는 모든 세포들을 하나로 pooling하여 유전자의 발현량의 평균 값만을 구할 수 있게 됩니다. 그에 반해 단일 세포 시퀀싱 (Single cell RNA-seq)은 개별 세포를 세포의 종류에 따라 분류하고, 개별 세포의 발현량을 구할 수 있기 때문에 더 정확하게 개별 세포의 유전자 발현량의 차이를 알 수 있다는 장점이 있습니다. 특히나 종양 세포와 같은 경우에는 이질성 (Tumor heterogeneity)이 매우 크기 때문에, 집단의 유전자 발현이 개별 세포를 모두 대표하기 어려운 경우가 많습니다. 이러한 장점으로 인해, 최근에는 단일 세포의 다양한 omics data를 profiling하는 것이 점점 폭넓게 연구되고 있습니다.

[Bulk vs. Single cell RNA 시퀀싱의 비교] 기술적 발전으로 인해, 개별 세포의 유전자 발현 패턴을 더 정확하게 검출할 수 있게 되었습니다.

어떻게 단일 세포로 분리하는가?

위 그림은 세포들을 개별 세포로 분리하는 다양한 기술들을 보여주고 있습니다. 최근 널리 쓰이는 가장 대표적인 기술은 세포들을 개별 미세 유체 방울로 분리하는 Microfluidic droplet 기반의 기술 (Chromium 10X)과 비슷하게 하나의 plate에서 미세하게 세포를 흘려 분리하는 Microfluidic plate 기반의 기술 (Fluidigm C1)이 있습니다. Fluidigm C1 기술은 구분할 수 있는 세포의 수는 적지만 더 폭넓고 많은 전사체 시퀀싱 결과를 얻을 수 있다는 장점이 있고, Chromium 기술은 그에 반해 더 많은 수의 세포를 얻을 수 있지만, 얻을 수 있는 시퀀싱 리드의 정보는 제한적이라는 차이가 있습니다. 아래 표와 같이 연구자들은 실험의 목적에 따라서 각 방법의 장단점을 파악하고 사용하는 것이 좋겠습니다.

다음 포스팅에서는 이러한 단일 세포 분석 기술을 바탕으로 Epigenome과 Transcriptome을 분석하는데 중요한 개념인 scATAC-seq에 대해서 정리하도록 하겠습니다.

[ References ]

Murphy, Rachel. “An Integrative Approach to Assessing Diet–Cancer Relationships.” Metabolites 10.4 (2020): 123.

Kolodziejczyk, Aleksandra A., et al. “The technology and biology of single-cell RNA sequencing.” Molecular cell 58.4 (2015): 610-620.

Kashima, Yukie, et al. “Single-cell sequencing techniques from individual to multiomics analyses.” Experimental & Molecular Medicine 52.9 (2020): 1419-1427.

[논문소개] 면역억제제 Tacrolimus의 약물 유전체 연구

작년부터 미국에 오기 전까지 부랴 부랴 동시에 4개의 논문을 쓰고 있었는데, 그중 2개 논문의 온라인 출판이 완료 되었습니다. 그래서 앞의 논문을 소개한 김에, 함께 출판된 다른 약물 유전체 연구도 소개를 해볼까 합니다. 이번 연구의 프로젝트도 약리학 교실에 처음 박사 과정으로 들어오면서 부터 시작했던 프로젝트인데, 장기 이식 후의 면역 억제제로 널리 사용하는 Tacrolimus와 관련된 약물 유전체 연구입니다. 개인적으로는 처음으로 본격적으로 NGS 패널과 Microarray인 한국인칩을 분석하면서 진행했던 프로젝트입니다.

[관련 논문 보기]

https://journals.lww.com/transplantjournal/Abstract/9000/Unraveling_the_Genomic_Architecture_of_the_CYP3A.95339.aspx

논문의 제목은 “Unraveling the Genomic Architecture of the CYP3A Locus and ADME Genes for Personalized Tacrolimus Dosing“으로, 장기 이식 수술 후 면역 억제 반응을 위해 사용하는 Tacrolimus의 약물 대사에 관여하는 약물 유전자의 변이들과 개인간의 약물 농도의 변화를 살펴봄으로써, 유전자의 기능에 따라 환자 개인별 최적 처방 용량을 guide하기 위해 진행했던 연구입니다.

[관련 포스팅 보기]

사실 본 연구 주제는 그동안 많은 연구자들이 달려들어서 진행해왔고, CYP3A5의 변이 (rs776746)가 Tacrolimus 대사능과 관련이 있다는 것이 매우 잘 알려져 왔으나, 해당 변이로는 개인간 편차의 50% 정도 밖에 설명할 수가 없어서, 추가적으로 다른 유전자를 발굴하는 것이 많은 연구자들이 목표였습니다. 이번 연구에서는 약물 유전자 전체를 스크리닝할 수 있는 약물 유전체 NGS 패널 (PGx panel) 과 한국인 특이 변이를 탐색할 수 있는 한국인칩 (Korean Chip)를 이용하여, 해당 문제를 풀려고 하였습니다.

연구 결과, 역시 기존에 알려져 있던 CYP3A5의 rs776746 변이 가 제일 중요한 인자로 작용함을 확인했고, 개인별로 드물게 존재하는 CYP3A5, CYP3A4의 희귀 변이 (rare variant)를 이용하면, 추가적으로 rs776746 의 변이가 설명하지 못했던 개인간 편차를 더 잘 설명할 수 있음을 확인하였습니다. 이 결과는 개별 맞춤 약물 처방을 하는데, 개인별로 드물게 존재하는 희귀 변이 (rare variant)를 고려하는 것이 매우 중요함을 시사합니다.

특히, 연구의 분석을 위해서, 서울대 이승근 교수님께서 개발하신 SKAT이라는 분석 방법을 이용하였는데, 이 tool을 이용하여 최초로 CYP1A1 유전자의 희귀 변이들과 Tacrolimus 개인간 편차와의 연관성을 확인하였습니다. 다만, 이번 연구를 통해 다시 한번 약물의 대사는 매우 복잡하고 다양한 인자들이 confounder로 작용하기 때문에 개별 유전형 외에도 유전자 발현에 영향을 미치는 다양한 환경적 변수들을 고려해야함을 깨달을 수 있었습니다. 본 연구 결과가 면역 억제제 Tacrolimus를 투여 받는 환자들이 개별 약물 유전형에 따라서, 부작용이 발생하지 않는 최적의 처방 용량을 결정하는데 도움이 되고, 이를 통해 정밀 의료 (Precision Medicine) 가 실현될 수 있기를 기대합니다.

[관련 Commentary 보기]

https://journals.lww.com/transplantjournal/Citation/9000/COMMENTARY__Unraveling_the_Genomic_Architecture_of.95395.aspx

[논문 소개] 담관암(Biliary Tract Cancer)의 정밀 의료 실현을 위한 연구

작년부터 미국에 오기 직전까지 부랴부랴 리비젼을 하느라 너무 힘들었던 논문이 드디어 온라인 게제가 되어서, 소개를 해볼까합니다. 사실 이 프로젝트는 2017년부터 무려 햇수로는 4년간 끌어왔던 프로젝트인데, 그래도 이렇게 마무리를 짓고 소개를 할 수 있어서 다행입니다. 유전체 연구로 박사 과정을 막 시작하면서, 평소에 알고 지내던 김민환 교수님으로 부터 담관암 (Biliary Tract Cancer) 공동연구를 제안 받게 되었고, 매우 힘들고 지난했던 시간들을 겪으면서 마무리를 짓게 되었습니다.

[관련 논문 보기]

https://aasldpubs.onlinelibrary.wiley.com/doi/abs/10.1002/hep.31862

논문의 제목은 “Molecular Characterization of Biliary Tract Cancer Predicts Chemotherapy and PD‐1/PD‐L1 Blockade Responses“으로, 우리 나라를 포함한 동아시아에 호발하는 담관암의 약물 치료 (화학항암제와 면역항암제) 반응에 관한 유전체 연구입니다. 사실 이 블로그에도 이 연구를 진행하면서, 공부했던 많은 흔적들이 남아있기도 합니다.

[관련 포스팅 보기]

담관암은 그 해부학적 위치 때문에 매우 이질적이고, 같은 종류의 암도 유전적 특성이 다양합니다. 매우 불량한 예후와 달리, 약물 치료 옵션은 매우 제한적이고, 아직까지 어떤 환자가 어떤 치료제에 잘 반응을 할지 예측하기가 어렵습니다. 이번 연구는 이러한 어려움을 겪는 담관암 환자들에게 도움이 되기를 바라는 마음에서 진행했습니다. 개인적으로는 병원에서 인턴 생활을 하면서, 너무나 힘들게 투병 생활을 하셨던 담관암 환자 분이 기억에 나서, 그 분을 생각하면서 진행했던 연구이기도 합니다.

이번 연구에서는 수술적으로 절제가 불가능하거나 재발하여 항암 치료를 받는 담도암 환자들을 대상으로 환자의 치료 반응과 종양의 어떤 유전적 변화가 관련이 있는지를 종합적으로 분석했습니다. 담도암은 해부학적 위치에 따라, 간내담관암 (Intrahepatic cholangiocarcinoma, ICC), 간외담관암 (Extrahepatic cholangiocarcinoma, ECC), 담낭암 (Gallbladder cancer, GBC), 그리고 바터팽대부암 (Ampullar of Vater cancer, AOV) 으로 구분합니다. 특히, 같은 간내담관암 (ICC)도 병리학적 & 분자생리학적으로 완전히 다른 대담관 (large-duct)과 소담관 (small-duct) 유형으로 구분을 할 수 있는데, 이 두 유형의 확연히 다른 항암제 반응에 착안하여 항암제 반응과 연관된 유전적 변화를 발굴하는 실마리를 얻을 수 있었습니다. 더불어 최근 매우 중요한 치료 옵션으로 각광받고 있는 면역 항암제의 경우, 담관암에서는 반응성을 보이는 경우가 매우 드문데, 치료에 반응하지 않는 저항성과 연관된 유전적 변화를 발굴하여, 이를 바탕으로 어떠한 환자에게 면역 항암제가 효과적으로 쓰일 수 있을지를 제시할 수 있었습니다.

개인적으로는 연구를 진행하면서 Somatic mutation panel을 경험하며, NGS 분석에 더 많은 내공을 쌓을 수 있는 좋은 기회가 되었던 것 같습니다. 이번 연구 결과가 많은 담관암 환자들이 최적의 치료를 받을 수 있는 치료 전략을 수립하는데 기여할 수 있기를 바랍니다.

[관련 기사 보기]

유전학 연구에서의 표현형: Phenotype is king, genotype is queen

유전학 연구자들 사이에서 가장 유명한 격언이 있습니다. “유전형이 여왕이라면, 표현형이 왕이다.” 이 문장은 유전형도 매우 중요하지만, 결국 더 중요한 것은 표현형이라는 내용을 함축적으로 담고 있습니다.

“Phenotype is king, genotype is queen.”

많은 사람들은 유전 정보만 얻으면, 개인 맞춤 치료와 정밀 의료를 실현할 수 있을 것처럼 떠들어 대는 미디어의 광고를 보면서, 이를 곧이 곧대로 받아들이곤 합니다. 그러나 유전 정보를 얻기 쉬워진 현재 시점에서의 진정한 병목 지점 (Bottle neck, rate limiting step)은 오히려 충분하고 효과적이며 꼼꼼한 표현형에 대한 정보 수집입니다. 유전형과 다르게 표현형 정보는 수집이 매우 까다롭고 귀찮습니다. 더불어, 같은 것을 지칭하는 표현형이라 하더라도 객관적인 기술이나 정량화하여 나타내는 것이 어려울 수도 있으며, 측정 자체가 모호한 경우도 많습니다. 그래서 사실 제가 연구실에서 보내는 많은 시간의 노가다도 이런 표현형 정보에 대한 수집 (이라고 쓰고 환자 차트 리뷰 라고 적는다)에 쓰입니다. (여담이지만, 공동 연구를 하시는 임상 선생님들이 전달해주시는 표현형 정보는 많은 경우, 틀리거나 이른바 정밀 의료를 위한 연구에는 부족한 경우가 매우 많습니다. 이 때문에 저는 환자를 전부 다시 리뷰하고 표현형 정보를 수집하곤 합니다. 그러다 빡쳐서 이글을 쓰는 것은 아닙니다..)

유전학 도구들의 기술적 발달로 유전 정보, 이른바 유전형 (Genotype)을 얻는 것은 매우 쉬워졌습니다. 연구자들은 이러한 유전형을 바탕으로 유전자 발현의 변화 (RNA level), 유전자 산물인 단백질의 기능 변화 (Protein level), 세포 및 조직의 변화 (Cell & Tissue), 그리고 최종적으로 도출되는 표현형 (Phenotype)까지의 긴 여정을 유전형 만을 이용해서 예측하는 것을 목표로 많은 연구를 진행하고 있습니다. 위의 긴 여정에서 한 단계씩 차원이 높아질 때마다, 변수와 복잡도는 기하급수적으로 증가하고, 실제로 예측은 점점 더 어려워집니다. 따라서, 이러한 복잡도의 차원을 낮춰서 조금 더 단순하게 개별 과정에서의 변화를 살펴보기 위한 방법이 다양한 Omics 기반의 연구입니다. 하지만 그럼에도 정말로 중요한 유전형의 변화는 심각한 표현형의 변화를 초래하게 되고, 이러한 큰 흐름속에서 질병의 병인 기전을 이해하고, 이를 바탕으로 치료제 개발을 진행하게 됩니다.

Fig-1-Data-integration-from-multiple-Omics-platforms-genomics-transcriptomics_W640 — Genome에서 Phenome에 이르기까지의 긴 여정의 실타래를 푸는 일이야 말로, 정밀 의료 실현을 위해 선행되어야할 조건들입니다.

유전학 연구 방법론은 크게 Forward Genetics (정유전학) 와 Reverse Genetics (역유전학)로 구분이 되는데, 전자는 특정 표현형으로 부터 원인 유전자를 찾는 방식이고, 후자는 특정 유전자가 어떠한 표현형의 변화를 초래하는지 찾는 접근 방식으로 아래 그림은 유전형 <-> 표현형의 관계와 연구 접근 방식을 잘 나타내주고 있습니다. 전통적으로 유전 정보를 찾기 어려웠던 과거에는 표현형으로 부터 연관된 유전자를 찾는 정유전학적 접근이 대부분이었다면, 유전 정보를 쉽게 얻을 수 있는 오늘 날에는 기능이 밝혀지지 않은 많은 유전자들이 어떠한 표현형에 관여하는지를 찾는 역유전학 연구 방법이 대세가 되었습니다.

Fig-2-Forwards-vs-reverse-genetics-tools-for-the-identification-and-characterization_W640 — [유전학 연구 방법론] Forward and Reverse Genetics에서의 표현형과 유전형의 관계

최근에는 이에 따라, 표현형의 중요성이 점점 더 부각되고 있으며, 표현형 (Phenotype)의 모음을 Phenome 이라고 부릅니다. GWAS 접근법과 유사하게, 특정 유전자 위치 (고정 변수)에 대해 모든 표현형을 탐색하여 연관 관계를 찾는 분석 방법을 Phenome wide association study (이른바, PheWAS)라고 부릅니다. 이를 위해서는 적절한 Phenome database가 구축되어야 하는데, 이러한 Database 중에 유전학 연구에 많이 사용되는 대표적인 곳으로는 Human Phenotype Ontology (HPO), Mouse Phenome Database (MPO) 등이 있습니다.

Human Phenotype Ontology (HPO) > 바로가기

Mouse Phenome Database (MPO) > 바로가기

마지막으로 다시 한번 표현형의 중요성에 대해 언급하고, 이번 포스팅을 마치고자 합니다. 아래의 논문에 소개된 사례는 잘못된 유전자 검사로 인한 오진단 사례와 관련하여, 표현형이 얼마나 중요한지를 단적으로 잘 보여주고 있습니다.

They concluded, “Remember the mantra that ‘phenotype is king, genotype is queen,’ and if the subjectively and objectively ascertained phenotype is not matching the alleged genotype, stop and reassess. In other words, phenotyping still matters most.”

McCarthy, Michael. “Phenotype is king, researchers say, after 20 family members have condition misdiagnosed.” (2016): i5884.

Ackerman, Jaeger P., et al. “The promise and peril of precision medicine: phenotyping still matters most.” Mayo Clinic Proceedings. Vol. 91. No. 11. Elsevier, 2016.

관련 포스팅 보기>

[유전학 중요개념 정리] Muller’s morph와 gain of function, loss of function variant

NGS 결과의 임상 적용: Genotype-phenotype correlation

전장 유전체 연관 분석, GWAS란 무엇인가?

[References]

Ben-Amar, Anis, et al. “Reverse genetics and high throughput sequencing methodologies for plant functional genomics.” Current Genomics 17.6 (2016): 460-475.

Oti, Martin, Martijn A. Huynen, and Han G. Brunner. “The biological coherence of human phenome databases.” The American Journal of Human Genetics 85.6 (2009): 801-808.

Genomics of Drug Sensitivity in Cancer (GDSC): 항암제에 대한 암세포주 반응 Database

종양학 (Oncology)에서의 정밀 의료는 암세포의 돌연변이 프로필 (Mutational Profile)에 대한 정보를 얻고, 이를 바탕으로 항암제 또는 기타 약물의 효과를 예측해서, 환자에게 최적의 치료 효과를 낼 수 있는 치료를 하는 것이 목적입니다. 하지만, 종양 세포가 가지고 있는 복잡하고 다양한 돌연변이로 인해서, 특정 바이오 마커를 이용하여 실제 임상 현장에서 약물의 치료 효과를 예측하고 활용하는데에는 많은 한계가 존재합니다. 특히, 이를 위해서는 실제로 약물의 효과를 예측하는 효과적인 바이오마커가 발굴되어야 하는데, 이러한 작업은 다양한 변수들로 인해서 쉽지가 않습니다. 오늘 포스팅할 내용은 이러한 노력의 연장선에서, 약 1000여개의 확립된 인간 암세포주들에 대해 500여개의 항암제로 처리하여 각각의 세포를 죽일 수 있는 농도 (IC50 values, 50%의 세포가 죽는 농도)를 스크리닝하고, 각각의 세포주가 가지고 있는 돌연변이 프로필에 대한 정보를 제공하고 있는 Database인 Genomics of Drug Sensitivity in Cancer (https://www.cancerrxgene.org/)에 대해서 소개하고자 합니다. 이러한 대규모 스크리닝과 통계적 접근을 통해서, 어떠한 돌연변이가 어떠한 약물에 효과가 있는지 또는 저항성을 보이는지에 대한 분석이 가능하고, 궁극적으로 약물 효과를 예측하는 바이오 마커를 찾아내는게 가능해지게 됩니다.

overview — GDSC Website (https://www.cancerrxgene.org/)에서는 다양한 암종의 Pathway를 타겟으로 하는 약물에 대한 암세포주의 스크리닝 결과를 제공하고 있습니다.

위의 사이트에 들어가면, 다양한 세포주 정보, 돌연변이 정보, 그리고 약물 스크리닝 결과를 항목별로 조회할 수 있으면, 해당 데이터도 다운로드가 가능합니다.

위의 그림은 KRAS 돌연변이를 가지고 있는 세포주들에 대해서 통계적으로 유의미하게 효과가 있거나, 저항성을 나타내는 약물에 대한 Volcano plot을 보여주고 있습니다. 이러한 세포주 결과를 통해서, KRAS 돌연변이 암세포에 대해서는 효과를 나타내는 약물 (위 그림의 초록색)을 타겟 치료의 후보로 생각해 볼 수 있습니다.

또한 비슷하게, 개별 약물에 대해서 조회를 하면, 세포주 중에서 해당 돌연변이를 가지고 있는 세포주와 가지고 있지 않은 세포주의 반응을 통계적으로 분석하여 Scatter Plot으로 제공해주고 있기도 합니다. 위의 그림은 Ibrutinib에 대해서 KRAS 돌연변이를 가지고 있는 세포들이 더 높은 IC50를 가져서, 저항성이 높다는 것을 보여주고 있습니다.

현재 위와 같은 시도는 인간 유래의 확립된 세포주 (Human Cancer Cell Lines)들에 대해서 스크리닝이 진행되고 있습니다. 추후에는 궁극적으로는 환자 개개인의 암 세포 또는 종양 오가노이드 (Organoid)를 이용하여 비슷한 접근을 한 후에, 치료 효과를 판정하고, 이를 바탕으로 치료제를 선택하는 날이 올 것으로 기대되고 있습니다. 다만, 위의 방법은 약물에 의해 세포를 직접적으로 죽이는 효과이기 때문에 면역항암제와 같이 환자 체내에서 일어나는 면역 반응을 이용하는 치료제에 대해서는 효과를 보기 어렵다는 단점이 있습니다. 위의 GDSC 프로젝트에 대해서자세히 나와있는 논문들을 Reference에 남기며, 이번 포스팅은 마무리하도록 하겠습니다.

관련 포스팅 보기>

DNA 손상 복구 기전과 타겟 치료 항암제

[실험실 노트] Organoid의 기본 개념과 활용

면역 항암제, Immune checkpoint inhibitor의 원리 및 종류

동반 진단, Companion diagnostics란 무엇인가?

[References]

Yang, Wanjuan, et al. “Genomics of Drug Sensitivity in Cancer (GDSC): a resource for therapeutic biomarker discovery in cancer cells.” Nucleic acids research 41.D1 (2012): D955-D961.

Garnett, Mathew J., et al. “Systematic identification of genomic markers of drug sensitivity in cancer cells.” Nature 483.7391 (2012): 570-575.

Iorio, Francesco, et al. “A landscape of pharmacogenomic interactions in cancer.” Cell 166.3 (2016): 740-754.