Epigenomic profiling을 위한 ATAC-seq

최근 많은 연구들에서 유전자 자체의 염기 서열과 발현량 못지 않게, 유전자 발현을 조절하는 Epigenetics가 다양한 생물학적 메커니즘에 매우 중요하게 작용하는 것으로 밝혀지고 있습니다. 이번 포스팅은 지난 번 포스팅에 이어, Epigenetics 정보를 얻는데 널리 쓰이는 Assays for Transposase Accessible Chromatin with high-throughput sequencing (ATAC-seq)에 대해서 정리해 보고자 합니다.

Epigenetics와 관련된 정보를 얻는 방법은 매우 다양합니다. 아래 그림과 같이, 일종의 표지자로 작동하는 DNA methylation 정보나 염색질의 접근도, 전사 인자의 결합력, 유전체의 3차원적인 구조 변화 등이 모두 유전자 발현과 관련된 후성 유전학적 정보들을 제공해주게 됩니다. 그러나, 최근에 가장 널리 쓰이는 Epigenome 시퀀싱 방법은 염색질의 접근도 (Chromatin Accessibility) 와 관련된 정보를 제공하는 ATAC-seq입니다.

[관련 포스팅 보기]

먼저, ATAC-seq의 단어의 의미를 살펴보면, 다음과 같습니다.

Assays for Transposase Accessible Chromatin with high-throughput sequencing = Transposase 가 접근 가능한 염색질 (chromatin)을 검사하는 높은 처리량의 시퀀싱 기법

유전자가 발현하기 위해서는 실타래와 같이 뭉쳐있던 염색질 (Chromatin) 구조에 변화가 일어나야 합니다. 즉, Heterochromatin 상태 (closed) 에서 Euchromatin 상태 (open) 로 변화가 일어나면서, 유전자 발현과 관계된 다양한 transcription factor들이 물리적으로 접근을 하게 됩니다. ATAC-seq은 Tn5 transposase라고 하는 인공적으로 합성하여 활성을 높힌 transposase를 사용하여, Open chromatin 상태의 염색질들에 Adaptor를 붙히고, 시퀀싱을 하게 됩니다.

Open chromatin 상태의 염기 서열들은 Transposase가 붙인 Adaptor로 인해, 시퀀싱이 많이되어 read가 만들어지고, 반대로 Closed chromatin 부위는 read가 생산되지 않게 됩니다. 즉, 아래 그림과 같이 시퀀싱을 통해, 증폭 부위의 정보를 얻게되면, 거꾸로 어떤 부위가 Open chromatin 상태이고, 어떤 부위가 Closed chromatin 상태인지에 대한 정보를 얻을 수 있게 됩니다.

최근에는 Single cell sequencing 기술과 접목하여, single cell ATAC sequencing (scATAC-seq)을 통해 세포 개별 Chromatin Accessibility 정보를 얻는데 많이 사용하고 있습니다. 더불어, single cell RNA sequencing (scRNA-seq) 과 함께 시행하여 다양한 세포군을 구분하고, 발생 과정에 따른 유전자 발현 패턴을 알아보는데 상호 보완적으로 사용하기도 합니다. 다양한 시공간 상에서 일어나는 생명 현상을 기술적 발전을 통해 점점 다양한 차원에서 분석함으로써, 질병의 발생 메커니즘을 이해하고, 치료하는데 응용하기 위한 다양한 생물학 분야의 연구가 진행되고 있습니다. 이러한 시도는 정밀 의료를 위한 다양한 연구의 밑거름으로 중요하게 생각되고 있습니다.

single cell ATAC-seq과 RNA-seq을 동시에 시행하여, 세포 발생 과정에서 유전자의 발현을 분석하는 SHARE-seq 방법.

[ References ]

Buenrostro, Jason D., et al. “Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position.” Nature methods 10.12 (2013): 1213-1218.

Luo, Cheng, Alisdair R. Fernie, and Jianbing Yan. “Single-cell genomics and epigenomics: technologies and applications in plants.” Trends in Plant Science 25.10 (2020): 1030-1040.

Ma, Sai, et al. “Chromatin potential identified by shared single-cell profiling of RNA and chromatin.” Cell 183.4 (2020): 1103-1116.

[유전학 중요개념 정리] 오믹스 (Omics) 와 단일 세포 시퀀싱 (Single cell sequencing)

현재 있는 미국의 연구실은 다양한 Omics 데이터를 종합적으로 분석하여, 소아 신증후군의 정밀 의료 실현을 위한 연구를 진행하고 있습니다. 아래의 관련 포스팅과 같이, 다양한 유전체 연구 결과 대부분의 복합질환 질병 발생은 유전체의 유전자 발현을 조절하는 부분, 그리고 non-coding 영역에 존재함을 확인하게 되었습니다. 이에 연구자들은 이러한 부분이 어떠한 기작을 통해서, 질병을 발생을 시키는지에 대한 연구를 진행하고 있으며, 이러한 연구 방법론의 하나로 다양한 오믹스 관련 생명 정보들을 통합적으로 분석하고 있습니다. 오늘은 (최근에 미국의 PI와 관련 리뷰 논문을 준비하게 되어,) 오믹스 관련 분석 중에서 중요한 단일 세포 시퀀싱 (Single Cell Sequencing) 기술에 대해서 정리하는 포스팅을 남기고자 합니다.

[관련 포스팅 보기]

Omics의 개념

단일 세포 시퀀싱을 언급하기에 앞서, Omics 의 개념에 대해서 간단히 정리하고자 합니다. -ome은 집합체 (집단, 묶음)를 의미하는 접미어로 Genome (유전자의 집합체 = 유전체), Epigenome (후성 유전인자의 집합체 = 후성유전체), Transcriptome (전사인자의 집합체 = 전사체), Proteome (단백질의 집합체 = 단백체) 등 일반적으로 생물 유래의 집합체를 모두 총칭합니다. 아래 그림과 같이, 이외에도 Metabolome (대사체), Microbiome (미생물군유전체) 등을 포함하고 있습니다. 인간의 유전자 서열 (Genome)은 고정되어 있지만, 조직과 세포 종류에 따라서 유전자의 발현이 달라지고, 그에 따라 단백질의 양과 기능도 달라지게 됩니다. 즉, 유전자 서열을 해독하는 것 이상으로 훨씬 더 복잡한 유전자의 조절 기작을 이해하는 것이 질병 발생 메커니즘을 밝혀, 치료에 적용하는데 매우 중요하게 됩니다. 따라서, 유전자 서열 만으로는 설명이 되지 않는 많은 부분들은 그 보다 더 높은 차원에 존재하는 다양한 Omics들을 분석함으로써 이해하고자 하는 것이 Omics의 목표입니다.

단일 세포 분석이 왜 중요한가? Bulk vs. Single cell

우리 몸의 모든 세포는 체세포 변이 (Somatic mutation)를 제외하고 기본적으로 동일한 유전자의 염기 서열 (Germline)을 공유하고 있습니다. 그러나 조직과 기관에 따라 다양한 세포군이 서로 다른 기능을 수행하면서 생명현상을 이어나가고 있습니다. 따라서 세포의 종류에 따라 세포 특이적인 유전자의 발현 패턴의 차이를 확인하는 것은 매우 중요하게 됩니다. 그러나 전통적인 Bulk RNA-seq (전사체 시퀀싱)의 경우는 모든 세포들을 하나로 pooling하여 유전자의 발현량의 평균 값만을 구할 수 있게 됩니다. 그에 반해 단일 세포 시퀀싱 (Single cell RNA-seq)은 개별 세포를 세포의 종류에 따라 분류하고, 개별 세포의 발현량을 구할 수 있기 때문에 더 정확하게 개별 세포의 유전자 발현량의 차이를 알 수 있다는 장점이 있습니다. 특히나 종양 세포와 같은 경우에는 이질성 (Tumor heterogeneity)이 매우 크기 때문에, 집단의 유전자 발현이 개별 세포를 모두 대표하기 어려운 경우가 많습니다. 이러한 장점으로 인해, 최근에는 단일 세포의 다양한 omics data를 profiling하는 것이 점점 폭넓게 연구되고 있습니다.

[Bulk vs. Single cell RNA 시퀀싱의 비교] 기술적 발전으로 인해, 개별 세포의 유전자 발현 패턴을 더 정확하게 검출할 수 있게 되었습니다.

어떻게 단일 세포로 분리하는가?

[세포를 단일 세포로 분류하는 다양한 방법들]

위 그림은 세포들을 개별 세포로 분리하는 다양한 기술들을 보여주고 있습니다. 최근 널리 쓰이는 가장 대표적인 기술은 세포들을 개별 미세 유체 방울로 분리하는 Microfluidic droplet 기반의 기술 (Chromium 10X)과 비슷하게 하나의 plate에서 미세하게 세포를 흘려 분리하는 Microfluidic plate 기반의 기술 (Fluidigm C1)이 있습니다. Fluidigm C1 기술은 구분할 수 있는 세포의 수는 적지만 더 폭넓고 많은 전사체 시퀀싱 결과를 얻을 수 있다는 장점이 있고, Chromium 기술은 그에 반해 더 많은 수의 세포를 얻을 수 있지만, 얻을 수 있는 시퀀싱 리드의 정보는 제한적이라는 차이가 있습니다. 아래 표와 같이 연구자들은 실험의 목적에 따라서 각 방법의 장단점을 파악하고 사용하는 것이 좋겠습니다.

다음 포스팅에서는 이러한 단일 세포 분석 기술을 바탕으로 Epigenome과 Transcriptome을 분석하는데 중요한 개념인 scATAC-seq에 대해서 정리하도록 하겠습니다.

[ References ]

Murphy, Rachel. “An Integrative Approach to Assessing Diet–Cancer Relationships.” Metabolites 10.4 (2020): 123.

Kolodziejczyk, Aleksandra A., et al. “The technology and biology of single-cell RNA sequencing.” Molecular cell 58.4 (2015): 610-620.

Kashima, Yukie, et al. “Single-cell sequencing techniques from individual to multiomics analyses.” Experimental & Molecular Medicine 52.9 (2020): 1419-1427.