GTEx portal: eqtl, sqtl database

최근의 많은 연구는 Multi-omics data를 활용하여, 대부분 non-coding region에 존재하는 GWAS에서 발굴한 질환 관련 loci가 유전자 발현 수준 (Transcriptome) 또는 발현 조절 (Epigenome)과 관련된 곳임을 입증함으로써, 질병 메커니즘을 설명하려는 방향으로 나가고 있습니다. 특히, 그동안 설명이 되지 않았던 많은 Complex Trait Disease의 경우, 이러한 접근 방법이 추가적으로 많은 생물학적 이해를 가져왔습니다.

[관련 포스팅 보기]

특히, 유전자의 발현과 조절의 경우에는 세포 특이적 (cell type-specific)으로 일어나는 경우가 많기 때문에, 위와 같은 연구를 위해서는 질환 발생을 설명할 수 있는 적절한 세포 수준에서의 Multi-omics 데이터가 확보되어야 합니다. 이러한 연구를 위해 가장 널리 활용되고 있는 곳은 GTEx portal (https://gtexportal.org/) 인데, 현재까지 54개의 조직에서의 유전자 발현량과 유전형과의 관계에 대한 database 를 제공해주고 있습니다.

특히, GTEx의 경우에는 누적된 샘플들을 이용하여, 통계적으로 유전자의 발현과 관계된 Expression Quantitative Trait Loci (eQTL)sQTL (Splicing Quantitative Trait Loci)을 계산하여, 제공하고 있습니다. 추가로, cis-eQTL이 존재하는 eGene과 cis-sQTL이 존재하는 sGene에 대한 정보도 제공합니다.

다만, 대부분 유전자의 발현량과 조절은 세포의 종류에 따라 달라지게 됩니다. 따라서, bulk RNA-seq에서 계산한 eQTL과 sQTL과 달리, 최근에는 세포의 종류를 구분하여 eQTL과 sQTL을 계산하고, 이를 구분하여 cell-type interaction이 있기 때문에 ieQTLisQTL이라고 부르고 있습니다. 아래 그림의 C는 전체적으로는 유전자 발현량에 영향이 없지만, Keratinocyte에서 CNTN1의 발현량이 달라지는 ieQTL의 효과를 보여주고 있습니다. 현재 GTEx에서는 조직 수준으로 이를 구분하여 제공하고 있지만, 추후에는 single-cell resoulution으로 모든 세포의 종류에 따른 개별 eQTL과 sQTL database가 구축되지 않을까 기대해 봅니다.

[Reference]

GTEx portal (https://gtexportal.org/)

GTEx Consortium. “The GTEx Consortium atlas of genetic regulatory effects across human tissues.” Science 369.6509 (2020): 1318-1330.

Kim-Hellmuth, Sarah, et al. “Cell type–specific genetic regulation of gene expression across human tissues.” Science 369.6509 (2020).

Epigenomic profiling을 위한 ATAC-seq

최근 많은 연구들에서 유전자 자체의 염기 서열과 발현량 못지 않게, 유전자 발현을 조절하는 Epigenetics가 다양한 생물학적 메커니즘에 매우 중요하게 작용하는 것으로 밝혀지고 있습니다. 이번 포스팅은 지난 번 포스팅에 이어, Epigenetics 정보를 얻는데 널리 쓰이는 Assays for Transposase Accessible Chromatin with high-throughput sequencing (ATAC-seq)에 대해서 정리해 보고자 합니다.

Epigenetics와 관련된 정보를 얻는 방법은 매우 다양합니다. 아래 그림과 같이, 일종의 표지자로 작동하는 DNA methylation 정보나 염색질의 접근도, 전사 인자의 결합력, 유전체의 3차원적인 구조 변화 등이 모두 유전자 발현과 관련된 후성 유전학적 정보들을 제공해주게 됩니다. 그러나, 최근에 가장 널리 쓰이는 Epigenome 시퀀싱 방법은 염색질의 접근도 (Chromatin Accessibility) 와 관련된 정보를 제공하는 ATAC-seq입니다.

[관련 포스팅 보기]

먼저, ATAC-seq의 단어의 의미를 살펴보면, 다음과 같습니다.

Assays for Transposase Accessible Chromatin with high-throughput sequencing = Transposase 가 접근 가능한 염색질 (chromatin)을 검사하는 높은 처리량의 시퀀싱 기법

유전자가 발현하기 위해서는 실타래와 같이 뭉쳐있던 염색질 (Chromatin) 구조에 변화가 일어나야 합니다. 즉, Heterochromatin 상태 (closed) 에서 Euchromatin 상태 (open) 로 변화가 일어나면서, 유전자 발현과 관계된 다양한 transcription factor들이 물리적으로 접근을 하게 됩니다. ATAC-seq은 Tn5 transposase라고 하는 인공적으로 합성하여 활성을 높힌 transposase를 사용하여, Open chromatin 상태의 염색질들에 Adaptor를 붙히고, 시퀀싱을 하게 됩니다.

Open chromatin 상태의 염기 서열들은 Transposase가 붙인 Adaptor로 인해, 시퀀싱이 많이되어 read가 만들어지고, 반대로 Closed chromatin 부위는 read가 생산되지 않게 됩니다. 즉, 아래 그림과 같이 시퀀싱을 통해, 증폭 부위의 정보를 얻게되면, 거꾸로 어떤 부위가 Open chromatin 상태이고, 어떤 부위가 Closed chromatin 상태인지에 대한 정보를 얻을 수 있게 됩니다.

최근에는 Single cell sequencing 기술과 접목하여, single cell ATAC sequencing (scATAC-seq)을 통해 세포 개별 Chromatin Accessibility 정보를 얻는데 많이 사용하고 있습니다. 더불어, single cell RNA sequencing (scRNA-seq) 과 함께 시행하여 다양한 세포군을 구분하고, 발생 과정에 따른 유전자 발현 패턴을 알아보는데 상호 보완적으로 사용하기도 합니다. 다양한 시공간 상에서 일어나는 생명 현상을 기술적 발전을 통해 점점 다양한 차원에서 분석함으로써, 질병의 발생 메커니즘을 이해하고, 치료하는데 응용하기 위한 다양한 생물학 분야의 연구가 진행되고 있습니다. 이러한 시도는 정밀 의료를 위한 다양한 연구의 밑거름으로 중요하게 생각되고 있습니다.

single cell ATAC-seq과 RNA-seq을 동시에 시행하여, 세포 발생 과정에서 유전자의 발현을 분석하는 SHARE-seq 방법.

[ References ]

Buenrostro, Jason D., et al. “Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position.” Nature methods 10.12 (2013): 1213-1218.

Luo, Cheng, Alisdair R. Fernie, and Jianbing Yan. “Single-cell genomics and epigenomics: technologies and applications in plants.” Trends in Plant Science 25.10 (2020): 1030-1040.

Ma, Sai, et al. “Chromatin potential identified by shared single-cell profiling of RNA and chromatin.” Cell 183.4 (2020): 1103-1116.