[유전학 중요개념 정리] 오믹스 (Omics) 와 단일 세포 시퀀싱 (Single cell sequencing)

현재 있는 미국의 연구실은 다양한 Omics 데이터를 종합적으로 분석하여, 소아 신증후군의 정밀 의료 실현을 위한 연구를 진행하고 있습니다. 아래의 관련 포스팅과 같이, 다양한 유전체 연구 결과 대부분의 복합질환 질병 발생은 유전체의 유전자 발현을 조절하는 부분, 그리고 non-coding 영역에 존재함을 확인하게 되었습니다. 이에 연구자들은 이러한 부분이 어떠한 기작을 통해서, 질병을 발생을 시키는지에 대한 연구를 진행하고 있으며, 이러한 연구 방법론의 하나로 다양한 오믹스 관련 생명 정보들을 통합적으로 분석하고 있습니다. 오늘은 (최근에 미국의 PI와 관련 리뷰 논문을 준비하게 되어,) 오믹스 관련 분석 중에서 중요한 단일 세포 시퀀싱 (Single Cell Sequencing) 기술에 대해서 정리하는 포스팅을 남기고자 합니다.

[관련 포스팅 보기]

Omics의 개념

단일 세포 시퀀싱을 언급하기에 앞서, Omics 의 개념에 대해서 간단히 정리하고자 합니다. -ome은 집합체 (집단, 묶음)를 의미하는 접미어로 Genome (유전자의 집합체 = 유전체), Epigenome (후성 유전인자의 집합체 = 후성유전체), Transcriptome (전사인자의 집합체 = 전사체), Proteome (단백질의 집합체 = 단백체) 등 일반적으로 생물 유래의 집합체를 모두 총칭합니다. 아래 그림과 같이, 이외에도 Metabolome (대사체), Microbiome (미생물군유전체) 등을 포함하고 있습니다. 인간의 유전자 서열 (Genome)은 고정되어 있지만, 조직과 세포 종류에 따라서 유전자의 발현이 달라지고, 그에 따라 단백질의 양과 기능도 달라지게 됩니다. 즉, 유전자 서열을 해독하는 것 이상으로 훨씬 더 복잡한 유전자의 조절 기작을 이해하는 것이 질병 발생 메커니즘을 밝혀, 치료에 적용하는데 매우 중요하게 됩니다. 따라서, 유전자 서열 만으로는 설명이 되지 않는 많은 부분들은 그 보다 더 높은 차원에 존재하는 다양한 Omics들을 분석함으로써 이해하고자 하는 것이 Omics의 목표입니다.

단일 세포 분석이 왜 중요한가? Bulk vs. Single cell

우리 몸의 모든 세포는 체세포 변이 (Somatic mutation)를 제외하고 기본적으로 동일한 유전자의 염기 서열 (Germline)을 공유하고 있습니다. 그러나 조직과 기관에 따라 다양한 세포군이 서로 다른 기능을 수행하면서 생명현상을 이어나가고 있습니다. 따라서 세포의 종류에 따라 세포 특이적인 유전자의 발현 패턴의 차이를 확인하는 것은 매우 중요하게 됩니다. 그러나 전통적인 Bulk RNA-seq (전사체 시퀀싱)의 경우는 모든 세포들을 하나로 pooling하여 유전자의 발현량의 평균 값만을 구할 수 있게 됩니다. 그에 반해 단일 세포 시퀀싱 (Single cell RNA-seq)은 개별 세포를 세포의 종류에 따라 분류하고, 개별 세포의 발현량을 구할 수 있기 때문에 더 정확하게 개별 세포의 유전자 발현량의 차이를 알 수 있다는 장점이 있습니다. 특히나 종양 세포와 같은 경우에는 이질성 (Tumor heterogeneity)이 매우 크기 때문에, 집단의 유전자 발현이 개별 세포를 모두 대표하기 어려운 경우가 많습니다. 이러한 장점으로 인해, 최근에는 단일 세포의 다양한 omics data를 profiling하는 것이 점점 폭넓게 연구되고 있습니다.

[Bulk vs. Single cell RNA 시퀀싱의 비교] 기술적 발전으로 인해, 개별 세포의 유전자 발현 패턴을 더 정확하게 검출할 수 있게 되었습니다.

어떻게 단일 세포로 분리하는가?

[세포를 단일 세포로 분류하는 다양한 방법들]

위 그림은 세포들을 개별 세포로 분리하는 다양한 기술들을 보여주고 있습니다. 최근 널리 쓰이는 가장 대표적인 기술은 세포들을 개별 미세 유체 방울로 분리하는 Microfluidic droplet 기반의 기술 (Chromium 10X)과 비슷하게 하나의 plate에서 미세하게 세포를 흘려 분리하는 Microfluidic plate 기반의 기술 (Fluidigm C1)이 있습니다. Fluidigm C1 기술은 구분할 수 있는 세포의 수는 적지만 더 폭넓고 많은 전사체 시퀀싱 결과를 얻을 수 있다는 장점이 있고, Chromium 기술은 그에 반해 더 많은 수의 세포를 얻을 수 있지만, 얻을 수 있는 시퀀싱 리드의 정보는 제한적이라는 차이가 있습니다. 아래 표와 같이 연구자들은 실험의 목적에 따라서 각 방법의 장단점을 파악하고 사용하는 것이 좋겠습니다.

다음 포스팅에서는 이러한 단일 세포 분석 기술을 바탕으로 Epigenome과 Transcriptome을 분석하는데 중요한 개념인 scATAC-seq에 대해서 정리하도록 하겠습니다.

[ References ]

Murphy, Rachel. “An Integrative Approach to Assessing Diet–Cancer Relationships.” Metabolites 10.4 (2020): 123.

Kolodziejczyk, Aleksandra A., et al. “The technology and biology of single-cell RNA sequencing.” Molecular cell 58.4 (2015): 610-620.

Kashima, Yukie, et al. “Single-cell sequencing techniques from individual to multiomics analyses.” Experimental & Molecular Medicine 52.9 (2020): 1419-1427.

[유전학 중요개념 정리] eQTL

올해 마지막 포스팅으로 유전자 발현을 조절하는데 관여하는 eQTL (expression quantitative trait loci) 에 대해 공부한 내용을 정리하고자 합니다.

사실 개체의 표현형을 결정하는데 있어, 전통적인 멘델의 유전 법칙을 따라 유전형이 표현형을 명확히 나누는 경우는 많지 않습니다. 그럼에도 불구하고 많은 사람들은 유전자의 유전형 (genotype)을 이용하여 표현형의 차이를 이해하는 노력을 끊임없이 하고 있습니다. 그러한 노력의 일환으로 eQTL은 유전형의 차이가 유전자 자체의 산물인 단백질(protein)의 구조 및 기능의 차이가 아니라, 발현량(expression level)에 차이를 미쳐서 표현형에 영향을 준다고 생각하는데서 출발합니다.

그림1
eQTL의 개념은 특정 위치의 유전형이 유전자 발현 수준에 영향을 미쳐, 질병 발생 또는 표현형에 영향을 줄 것이라 가정에서 출발합니다.

eQTL의 개념은 그동안 유전자의 coding region에 집중되어 있던 변이 탐구의 영역을 non-coding region으로 확장시키고, 더불어 그동안 진행되어 왔던 많은 GWAS 연구에서 발굴되었던 많은 non-coding region에 위치한 SNP들의 해석에 대한 한 가지 가능성을 제시해 줍니다.

GWAS의 개념에 대한 포스팅 보기 -> 전장 유전체 연관 분석, GWAS란 무엇인가?

즉, 그 동안의 많은 GWAS 연구들에서 발견된 많은 후보 유전자 영역들은 대부분 단백질을 코딩하는 영역이 아니라서 그 생물학적 역할에 대한 해석이 어려웠는데, 이 중 일부는 유전자 발현을 조절하는 eQTL일 가능성이 있다는 것이죠. 이러한 접근법에서 시작된 연구들 중 일부는 실제로 질병을 대상으로 발굴된 GWAS 마커가 eQTL 임을 밝히기도 하였습니다. 아래는 이렇게 밝혀진 질병 발생 또는 형질 연구와 관련된 eQTL을 정리한 표입니다.

그림4

  eQTL을 통한 유전자 발현 조절은 크게 2가지 조절 기작이 제안되었는데, 흔히 cis- 와 trans- effect로 구분합니다. cis-effect의 경우는 인접 유전자의 promoter에 위치한 영역의 유전형의 차이가 직접적으로 유전자 발현량에 차이를 주는 경우를 말하며, trans-effect의 경우는 1차적으로 조절 유전자 (regulatory)의 어떤 변이 또는 산물의 양이 2차적으로 최종 타겟 유전자의 발현량에 영향을 주는 경우를 말합니다. 아래는 이러한 cis-와 trans-effect에 의한 eQTL의 개념을 잘 보여주고 있습니다.

1

eQTL은 non-coding region의 변이가 regulatory variant (유전자 발현 조절에 관여하는 변이) 라는 가정에서 출발합니다. 이를 이해하기 위한 다음 논의는 Genomics (유전체)에서 Transcriptomics (전사체)로 자연스럽게 옮겨갑니다. 다음 포스팅에서는 이러한 개념들을 위해 필수적으로 이해가 필요한 Omics와 regulatory variant의 역할을 발굴하는 연구 방법론에 대해 정리하기로 하고, 이번 포스팅은 여기서 마칩니다.

 

[References]

Montgomery, Stephen B., and Emmanouil T. Dermitzakis. “From expression QTLs to personalized transcriptomics.” Nature Reviews Genetics 12.4 (2011): 277-282.

Albert, Frank W., and Leonid Kruglyak. “The role of regulatory variation in complex traits and disease.” Nature Reviews Genetics 16.4 (2015): 197-212.

Zhang, Feng, and James R. Lupski. “Non-coding genetic variants in human disease.” Human molecular genetics 24.R1 (2015): R102-R110.