Epigenomic profiling을 위한 ATAC-seq

최근 많은 연구들에서 유전자 자체의 염기 서열과 발현량 못지 않게, 유전자 발현을 조절하는 Epigenetics가 다양한 생물학적 메커니즘에 매우 중요하게 작용하는 것으로 밝혀지고 있습니다. 이번 포스팅은 지난 번 포스팅에 이어, Epigenetics 정보를 얻는데 널리 쓰이는 Assays for Transposase Accessible Chromatin with high-throughput sequencing (ATAC-seq)에 대해서 정리해 보고자 합니다.

Epigenetics와 관련된 정보를 얻는 방법은 매우 다양합니다. 아래 그림과 같이, 일종의 표지자로 작동하는 DNA methylation 정보나 염색질의 접근도, 전사 인자의 결합력, 유전체의 3차원적인 구조 변화 등이 모두 유전자 발현과 관련된 후성 유전학적 정보들을 제공해주게 됩니다. 그러나, 최근에 가장 널리 쓰이는 Epigenome 시퀀싱 방법은 염색질의 접근도 (Chromatin Accessibility) 와 관련된 정보를 제공하는 ATAC-seq입니다.

[관련 포스팅 보기]

먼저, ATAC-seq의 단어의 의미를 살펴보면, 다음과 같습니다.

Assays for Transposase Accessible Chromatin with high-throughput sequencing = Transposase 가 접근 가능한 염색질 (chromatin)을 검사하는 높은 처리량의 시퀀싱 기법

유전자가 발현하기 위해서는 실타래와 같이 뭉쳐있던 염색질 (Chromatin) 구조에 변화가 일어나야 합니다. 즉, Heterochromatin 상태 (closed) 에서 Euchromatin 상태 (open) 로 변화가 일어나면서, 유전자 발현과 관계된 다양한 transcription factor들이 물리적으로 접근을 하게 됩니다. ATAC-seq은 Tn5 transposase라고 하는 인공적으로 합성하여 활성을 높힌 transposase를 사용하여, Open chromatin 상태의 염색질들에 Adaptor를 붙히고, 시퀀싱을 하게 됩니다.

Open chromatin 상태의 염기 서열들은 Transposase가 붙인 Adaptor로 인해, 시퀀싱이 많이되어 read가 만들어지고, 반대로 Closed chromatin 부위는 read가 생산되지 않게 됩니다. 즉, 아래 그림과 같이 시퀀싱을 통해, 증폭 부위의 정보를 얻게되면, 거꾸로 어떤 부위가 Open chromatin 상태이고, 어떤 부위가 Closed chromatin 상태인지에 대한 정보를 얻을 수 있게 됩니다.

최근에는 Single cell sequencing 기술과 접목하여, single cell ATAC sequencing (scATAC-seq)을 통해 세포 개별 Chromatin Accessibility 정보를 얻는데 많이 사용하고 있습니다. 더불어, single cell RNA sequencing (scRNA-seq) 과 함께 시행하여 다양한 세포군을 구분하고, 발생 과정에 따른 유전자 발현 패턴을 알아보는데 상호 보완적으로 사용하기도 합니다. 다양한 시공간 상에서 일어나는 생명 현상을 기술적 발전을 통해 점점 다양한 차원에서 분석함으로써, 질병의 발생 메커니즘을 이해하고, 치료하는데 응용하기 위한 다양한 생물학 분야의 연구가 진행되고 있습니다. 이러한 시도는 정밀 의료를 위한 다양한 연구의 밑거름으로 중요하게 생각되고 있습니다.

single cell ATAC-seq과 RNA-seq을 동시에 시행하여, 세포 발생 과정에서 유전자의 발현을 분석하는 SHARE-seq 방법.

[ References ]

Buenrostro, Jason D., et al. “Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position.” Nature methods 10.12 (2013): 1213-1218.

Luo, Cheng, Alisdair R. Fernie, and Jianbing Yan. “Single-cell genomics and epigenomics: technologies and applications in plants.” Trends in Plant Science 25.10 (2020): 1030-1040.

Ma, Sai, et al. “Chromatin potential identified by shared single-cell profiling of RNA and chromatin.” Cell 183.4 (2020): 1103-1116.

DNA methylation과 CpG island

지난 포스팅에서는 Epigenetics에 대한 기본 개념과 이해를 위한 Chromatin과 Histone 단백의 구조에 대해서 정리했습니다. 오늘은 그 연장선에서 Epigenetics의 중심을 이루는 DNA의 메틸화 (Methylation)에 관여하는 분자들과 CpG island, 그 조절 기전에 대해서 조금 더 자세하게 다뤄볼까 합니다.

관련 포스팅 보기>

Epigenetics의 개념과 Chromatin structure, Histone modification

DNA 손상 복구 기전과 타겟 치료 항암제

 

I. DNA Methylation이 일어나는 장소와 관여하는 분자들

Mammalian genome 대부분의 DNA 메틸화는 CG dinucleotide의 Cytosine의 5번 탄소에서 일어납니다. Cytosine과 Guanine이 phosphate로 연결되어 있기 때문에, 흔히 CpG site라고 부르기도 합니다. 이러한 DNA 메틸화는 Cytosine 5-Methylcytosine (5-mC)으로 만듭니다.  5mC는 다른 DNA 분자보다 불안정하여 mutation이 일어나기 쉽고, spontaneous deamination에 의해서, Thymine으로 잘 바뀝니다.

600px-Cytosine_becomes_thymine

따라서, 우리 몸에는 DNA 메틸화를 시키는데 관여하는 효소와 함께, 메틸기를 빠르게 떼어주거나 C > T로 바뀐 염기를 원래대로 복구 시켜주는데 관여하는 효소가 함께 존재하게 됩니다. 아래 그림의 DNMT (DNA Methyl Transferase) 효소들이 DNA를 메틸화시켜주는 효소로, TET (ten–eleven translocation) enzyme이 DNA를 따시 떼어내는 효소로 작용하고, C > T로 바뀐 염기를 원래대로 복구 시켜주는 기전에는 AID/APOBEC (activation-induced cytidine deaminase/apolipoprotein B mRNA-editing enzyme complex) Base Excision Repair (BER) 메커니즘이 관여하게 됩니다.

1

3

2

II. CpG island

위에서 언급한 CpG site 들은 유전체 내에서 random 하게 분포하는 것이 아니라, 특정한 패턴을 이루는데, 특히 몰려있으면서 마치 섬을 이루는 곳CpG island라고 부릅니다. 최근에는 아래의 조건을 만족하는 경우를 CpG island로 부르게 되었습니다.

  1. 길이가 200bp 이상
  2. GC content가 50% 이상
  3. observed to expected CpG ratio 가 0.6 이상

DNAme_landscape

대부분의 CpG island는 유전자 자체의 코딩 영역에는 거의 존재하지 않고, upstream의 조절 부위 (regulatory region), 특히 Promoter 영역에 존재하여, 유전자의 발현과 밀접하게 관련이 됩니다. 일반적으로 CpG island의 메틸화가 되면 유전자 발현에 관여하는 여러 transcription factor의 접근을 막고, 동시에 메틸화된 CpG site에 결합하는 MBD (Methyl-CpG-binding domain proteins) 단백들이 유전자 발현을 억제하게 됩니다.

 

III. 발생 과정의 DNA 메틸화와 암 발생에서의 CpG island

4

발생 과정은 다양한 유전자가 발현하면서, 형태를 만들어 가는 과정입니다. 따라서, 발생 과정은 그 어느 때보다도 다양하고 복잡하게 DNA 메틸화가 일어나게 됩니다. 위 그림은 발생 시기와 성별, 그리고 조직의 종류에 따라 DNA 메틸화가 어떻게 나타나는지를 간략하게 나타내주고 있습니다. 이러한 유전자의 발현 패턴에 영향을 미치는 DNA의 메틸화의 이상은 발생 과정의 이상에 의한 여러 가지 질병과 기형을 유발할 수 있습니다.

 

1-s2.0-S0168952513001959-gr1

발생 과정과 비슷하게, CpG island는 암 발생 과정에도 관여하게 되는데, 흔히 암 억제 유전자 (Tumor suppressor gene, TSG)의 CpG island에 과다한 메틸화에 의해 발현이 억제되거나, 암 발생 유전자 (Oncogene)의 발현이 증가되는데, CpG island의 잘못된 메틸화가 관여할 수 있습니다.

 

[References]

Moore, Lisa D., Thuc Le, and Guoping Fan. “DNA methylation and its basic function.” Neuropsychopharmacology 38.1 (2013): 23-38.

Ambrosi, Christina, Massimiliano Manzo, and Tuncay Baubec. “Dynamics and context-dependent roles of DNA methylation.” Journal of molecular biology 429.10 (2017): 1459-1475.

Greenberg, Maxim VC, and Deborah Bourc’his. “The diverse roles of DNA methylation in mammalian development and disease.” Nature reviews Molecular cell biology (2019): 1-18.

Stirzaker, Clare, et al. “Mining cancer methylomes: prospects and challenges.” Trends in Genetics 30.2 (2014): 75-84.

Epigenetics의 개념과 Chromatin structure, Histone modification

최근에 연구를 진행하다보니, Epigenetics에 대해서 더 충분히 이해할 필요가 있다고 느꼈습니다. 사실 ‘Epigenetics‘는 우리 말로는 ‘후성 유전학‘이라고 부르는데, 이 단어만 들어서는 도통 개념이 잘 와닿지가 않습니다. 그래서 이번 포스팅은 Epigenetics의 개념 이해를 위한 기본적인 Chromatin과 Histone의 구조, 그리고 modification 들에 대해서 정리해보고자 합니다.

 

chromatinstructurefigure1

Epigenetics

‘Epi-‘라는 접두어는 보통 경계의 말단, 끄트머리를 의미 합니다. 그래서 전통적인 DNA 염기 서열의 변화에 따른 유전학 (Genetics)과 구분하기 위해서, Epigenetics는 ‘DNA 염기 서열의 변화 없이’ 나타나는 모든 유전학적 변화를 포괄하는 개념입니다. Epigenetics의 개념은 발생학(Development)과 깊은 관련이 있는데, 발생 과정에서 왜 동일한 DNA sequence를 가진 유전자들의 발현이 세포마다 서로 달라지고, 배 발생 형태가 갖추어 지는지에 대한 의문에서 출발했습니다. 이러한 의문은 같은 주형을 가지고도 유전자의 발현 스위치를 어떻게 On-Off 시키는지에 대한 연구를 통해서, 염색체 (Chromatin)의 구조와 이를 구성하는 히스톤 단백의 변화 (Histone modification)의 중요성을 밝혔고, 그래서 Epigenetics를 이루는 테마는 DNA methylation, 그리고 Histone modification에 따른 기능 변화가 주를 이룹니다.

 

Chromatin, Histone structure

Epigenetics를 제대로 이해하기 위해서는 DNA methylationHistone modification이 일어나는 장소인 염색질과 히스톤 단백의 구조를 정확히 알고 있는게 중요합니다. 세포의 핵 내 DNA는 실타래와 같은 염색질의 형태로 존재하는데, 이러한 유전 정보의 발현은 상당히 복잡한 과정을 통해서 상당히 정교하게 조절됩니다.

 

fnbeh-11-00041-g001

biology-1538761143

히스톤 단백은 4개의 H2A, H2B, H3, H4의 Core 단백과 H1, H5의 Linker 단백으로 이루어져있습니다. Core 단백은 각각 2개씩, 총 8개의 octamer가 하나의 nucleosome bead를 구성합니다. ‘H3K4me3’와 같은 histone modification을 가르킬 때의 H3가 히스톤 단백의 core protein을 말합니다. 이러한 히스톤 단백의 주위를 DNA 시퀀스가 감고 있는데, 하나의 히스톤 단백의 주위를 약 145~147 bp의 DNA가 감싸고 있습니다.

Capture-6

유전자가 발현되기 위해서는 DNA시퀀스와 히스톤 단백의 실타래가 풀려서, 발현 시키고자 하는 유전자의 시퀀스 주위로 다른 단백들이 공간적으로 접근할 수 있어야 합니다. 따라서 유전자 발현이 활발한 부위 (Euchromatin)는 Chromatin 실타래가 풀려서 성긴 구조를 이루고, 염색을 해도 희미하게 보이게 됩니다.  반대로 유전자 발현이 이루어지지 않을 때는, Chromatin도 매우 compact 하게 압축되어 있기 때문에, 세포를 염색했을 때 진하게 보이게 되며 이러한 부위를 ‘Heterochromatin‘ 영역이라고 부릅니다.

 

Histone modification

Histone-modifications-are-major-biochemical-features-of-chromatin-Histone-can-experience

Histone 단백의 잔기들은 다양한 modification이 가능한데, 위의 그림 B와 같이 Core Histone의 번호와, 아미노산 잔기의 위치에 따른 번호, 그리고 modifcation의 종류를 이용하여 나타냅니다. 대표적인 변화로는 Methylation, Acetylation, Phosphorylation 등이 포함되는데, MethylationAcetylation은 알칼리성 잔기인 Lysine (K)과 Arginine (R)에서, Phosphorylation은 -OH 잔기를 포함하는 Serine (S), Threonine (T), Tyrosine (Y) 잔기에서 일어납니다. 위 그림의 A는 이러한 잔기의 위치와 변화를 보여주고 있습니다.

Histone modification은 유전자의 발현을 촉진하거나, 억제하는 등 그 생물학적인 역할이 모두 다릅니다. 이러한 다양한 역할과 그 조합들로 인해서, 주변 환경과의 상호 작용 및 그에 따른 매우 정교한 조절이 가능해지게 됩니다. 다음 포스팅에서는 Histone modification의 종류와 그에 따른 생물학적인 기능을 정리해보고, 이번 포스팅은 여기서 마치도록 하겠습니다.

 

[References]

Felsenfeld, Gary. “A brief history of epigenetics.” Cold Spring Harbor perspectives in biology 6.1 (2014): a018200.

Cedar, Howard, and Yehudit Bergman. “Linking DNA methylation and histone modification: patterns and paradigms.” Nature Reviews Genetics 10.5 (2009): 295-304.

Prakash, Kirti, and David Fournier. “Evidence for the implication of the histone code in building the genome structure.” Biosystems 164 (2018): 49-59.