[실험실 노트] Real Time-PCR의 원리와 qPCR primer를 이용한 CNV 확인

오늘은 RT-PCR (Real-Time Polymerase Chain Reaction)의 기본적인 원리와 실험적으로 이용하기 위한 resource들을 정리하는 포스팅을 남기고자 합니다.

 

I. Realtime-PCR과 PCR의 차이

Realtime PCR (RT-PCR)은 그 이름에서 알 수 있듯이, 실시간 (Real-Time)으로 증폭 산물 (PCR product)을 Monitoring 한다는 것이 PCR과 가장 큰 차이입니다. 일반적으로 RT-PCR은 정량 (Quantitation)이 가능하기 때문에 qPCR이라고도 합니다.

  • RT-PCR은 일반적으로 RNA에서 cDNA를 만든 후에 PCR을 진행하는 Reverse-Transcription PCR을 지칭합니다. 그러나, 경우에 따라 Realtime PCR도 약자로 줄여서 RT-PCR이라고 부르기도 하기 때문에, Reverse-transcription과 Real-time을 구분하여 혼동하시지 말기를 바랍니다. 이 글에서의 RT-PCR은 Real-time PCR을 지칭하는 것으로 하도록 하겠습니다.

이 때 일반적으로 Monitoring을 형광을 이용하게 되는데, DNA에 비특이적으로 끼어들어가 형광을 나타내는 SYBRQuencher를 이용하여, PCR 합성이 진행되면 형광을 나타내도록 하는 Taqman probe 등이 많이 사용됩니다.

TaqMan-Gene-Expression-Assay-720
[Taqman probe의 작동 원리]
최종 산물을 이용하는 PCR과 다르게 RT-PCR은 최초의 DNA 량을 역으로 정량 (또는 반정량)할 수 있다는 장점이 있습니다. 이를 위해서는 아래의 RT-PCR amplification curve를 잘 이해하는 것이 중요합니다. 일반적으로 PCR은 1 cycle이 돌 때마다 효율이 100% 라고 가정하면, 2배씩 증폭됩니다. 그러나, 실제로는 PCR에 dNTP들이 점점 소모되기 때문에 반응이 진행되면서 효율은 점점 떨어지게 되고, 아래와 같은 형태의 curve를 이루게 됩니다. 이때, 처음 증폭 산물을 검출할 수 있는 Threshold를 넘는 지점의 Cycle 수를 Ct 값이라고 이야기하고, Ct 값은 처음 DNA양과 역비례하게 됩니다. (즉, 처음 DNA 양이 많으면 증폭을 적게 시켜도 검출이 되고, 처음 DNA 양이 적으면 많이 증폭 시켜야 검출 한계를 넘게됩니다.)

PCR

II. qPCR primer design 및 활용 (Delta-delta Ct method)

qPCR은 PCR을 해서 증폭 산물을 얻는 것이 아니라, 해당 위치만 효율적으로 증폭시켜 추적하는 것이 목적이기 때문에 길이는 너무 길지 않는 것이 좋습니다. 따라서 target의 위치는 80~150 bp 정도로 되도록 하고, Melting curve analysis를 통해서 하나의 산물만 증폭되는 것을 확인합니다. 타겟 산물의 Tm은 65~95도 정도 되도록, GC나 AT rich region을 피합니다. 아래 2개의 사이트에서는 해당 유전자의 시퀀스를 넣으면 자동으로 primer를 디자인하여 주기 때문에 유용하게 사용 가능합니다. 더불어 하나의 미세한 팁은, Origene에서는 유전자별로 미리 디자인된 qPCR용 primer를 판매하면서 해당 시퀀스를 공개하고 있습니다. 따라서, 해당 시퀀스를 따와서 합성 주문하는 것도 한가지 팁이 됩니다. (다만, 가끔 잘못 올라온 경우도 있어서 합성 주문 전에 미리 잘 확인해볼 필요가 있습니다.) 최종 주문 전에 이전에 소개했던 툴 등을 이용하여, Hairpin structure, in-silico PCR 등을 돌려보는 것이 도움이 됩니다. 사실 이런 모든 과정이 귀찮다면, 마지막의 PrimerBank에서 검색해서 제시된 primer를 이용하면 됩니다.

관련 포스팅 보기>

[실험실 노트] Sanger sequencing Primer design

[qPCR primer design을 위한 툴]

GenScript RT PCR primer design tool

Eurofin qPCR primer design tool

OriGene pre-designed primer 정보 얻기

PrimerBank Database 활용 – **

일반적으로 RT-PCR은 정량 (Quantitation)이 가능하기 때문에 qPCR이라고도 하며, 일반적으로는 유전자 발현 상대량 (mRNA expression)을 구하거나, Copy-Number Variation을 확인하는 데 사용 가능합니다. 이 때, 중요한 개념은 ∆Ct method 인데, 서로 다른 2개의 target이라 하더라도 증폭되는 비율의 차이는 서로 다른 샘플 간에도 일정하다는 원리를 이용하는 것입니다. 이를 수식으로 나타내면 아래와 같습니다.

∆Ct = Ct (Gene of interest) – Ct (Reference gene)

즉, 하나의 샘플 안에서 서로 다른 2개의 타겟을 디자인해서 증폭하면, 위치 간에 증폭 효율이 있기 때문에 Ct 값에 차이가 필연적으로 존재합니다. 그러나 이 차이는 Gene of interest와 Reference gene간의 상대량에 변화가 없다면, 서로 다른 샘플 간이라 하더라도 일정해야 합니다. 그러나, 둘 간의 상대량에 변화가 발생하면 ∆Ct 값도 변화하게 되고, 따라서 ∆Ct의 차이 (∆∆Ct)를 계산하면, 원하는 타겟 (Gene of interest)의 상대량을 구할 수 있게 됩니다.

마지막으로 이러한 원리 (Delta-delta Ct method)를 이용하여, Copy-Number Variation을 구할 수 있는 실험에 대해서 잘 설명하고 있는 유튜브 영상을 남깁니다.

 

[References]

Ma, Lijiang, and Wendy K. Chung. “Quantitative analysis of copy number variants based on real‐time LightCycler PCR.” Current protocols in human genetics 80.1 (2014): 7-21.

How To Perform The Delta-Delta Ct Method

 

[유전학 중요개념 정리] Complex DNA rearrangement: Chromothripsis, Chromoanasynthesis, and Chromoplexy

이번 포스팅은 genomic DNA가 다양한 구조적 변이 (Structural variation)를 발생시키는 메커니즘 중 최근에 Cancer genetics 연구를 통해 중요하게 다뤄지게 된 Chromothripsis, Chromoanasynthesis, 그리고 Chromoplexy에 대해서 정리해보고자 합니다.

최근에 유전적 다양성을 설명하는 방법으로 Copy number variation (CNV)에 대해서도 많은 연구가 되고 있는데, 특히 암세포를 다양한 유전적 연구 툴을 이용하여 연구한 결과 많은 구조적 변이들이 획득되는 것을 알게 되었습니다. 연구자들은 이러한 구조적 변이 (complex DNA arrangement)가 어떠한 메커니즘에 대해서 발생하는지에 대해 관심을 갖게 되었고, 암세포에서 특히 많이 나타나는 다양하고 복잡한 구조적 이상이 획득되는 메커니즘으로 제안된 것이 오늘 다루고자 하는 위의 3가지 기전입니다.

관련 포스팅 보기 > [유전학 중요개념 정리] Structural variation 및 Copy-number variation

먼저 Terminology가 생소하여, 단어의 의미부터 정리하고 넘어가겠습니다.

Figure1

Chromo- (Chromosome) + -thripsis (shattered into pieces): 염색체가 여러 단편으로 쪼개지다.

Chromo- (Chromosome) + -anasynthesis (reconstitution, resynthesis): 염색체가 추가적으로 다시 구성되다.

Chromo- (Chromosome) + -plexy (crippling or serious occurrence): 염색체의 손상으로 인한 심각한 재배열, 주로 chain of translocation과 부수적인 deletion으로 구성됨.

Figure2
[그림1] 복잡한 DNA 재배열의 세 가지 제안된 메커니즘

Chromothripsis한번의 갑작스러운 DNA 손상에 의해, DNA가 여러 단편으로 쪼개지고 이것이 복구 과정을 통해서 다시 합쳐질 때의 오류로 인해 일부가 소실 (deletion) 되거나 방향이 뒤바뀌는 (inversion) 과정을 말합니다. 따라서 주로 복잡한 DNA 재배열 과정 중에서도 Copy number의 loss를 설명하는 주요 메커니즘입니다. 반대로 Copy number의 gainChromoanasynthesis로 설명하는데, 염색체 합성 과정 중 재배열된 template에 의해 합성이 되면서, Copy number의 다양한 획득이 나타나게 됩니다. 마지막으로 Chromoplexy는 주로 염색체간의 translocation 과정이 일련의 chain으로 나타나면서 발생하고, 일련의 과정에서 일부 deletion이 수반되기도 합니다.

Figure3
[그림 2] Micronuclei의 형성과 complex DNA rearrangement의 발생

위와 같은 구조적 이상을 일으키는 원인은 주로 Micronuclei의 발생으로 설명하고 있습니다. 세포 분열 과정 중에서 제대로 분열이 되지 않으면서 생성된 소핵체가 세포 내에 존재하였다가, DNA 복제 과정에 영향을 미쳐 위와 같은 구조적 이상을 일으키는데 관여한다는 설명입니다.

 

[References]

Zhang, Cheng-Zhong, Mitchell L. Leibowitz, and David Pellman. “Chromothripsis and beyond: rapid genome evolution from complex chromosomal rearrangements.” Genes & development 27.23 (2013): 2513-2530.

Shen, Michael M. “Chromoplexy: a new category of complex rearrangements in the cancer genome.” Cancer Cell 23.5 (2013): 567-569.

Leibowitz, Mitchell L., Cheng-Zhong Zhang, and David Pellman. “Chromothripsis: a new mechanism for rapid karyotype evolution.” Annual review of genetics 49 (2015): 183-211.

NGS 데이터를 이용한 CNV 분석

Copy Number Variation (CNV)는 Single Nucleotide Variation (SNV)과 더불어, 유전적 다양성을 나타내는 주요한 원인으로 생각되고 있습니다. 유전자 sequence의 염기 하나가 치환된 SNV와 달리 CNV는 유전자 전체 또는 일부의 copy가 중복되거나 줄어들수도 있기 때문에 훨씬 넓은 영역에서 나타나는 Structural variation의 일종입니다.

관련 포스팅 보기 -> 유전학 중요개념 정리: Structural variation 및 Copy-number variation

일반적으로 NGS는 SNV를 보기 위한 목적으로 검사를 시행하지만, 해당 데이터를 활용하면 CNV 분석도 할 수 있기 때문에, 오늘은 NGS 데이터를 활용한 CNV 분석 방법에 대해 포스팅하고자 합니다.

NGS CNV
[그림1. NGS 데이터를 이용하여 CNV를 검출하는 원리] CNV 검출을 위해서는 mapping 되는 read 간의 정보, 그리고 각 영역에 mapping된 read의 depth 정보를 활용하게 됩니다.

위의 그림은 CNV 분석을 위한 NGS 데이터의 5가지 활용 원리를 나타내주고 있습니다. 그러나 가장 핵심이 되는 원리는 Read depth입니다. Target sequencing과 같이 Read depth가 충분한 경우에, 다른 검체들에 비해 해당 영역의 depth가 월등히 떨어지거나, 또는 월등히 높은 경우에는 해당 영역의 deletion 또는 duplication을 의심할 수 있습니다.

target_coverage_nd_FGFR2_4
[그림2. FGFR2 유전자의 Coverage (위) 및 Reference의 depth로 normalized한 depth (아래)를 나타내는 도표] 다른 검체들보다 Normalized depth가 월등히 높은 검체 (P27)는 해당 영역의 duplication, 월등히 낮은 검체 (P33)는 해당 영역의 deletion이 존재하는 것으로 의심할 수 있다.

사실 NGS 데이터는 CNV를 목적으로 한 것이 아니라, SNV 검출 목적의 데이터를 부수적으로 활용하는 것이기 때문에 많은 제한점이 있습니다. 따라서, 임상적으로 CNV 검사 목적의 NGS는 권장되지 않으며 적절한 가이드라인도 존재하지 않기 때문에 다양한 Computational tool 들이 개발되어 서로의 장점을 홍보하는 상황입니다. 다음은 다양하게 개발된 대표적인 CNV 검출 tool 들을 정리한 표입니다. 많은 경우  BAM 파일을 활용하는 것을 볼 수 있으며 대부분 R package를 제공하고 있어, 사용이 용이합니다.

NGS CNV2
[그림 3. CNV 검출을 위한 다양한 컴퓨터 툴] 어떠한 툴이 우수한가에 대해서는 명확하게 정립된 결론이 없기 때문에, 적절한 상황에 맞게 툴들을 활용하는 것이 필요합니다.
위의 표와 같이 다양한 툴들이 존재하지만, 실제로 몇가지 툴들을 사용하여 봤을 때, 결과들이 제각각이었고, 서로 일치하는 정도도 높지 않았습니다.  다양한 알고리즘을 활용함에도 불구하고, 위양성으로 보고되어 믿기 어려운 경우가 많았습니다. 가장 정확한 방법은 직접 그림 2와 같이 해당 영역의 coverage plot과 normalized depth를 보고 종합적으로 판단하는 것이었습니다. 아직까지 컴퓨터 툴들에 개선의 여지가 많음에도 불구하고, NGS 데이터를 활용하면 CNV에 대한 정보도 일부 얻을 수 있기 때문에 NGS는 더 폭넓게 활용될 것으로 전망이 됩니다.

[Reference]

Zhao, Min, et al. “Computational tools for copy number variation (CNV) detection using next-generation sequencing data: features and perspectives.” BMC bioinformatics 14.11 (2013): S1.

[유전학 중요개념 정리] Structural variation 및 Copy-number variation

일반적으로 사람의 염색체는 부모로부터 한쌍씩 물려받아 23쌍, 총 46개를 갖게 됩니다. 이러한 염색체의 수적 이상 또는 구조적 이상이 발생하는 경우 염색체 이상에 의한 질환을 갖게 됩니다. 가장 대표적인 것이 Trisomy 21 syndrome (다운 증후군)입니다.

이러한 염색체의 이상을 가장 거시적으로 검사하는 것이 흔히 염색체 검사라고 부르는 핵형 검사 (Karyotyping) 입니다.  핵형 검사는 일반적으로 혈액 검체로부터 백혈구를 분리하여, colchicine으로 처리하고 세포 분열의 중기 (metaphase)에 분열이 멈춘 염색체들을 Giemsa와 같은 dye로 염색하여 관찰합니다. (염색체 라는 이름도 염색되는 물질이라는 의미에서 여기에서 유래하였습니다.)

compare[핵형 검사 과정] 중기 세포의 염색체를 현미경으로 찍어서, 전문가가 전부 수작업으로 분류하고 이상이 없는지를 판독해야 합니다.

핵형 검사는 보통 현미경을 통해서, 눈으로 염색체의 band를 구분하여 사람이 직접 판독하기 때문에, 살펴볼 수 있는 해상도에 한계가 있습니다. 일반적으로 잘 훈련된 전문 검사자가 검출할 수 있는 염색체의 구조적 이상은 5Mb 정도라고 알려져 있습니다. 이렇듯, 현미경을 통해 확인할 수이 있는 염색체의 구조적 이상Microscopic level structural variation 이라고 합니다. 대부분 이러한 이상을 가진 환자는 다양한 기형 및 임상 증상을 나타내게 됩니다. 물론 일부에서는 아무런 형질 이상도 나타내지 않을 수도 있습니다.

그러나 많은 경우, 다양한 임상 증후군을 보이는 환자들에서 핵형 검사를 시행하여도 대부분 정상 결과를 보이는 경우가 많습니다. 이 중 일부는 현미경으로 발견되지 않는 더 작은 부위의 염색체의 구조적 이상, 즉 Sub-microscopic structural variation인 경우가 있을 수 있습니다.

Structural variation (SV)은 유전체에서 약 1kb 이상되는 유전체의 변화를 일컫는데, 이러한 SV이 중요한 이유는 유전자의 한 부위의 핵산 변화에 의한 단일 염기 변이 (Single nucleotide variant, SNV) 보다 mutation rate이 더 빠르고, 형질 변화에 더 큰 영향을 미칠 수 있기 때문입니다. 다음은 대표적인 Structural variation의 종류를 나타내주고 있습니다.

nmeth.1858-F1

마지막으로 SV중에서도 중요한 Copy-number variation (CNV)에 대해 알아보고, 포스팅을 마치겠습니다. Microscopic- 또는 Sub-microscopic- SV의 경우는, 대부분 심한 기형이나 문제를 갖고 태어나게 되므로 정상인에서는 거의 나타나는 경우가 없습니다. 그러나 CNV의 경우는 정상인에서도 많이 갖고 있는 정상 변이를 포함하고 있습니다. 즉, SNV과 동시에 CNV는 정상인에서의 다양한 형질의 차이를 일부 설명하고 있으며, 유전적 진화와 변이의 축적에서도 중요한 역할을 차지합니다.

이러한 CNV는 유전자 단위 또는 exon 단위로 더 작은 수준에서 존재하기나기 때문에, 검출 및 진단을 위해서는 다른 도구가 필요합니다. 전통적으로는 PCR 기술을 이용한 방법, FISH probe를 이용한 방법, MLPA, array CGH 등 다양한 방법을 이용하였지만, 최근에는 NGS 기술의 발달로 NGS를 이용한 CNV 검출도 널리 시행되고 있는 상황입니다. 다음 포스팅에서는 NGS 검사를 이용한 이러한 CNV 검출에 대해서 살펴보도록 하겠습니다.