오늘은 최근에 읽었던 논문에 대해 정리할 겸, Chromosome Conformation Capture (CCC, 3C) 연구 방법에 대해 포스팅해보고자 합니다. 저희 연구실에서도 약물 반응에 대한 GWAS 연구를 종종 하고 있는데, GWAS 데이터 분석의 가장 큰 장애물은 데이터 결과를 적절히 해석하고 의미 있는 정보를 도출해 내는데 있다고 할 수 있습니다.
GWAS 연구 방법에 대한 포스팅 보기 -> 전장 유전체 연관 분석, GWAS란 무엇인가?
하지만 안타깝게도 많은 경우에 있어 GWAS 연구에서 얻어낸 신호를 적절히 해석하는 것은 다음과 같은 이유로 쉽지 않습니다.
- GWAS 연구는 연관 분석이기 때문에, 통계학적 분석 방법에 기반한다. 따라서, GWAS 신호는 분석 데이터에 의존하며, 얻어진 신호가 항상 생물학적으로 새로운 정보를 주지는 못한다. 다시 말하면, 분석에 사용된 데이터의 수와 데이터의 질이 중요하며, 신호 자체가 위양성 (false positive)일 가능성도 있기 때문에, 독립적인 validation cohort가 요구되는 이유입니다.
- 실제 유전학적으로 중요한 변이는 GWAS 신호를 보이는 동일 LD Block 내의 다른 위치에 존재할 수 있다. GWAS는 일종의 스캐닝 방법이기 때문에, 실제 유전 변이의 위치를 찾기 위해서는 신호를 보이는 LD block 내의 모든 변이들을 더 샅샅히 뒤져봐야 합니다.
- GWAS 신호가 non-coding 영역에 위치하는 경우, 해석이 어렵다. GWAS 신호가 특정 유전자와 관련된 변이에서 나타나는 경우에는 해석이 어렵지 않지만, 신호를 보이는 위치 주위에 전혀 유전자가 없는 경우 (inter-genic region) 또는 intron 영역에 위치하는 경우 등은 그 GWAS 신호를 해석하기가 쉽지 않습니다.
이번 포스팅은 위의 3번과 같은 경우에, 위에서 언급한 Chromosome Conformation Capture (CCC, 3C) 연구 방법을 이용하여 의미를 도출하는 것에 대해 알아보고자 합니다. 위의 GWAS 연구에서 얻어진 신호가 non-coding 영역에 위치하는 경우의 해석은, 해당 영역이 유전자 발현의 조절에 관련 (regulatory variant)되어 있다고 가정하는 데서 시작합니다. 또한 이러한 유전자 발현은 유전자가 위치한 염색체의 3차원적인 상호 작용에 의해서 일어난다는 개념입니다.
유전자 발현의 조절 eQTL의 개념 보기 -> 유전학 중요개념 정리: eQTL

위의 그림은 이러한 3C 연구 방법에 대해서 잘 보여주고 있습니다. 즉, 3C 연구 방법은 3차원 공간상의 상호 작용이 일어나는 세포 주기에서 염색체를 고정시켜서 분석함으로써, 실제로 해당 위치의 염색체가 어떤 부위와 상호 작용을 하는지를 알아보는 방법이라고 할 수 있습니다. 이러한 방법을 이용하면, GWAS 연구를 통해 얻어낸 신호가 어떤 부위와 상호 작용을 하는지, 상호 작용을 하는 유전자가 있는지를 확인할 수 있습니다. 또한 해당 위치가 실제 유전자 발현 조절에 관여되어 있다는 사실을 확인하면, 이전에는 알지 못했던 non-coding 영역의 변이에 대해서 더 폭넓은 해석이 가능해지게 됩니다.

마지막으로 실제 위의 연구 방법론을 이용하여, 수행된 연구들을 소개하고 마치고자 합니다. [참고 문헌 3] 아래 연구에서는 위에서 소개한 Hi-C 연구 방법을 이용하여, 실제로 자가 면역 질환 발생의 위험도와 연관되었던 변이들에 대한 해석을 제공해주고 있습니다.
[참고 문헌]
Dekker, Job, Marc A. Marti-Renom, and Leonid A. Mirny. “Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data.” Nature Reviews Genetics 14.6 (2013): 390-403.
Belton, Jon-Matthew, et al. “Hi–C: a comprehensive technique to capture the conformation of genomes.” Methods 58.3 (2012): 268-276.
McGovern, Amanda, et al. “Capture Hi-C identifies a novel causal gene, IL20RA, in the pan-autoimmune genetic susceptibility region 6q23.” Genome biology 17.1 (2016): 212.