최근 임상 유전학 연구들은 시퀀싱 기술의 발달을 바탕으로 차세대 염기서열 분석법 (이하, NGS)을 이용한 엑솜 시퀀싱 (Exome sequencing) 으로 다양한 유전자의 변이 발굴 및 생물학적 기능 변화, 질병 메커니즘 입증 등의 패러다임으로 흘러가고 있습니다. 그러나 인간 유전체 30억쌍 염기 중에서 실제로 단백질을 생성하는 코딩 영역은 1~2% 정도로 매우 제한적이고, 이 부위의 변이가 실제로 관찰되는 표현형의 다양한 차이를 충분히 설명해주지 못합니다. 코딩 영역의 변이들의 의미와 기능 변화를 명확히 밝히는 것은 분명히 현재 진행형이면서 나아가야할 방향이 맞지만, 유전체 연구의 미개척 영역, 신대륙은 non-coding 영역이라고 생각합니다. 그런 의미에서 이번 포스팅은 코딩 영역이 전사되어 생성되는 mRNA와는 비슷하면서도 다른 Long intergenic non-coding RNA (lincRNA)의 특징과 기능들에 대해서 정리해보고자 합니다.
lincRNA는 그 이름에서도 유추할 수 있듯이, long = 200 nt 이상 / intergenic = gene과 gene 사이에 위치하는 / non-coding = 단백질을 직접 코딩하지 않는 / RNA를 가리킵니다. lincRNA가 중요한 점은 유전체의 51.8%는 전사가 일어나는데, 그 중에서 실제로 1.2%만이 단백질을 생성하고 나머지의 많은 부분을 lincRNA가 차지하기 때문입니다. RNA 시퀀싱을 통해서, 많은 수의 전사체 (Transcriptome)들이 연구되고 발견되고 있으나, 아직도 정확하게 lincRNA의 전체 갯수와 영역, 기능은 많은 부분 베일에 쌓여있습니다.
아래 그림은 mRNA와 lincRNA의 유사성과 차이점을 잘 보여주고 있습니다. lincRNA는 a) 전사 과정에서 잘리거나 일찍 종결이 발생하기도 하고, b) 세포 내의 핵에 주로 위치하며, nuclear exosome에 의해 처리됩니다. c) 또한, mRNA와 구별되는 점은 methylation pattern인데, 주로 promoter 근처의 H3K9me3 형태를 띈다고 합니다.
lincRNA는 유전자의 조직 특이적 발현을 조절하는데 중요하게 기여하는 것으로 생각되는데, 최근 연구에 의하면 Genomic Imprinting 과정에도 관여하며, 특정 질병의 발생 측면에서도 기여하는 바가 크다고 예상하고 있습니다. 아래 그림은 lincRNA의 다양한 기능을 나타내주고 있습니다. a) 염색질의 3차원적인 구조를 형성하고 조절하는 기능, b, c) mRNA를 안정화하거나, 전사 기능을 활성화 또는 억제하는 기능, d, e) 단백질 또는 RNA 미끼처럼 직접 작용하여 결합함으로써 세포의 분화와 증식을 조절하는 기능.
관련 포스팅 보기>
[유전학 중요개념 정리] Genomic imprinting and Uniparental disomy (UPD)
위와 같은 조절 기능과 더불어, lincRNA는 자체로도 전사와 번역의 기능도 가지는데, 아래 그림에서 이를 통한 다양한 조절 기능들을 보여주고 있습니다.
마지막으로 lncRNA에 대한 정보를 포함하는 대표적인 Database를 소개하면서 포스팅을 마무리하고자 합니다. 아직 많은 부분이 밝혀져 있지 않아서, 충분한 정보가 쌓이는데는 시간이 필요해 보입니다.
lncRNA Database 바로 가기>
RNAcentral (https://rnacentral.org/)
[Reference]