영국의 정밀 의료 사례: UK biobank, 100,000 Genome Project, NHS England 까지

정밀 의료 (Precision Medicine)와 관련하여 최근에 매우 감명을 받은 영국(UK)의 사례를 보면서, 전반적인 연구 동향 및 정밀 의료가 실제 의료 시장 변화에 미치는 동향에 관한 글을 남겨봅니다. 영국은 확실히 사회 복지 체계가 잘 잡혀서 의료 분야에서도 많은 변화를 주도하고 있으며, 체계도 매우 구체적이고 잘 잡혀있습니다.

 

UK BioBank

uk biobank

이러한 특성은 가장 선도적으로 영국인들의 유전체 정보를 구축하는 UK Biobank project에도 잘 나타나있으며, UK Biobank를 활용하여 나온 무수한 많은 연구와 논문들, 그리고 이를 쫓는 많은 개별 국가들의 정책들이 이를 입증합니다. 우리 나라에서도 한국인 유전체 은행을 구축해야 한다는 목소리도 동일한 선상에 위치합니다.

UK Biobank국가 주도 단위의 유전체 은행으로 다양한 질환과 형질을 대표하는 사람들의 검체를 수집하고, 임상 정보를 정리하고, 수집한 검체를 통해서 유전체 정보를 데이터 베이스로 구축하고 있습니다. 국가 주도 단위로 매우 큰 인구 집단을 대변하기 때문에 그 파급력은 매우 크다고 할 수 있습니다.

 

100,000 Genomes Project

genomics england

UK Biobank와 비슷하게 진행되고 있는 다른 프로젝트는 우리 나라의 보건 복지부에 해당하는 영국의 Department of Health & Social Care. 산하의 Genomics England에서 진행하고 있는 100,000 Genomes Project 입니다. 희귀질환과 암 질환특정 질환 환자들 10만명의 게놈을 전장 유전체 시퀀싱(Whole Genome Sequencing)하여, 전체 유전체 정보를 수집하는 것을 목표로 하는 프로젝트로, 연구자의 입장에서도 매우 파급력이 크지만, 다양한 질환의 환자들과 일반인들에게도 미칠 파급력이 엄청 날 것으로 예상됩니다. 해당 프로젝트는 2018년 12월 10만번째 참여자의 유전체를 시퀀싱하면서 목표에 도달했고, 이 결과를 바탕으로 앞으로 어떠한 결과가 나올지 매우 기대가 됩니다.

The UK has sequenced 100,000 whole genomes in the NHS

 

NHS England

nhs england_00000

마지막으로 위와 같은 유전체 프로젝트의 결과를 활용하고, 실제로 의료를 변화 시키기 위해 장기적인 관점에서 영국은 NHS England를 출범시켜서 정밀 의료를 바탕으로 한 10년 이후의 의료 서비스에 대해서 계획하고 있습니다. 재미있는 점은 많은 일반 국민들이 실제로 관심을 가지고, 직접 프로젝트에 참여하며, 이를 통해서 공동체 전체의 발전을 이끌어내는 각각의 톱니바퀴가 잘 물려서 돌아가고 있다는 점입니다.

특히, 이러한 큰 테마 안에 속해 있는 각각의 세부 과제들의 짜임새와 디테일들을 보면, 의료인으로서 소름끼칠 정도로 정교하고 놀랍습니다. 그 안에서 얼마나 많은 전문가들이 노력하여 상의하고 정책을 수립했을지, 하나의 문서를 작성하는데도 얼마나 많은 고민이 있었을지가 여실히 느껴집니다.

우리나라의 보건 복지부에서 의료 정책을 기획하시는 분들도 이러한 점을 꼭 염두해두고 장기적인 계획은 수립했으면 하는 바람으로 글을 마칩니다.

 

전장 유전체 연관 분석, GWAS란 무엇인가?

어제 정신과 전문의 친구와 점심을 먹었습니다. 제가 병원 연구실에서 유전체 연구를 하는 것을 듣고, 함께 연구할 아이디어에 대해서 이야기를 나누자고 만났는데, 안타깝게도 GWAS에 대한 개념이 전혀 없더군요. 지금은 바야흐로 GWAS의 시대입니다. 그래서 이번 글을 유전학 전공자가 아닌 일반인도 쉽게 이해할 수 있도록 전장 유전체 연관 분석 (Genome Wide Association Study; GWAS)의 개념과 연구 방법론에 대해서 글을 써 보고자 합니다.

저는 새로운 개념을 배울 때 항상 그 이름이 의미하는 바를 이해하려고 노력합니다. 그런 의미에서 GWAS라는 이름부터 파헤쳐보겠습니다.

Genome Wide = 전장 유전체 : 모든 유전체 위치에 대해서,

Association Study = 연관 분석: 관심을 가진 형질(Target phenotype)연관성을 갖는 유전적 위치를 찾는다.

GWAS
[GWAS 분석 방법의 개념] 일반적으로 Case (관심 형질을 가진 집단; 환자군)Control (형질을 갖지 않는 집단; 정상군)의 유전 정보를 서로 비교하여, case에서 더 많은 빈도를 갖는 = 연관성을 가진 유전자를 찾게 됩니다.
앞선 글에서 최근의 유전학 연구는 각 유전자 위치와 관련된 형질을 밝혀 그 발현 기전을 이해하는데 집중되고 있다는 말을 했습니다. GWAS는 그러한 유전자와 연관된 형질을 찾는 하나의 탐색 (Exploratory) 방법을 말합니다. 사실 무수히 많은 형질이 어떤 유전자와 관련되어 있는지 실험적으로 찾아내는 것은 정말로 어렵습니다. GWAS는 모든 유전자 위치에 대해 연관성의 정도를 분석하기 때문에, 관심있는 형질 또는 질환에 1차적으로 관련되어 있는 후보 유전자를 찾아내는 데 매우 유용한 탐색 도구 (screening method)가 됩니다.

GWAS는 일반적으로 Case (관심 형질을 가진 집단; 환자군)Control (형질을 갖지 않는 집단; 정상군)의 두 집단의 유전 정보를 얻은 후에 서로 비교하여, case에서 더 많은 빈도를 갖는, 즉 연관성을 가진 유전자를 찾게 됩니다. 한 가지 중요한 내용은 GWAS에서 찾아낸 유전자라 하더라도, 그것이 항상 원인 유전자는 아니라는 점입니다. 즉 GWAS는 인과 관계를 찾는 것이 아니라 우연히 연관되어 나타나는 유전자들의 후보를 찾는 과정입니다.

따라서 일반적으로 연구는 GWAS를 통한 후보 유전자 탐색 > 그리고 이 후에 더 많은 환자군에서 확인 (replication cohort) > 동물 & 세포 실험에서 생물학적 입증의 결과를 거쳐 최종적으로 유전자-형질의 관계를 밝히는 과정으로 진행됩니다. 이러한 GWAS 연구의 역사도 10년이 넘었습니다. GWAS는 강력한 툴 임에 틀림이 없지만, 그 원리가 통계적 연관성 분석에 기인하는 것이기 때문에 그 한계점도 분명히 인식하는 것이 중요합니다. 따라서 명확한 Case와 Control군을 확보하고, 통계적으로 분석이 가능한 충분한 수의 환자수를 확보하는 점도 중요하겠습니다. 하지만 현실에서는 이것이 쉽지만은 않죠.

linkage_disequilibrium
우리는 부모로 부터 두 쌍의 염색체 쌍 (상동 염색체)을 물려 받아 무작위적으로 재조합이 일어나게 됩니다. 그러나 유전자 재조합은 덩어리로 일어나기 때문에, 서로 거리가 가까운 유전자 위치 끼리는 유전형이 섞이지 않고 모자이크 패턴으로 함께 이동하게 되며, 이러한 하나의 덩어리를 일반적으로 LD block이라고 부릅니다.

더불어 GWAS 분석 방법을 이해하는 데 중요한 개념이 있는데, 흔히 LD (Linkage Disequilibrium)라고 부르는 ‘연관 비평형’ 입니다. 우리는 부모로부터 한 쌍씩 유전자를 물려받게 되는데, 생식 세포는 분열되면서 같은 세포 내에서도 끊임없이 유전형의 재배열이 일어납니다. 그러나 유전자 재조합은 덩어리로 일어나기 때문에, 서로 거리가 가까운 유전자 위치 끼리는 유전형이 섞이지 않고 모자이크 패턴으로 함께 이동하게 되며, 이러한 하나의 덩어리를 일반적으로 ‘LD block’이라고 부릅니다. 같은 LD block에 포함된 위치에 대해서는 연관성 분석을 하게 되면, 동일한 연관성을 보인 p 값을 보이기 됩니다. LD block의 존재는 다음과 같이 4가지를 시사합니다.

  1. GWAS 분석은 30억쌍의 모든 염기 서열에 대해서 할 필요가 없다. 같은 LD block에서 대표적인 하나의 마커만 이용해도 된다. > 분석 위치의 수가 축소화 됩니다.
  2. GWAS 연관 분석으로 후보 위치를 찾았다 하더라도, 정확한 원인 유전자의 위치는 LD block 내에 존재한 다른 위치일 수 있다. > GWAS로 찾아낸 후보 위치 근처의 유전형을 상세하게 다시 살펴봐야 하는 이유입니다.
  3. GWAS에 흔히 이용되는 Manhattan plot (맨하탄 플롯)에서 시그널이 하나의 탑처럼 주위에서 모두 높게 나오는 이유가 됩니다.
  4. 흔히 Imputation이라고 부르는 과정을 통해, 같은 LD block 내의 검사하지 않은 부위의 유전형도 추정이 가능해집니다.

Manhattan_Plot
[Manhattan plot] GWAS 분석 결과 의미 있는 시그널이 마치 맨하탄 가에 위치한 고층 빌딩들처럼 나온다고 하여 맨하탄 플롯 이라는 이름이 붙게 되었습니다.
마지막으로 GWAS에 관한 글은 GWAS catalog를 소개하면서 마치도록 하겠습니다. 지금 까지 무수히 많은 형질에 대한 GWAS 연구가 진행되었고, 최근에는 일반적인 형질에 대해서 UK biobank에 유전 정보와 형질이 공개되면서, 많은 부분 형질과 유전형 간의 GWAS 연구 및 관계가 드러나는 중입니다. 하지만 다시 한번 강조하면, 연관성과 인과 관계는 다릅니다. 따라서 확실한 생물학적 메카니즘으로 이를 설명하기 위해서는 후속 연구가 중요하게 됩니다. 이러한 GWAS 연구를 통해 형질과 유전자 위치의 관계가 명확하게 드러난 데이터를 모아 놓은 것이 GWAS catalog입니다. GWAS catalog는 지금도 계속 업데이트 되는 중이며, 나중에는 많은 질병과 유전병에 대해서 정보가 추가되기를 기대합니다.

아래 유튜브 자료에 GWAS catalog에 관한 내용이 잘 소개되어 있어 참고하면 좋을 것 같습니다.

[References]

Bush, William S., and Jason H. Moore. “Genome-wide association studies.” PLoS computational biology 8.12 (2012).

MacArthur, Jacqueline, et al. “The new NHGRI-EBI Catalog of published genome-wide association studies (GWAS Catalog).” Nucleic acids research 45.D1 (2017): D896-D901.

http://www.ebi.ac.uk/gwas/