유전자 변이의 해석: 대용량 기능 검사의 필요성

오늘 포스팅은 유전체 검사 후 발견되는 변이 해석에 대해 얘기해 보고자 합니다. 사실 최근에 제가 공부한 내용이라, 조금 어려운 내용이지만 해당 내용을 정리할 겸 포스팅을 남겨봅니다.

NGS 기술이 널리 사용되면서, 검사를 통한 변이 검출에 대한 문제는 이제 어느 정도 정상 궤도에 올랐다고 볼 수 있습니다. 사실 더 중요한 문제는 검출된 변이를 해석하고, 이를 실제 의료 현장에서 적용하는데 있습니다. 이제서야 이러한 문제가 이슈가 되고 있는 것은 시간의 흐름대로 과거 생거 시퀀싱을 통한 유전자 검사와 NGS 기술의 등장을 생각하면, 이해하기가 쉽습니다.

시퀀싱 기술의 발전 한눈에 살펴 보기 -> 휴먼 게놈 프로젝트, 그 이후.. 그리고 정밀 의료시대까지

과거 10년 정도 임상 현장 (병원)에서는 계속 유전자 검사를 해왔고, 실제 진료 (유전병 진단 등)에도 사용을 해왔습니다. 그러나 이때는 주로 생거 시퀀싱에 기반한 유전자 검사 였기 때문에, 매우 한정된 지역 (흔히 mutation hot spot이라고 불리는 부분)을 검사하거나 단일 유전자 1~2개의 엑손 부위 등을 검사하였죠. 이러한 유전자 검사를 시행하더라도, 검출되는 변이는 그리 많지 않았습니다. 그리고 질병과 알려진 변이 외의 변이는 검출된다 하더라도 크게 관심이 없었습니다. 사실 그러한 변이는 딱히 해석할 방법이 없었다는게 더 정확할지도 모르겠습니다. 따라서 그 동안 주요 변이 해석은 다음과 같이 이루어졌습니다.

  1. Family segregation: 가계도 분석을 통해, 대부분의 유전병 원인 유전자 및 변이를 추정하는 방식.
  2. Computational prediction algorithms: Polyphen-2, SIFT 등과 같은 단백질의 아미노산 서열 및 기능적 중요도 (conservation)에 기반한 컴퓨터 예측 알고리즘.
  3. Data sharing: 연구자 또는 임상 의사들 간의 진료 경험 및 축적된 데이터를 커뮤니티 또는 학회에서 공유해오던 방식.
  4. Traditional functional assays: 주로 in vitro assay를 통해 개별적인 논문에서 실험하고 변이의 효과를 입증해오던 방식.

하지만 NGS 기술이 등장하면서, 더이상 위의 접근 방식들로는 변이들을 해석하는데 한계에 다다르게 됩니다. 가장 널리 사용되는 컴퓨터 알고리즘 방식의 경우는 위양성률이 높고, 제한적인 데이터에 기반하기 때문에 정확한 정보를 주지 못하는 경우가 많습니다. 그리고 전통적인 변이의 functional assay의 경우는 가장 정확한 방법이기는 하지만, 매우 제한적인 몇몇 변이에 대해서만 실험 및 논문 보고가 이루어졌기 때문에 모든 검출 변이에 대해 정보를 제공하는데 한계가 있었습니다 (low through-put).

컴퓨터 알고리즘 기반 예측 도구에 대해 더 살펴보기 -> 아미노산 치환의 효과 예측: In silico tool의 원리와 종류

NGS의 다른 이름인 Massively parallel sequencing 처럼, 엄청나게 방대한 시퀀싱 데이터를 통해 생산된 변이 데이터는 더이상 한 두개의 유전자 수준이 아닌 거의 질병과 관련된 모든 유전자의, 모든 변이들을 검출 가능하게 하였습니다. 상황이 이렇다 보니, 검출된 대부분의 변이들은 VUS (Variant of Unknown Significane)로 분류되는 상황이 잦아지게 되었죠. 쉽게 말해 ‘어떤 의미를 가지는 변이인지 모르겠다.’ 입니다.

Figure 1
아미노산 잔기가 치환되는 missense variant는 gnomAD에 460만개의 변이가 보고되었지만, 그 중에 임상적 연관성을 보고하여 ClinVar에 등록된 변이는 2% 수준인 10만개입니다. 그마저도 절반 이상은 정확히 의미를 잘 모르겠다고 분류된 VUS입니다.

따라서 뒤따라오는 문제는 Massive하게 검출되는 변이들 처럼, 변이들의 기능적 특성에 대해서도 Massive하게 검사해서 확인할 필요가 있게 되었습니다 (High through-put Functional assay). 그래서, 하나의 대안으로 최근 주목 받는 검사 방법이 오늘 소개하고자 하는 Multiplexed assays for variant effect (MAVE)입니다.

Figure 2.png
MAVE는 가능한 모든 변이들의 library를 생산한 이후에 모든 변이들에 대한 functional assay를 high through-put으로 시행하여 그 변이의 기능적 기여를 해석하는 방식을 말합니다.
Figure 3
MAVE의 단계적 assay 방법.
  1. Construction of a variant library: 검사하고자 하는 기능 유전자에 해당하는 가능한 모든 위치의 변이를 포함하는 library를 구축합니다.
  2. Delivery of this variant library to a model system: E.coli, Yeast, 또는 mammalian cell과 같이 유전자를 발현시켜 검사하고자하는 model system에 library를 집어 넣습니다.
  3. A functional assay: 발현된 단백질의 기능을 기능 검사를 통해 평가합니다. 보통은 selection 방법을 이용하여, selection 전 후의 어떤 기능을 가진 변이가 더 많이 또는 더 적게 존재하는지를 정량합니다.
  4. Sequencing to quantify each variant’s representation: 위의 기능 검사 전 후의 발현의 상대적인 비율을 sequencing을 통해 비교하게 됩니다.
  5. Calculation and calibration of functional scores: 위에서 얻은 비율을 일종의 기능적 점수로 환산하여 평가합니다.
  6. The genotype–phenotype relationship at every position: 모든 위치의 변이에 대한 기능적 지도가 완성됩니다.

위의 MAVE의 방법은 변이 해석에 대한 새로운 high throughput method로 앞으로 정밀 의료를 실현하는데 있어, 유용한 genotype–phenotype relationship 정보를 제공해줄 것으로 기대가 됩니다. 그러나 다음과 같은 제한점 및 후속 연구가 필요합니다.

  1. Model system의 한계: E.coli, Yeast, Mammalian cell과 같이 변이 라이브러리를 발현 시킬 적당한 모델이 있어야 하지만, 어떤 유전자에 대해서는 이것이 불가능할 수도 있습니다.
  2. Functional assay를 통한 selection: 사실 유전자가 발현되어 생긴 단백의 기능은 한 가지만 정해져 있는 것이 아닙니다. 하나의 단백이 여러가지 일을 동시에 수행하기 때문이죠. 따라서 검사해야할 functional assay가 무궁무진하게 많을 수도 있고, 그 각각을 표준화하기가 매우 어렵습니다. 또한 발현 전후의 상대적인 양으로 그 기능을 평가한다는 것이 과연 단백질의 정확한 기능을 반영하는 것인가에 대해서도 생각해볼 문제입니다.
  3. 컴퓨터 알고리즘 개선: 기능적 점수를 포함하는 새로운 컴퓨터 알고리즘을 개발하여, 좀 더 정확하게 변이의 효과를 예측하는데에 위의 데이터가 사용될 수 있습니다.

최근에 위의 MAVE 방법론을 이용하여 PPARG 유전자의 기능적 지도가 완성되어, Nature genetics에 소개된 바가 있습니다. 논문에서 저자들은 컴퓨터 알고리즘에 기반한 예측보다 MAVE 방법이 더 변이의 기능을 설명하는데 더 유용하다는 것을 보이기도 했습니다. 앞으로는 이처럼 아마 NGS 기술의 발전되고 많은 변이가 보고됨에 따라서, 그 기능적 해석과 관련된 부분에 대해서도 많은 관심과 연구가 진행될 것으로 생각이 됩니다. 그에 따라 하나의 방법론으로써 MAVE는 아직 몇가지 한계점이 있지만 좋은 대안이 될 것으로 생각됩니다. 그리고 궁극적으로는 모든 주요 유전자에 대한 변이의 기능적 예측을 높은 정확도로 얻을 수 있는 기능 지도가 완성되어, 데이터 베이스의 형태로 제공되기를 연구자들은 희망하고 있습니다.

사실 오늘 포스팅은 MAVE에 대해 매우 간략하게 정리한 것이라, 이해하기 어려울 수도 있을 것 같습니다. 관심이 있으신 분들을 아래 논문들을 더 살펴보시면 좋을 것 같습니다.

 

[참고 문헌]

Starita, Lea M., et al. “Variant Interpretation: Functional Assays to the Rescue.” The American Journal of Human Genetics 101.3 (2017): 315-325.

Gasperini, Molly, Lea Starita, and Jay Shendure. “The power of multiplexed functional analysis of genetic variants.” Nature protocols 11.10 (2016): 1782-1787.

Majithia AR, Tsuda B., et al. “Prospective functional classification of all possible missense variants in PPARG.” Nature Genetics 2016 Dec;48(12):1570-1575.

약물유전체 정밀의료의 실현, F-CAP 프로젝트

오늘은 어제 소개해드렸던 PGRN (Pharmacogenomic Research Network)에서 진행 중인 프로젝트 중 하나인 F-CAP(Functionalization of Variants in Clinical Actionable Pharmacogenes)에 대해서 소개하고자 합니다.

최근 유전자 시퀀싱 기술의 발달로 개인별로 많은 차이를 보이는 SNV (Single Nucleotide Variant)를 가진다는 것을 알게 되었고, (사실 전체 염기서열에 비하면, SNV의 비율을 매우 적은 편이긴 합니다만,) 약물 대사에 관여되는 단백질을 coding 하는 유전자의 변이가 결국 약물의 농도나 반응, 부작용 등에 관여하는 것이 밝혀지면서 약물 유전체학의 연구는 이쪽으로 집중되고 있습니다. 특히 최근에는 약물 대사 관련 유전자들을 한번에 검사 가능한 NGS 패널도 개발되면서, 많은 변이들을 한번에 찾아낼 수 있게 되었죠.

그림1
[F-CAP 프로젝트] 개인별 약물 반응을 예측하기 위해서는 개인별로 발견된 변이가 약물 유전자에 어떤 기능적 차이를 만들어내는지 알아야합니다. 이를 위해서는 모든 가능한 변이에 대한 기능적 변화를 측정한 데이터 베이스 구축이 필요합니다.
그러나 이러한 데이터가 점점 쌓이면서, 해석에 문제가 생기게 되었습니다. 즉 이전에 보고되지 않은 많은 변이들이 발견되었는데, 이게 약물 대사 효소의 기능에 어떠한 영향을 미치는지 정확하게 알기 어려운 상황에 직면하게 된 것입니다. 사실 이전에 보고된 논문에서 실험을 통해 확인되었던 변이들은 어느 정도 그 효과를 예상할 수 있었지만, 처음 발견되는 변이들이 너무 많다보니 변이의 효과를 제대로 예측하기 불가능했던 것입니다. 그래서 F-CAP 프로젝트는 약물 유전자에 가능한 모든 단백질의 변이들에 대해서 그 기능적 변화를 측정하여, 데이터 베이스를 구축하고자 하는 프로젝트입니다. 이렇게 되면 새로운 변이가 발견되었을 때도 그 효과를 기존 데이터베이스를 통해서 예측할 수 있게 되니까요. 일종의 유전자 지도에 상응하는 기능적 지도를 만들고자하는 시도라고 볼 수 있죠. 사실 이것은 정밀 의료의 실현 측면에서 매우 중요한 의미를 가집니다. PGRN에서는 우선적으로 약물 대사에 중요한 유전자들에 대해서 이러한 시도를 시작했지만, 더 나아가 인간의 유전자 염기 서열 지도처럼, 결국은 모든 유전자들에 대해서 이러한 기능적 지도가 있어야 정밀 의료가 가능하다는 셈이죠.

그림2

F-CAP 프로젝트는 다음과 같은 5가지 단계로 기획되어 있습니다.

  1. Target Gene Prioritization: 약물 대사와 유전자 관계가 명확하며, 임상적 의의가 큰 CPIC Level A 약물-유전자 쌍에 대해, 우선적으로 연구를 진행하고 있습니다.
  2. Large-Scale Functional Assays: 모든 유전자 변이에 대해서 기능 검사를 해야하기 때문에, 매우 큰 스케일의 검사를 효율적이고 빠르게 시행할 수 있는 기술을 개발하고 적용해야 합니다.
  3. Variant Impact Score Calculation: 위에서 측정한 검사 결과를 토대로, 변이가 실제 정상에 비해 어느 정도의 영향을 미치는지를 표준화된 score로 계산해냅니다.
  4. Impact Score Validation: 이렇게 얻어낸 스코어를 통해 예측한 결과가 실제 임상 데이터에 유용하게 쓰일 수 있는지를 검증합니다.
  5. Data dissemination: 유전자 변이와 스코어를 하나의 커다란 데이터베이스로 구축하여, 누구나 열람할 수 있도록 합니다.

 

그림3.png
2017년 3월 현재, CPIC 가이드라인에서 제시하는 Level A (유전자와 약물 반응 간의 관계가 분명하게 입증된 수준) 유전자와 약물 쌍입니다.

한 가지 더 부연 설명을 추가하면, 2017년 3월 현재 CPIC 가이드 라인에서 유전자와 약물 대사 간의 명확한 관계가 입증된 쌍은 위의 16쌍이며, 계속적으로 추가가 되고 있습니다. 특히 약물 대사의 많은 부분은 Cytochrome P450이 관여하기 때문에, CYP 관련 유전자들이 많은 것을 볼 수 있습니다. 즉 F-CAP 프로젝트의 1단계는 CYP 관련 유전자에 대해서, 얼마나 효율적으로 모든 변이의 기능 변화를 측정하는가 하는 방향으로 진행될 것을 예상할 수 있습니다.

F-CAP 프로젝트는 현재 진행형이며, 아마 조만간 관련 논문이 나올 것으로 생각됩니다. 약물 유전자 기능 지도가 완성되면, NGS 검사를 통한 개인의 변이 검사 및 이를 임상에 활용하는 측면에서도 많은 도움이 기대가 됩니다. 또한 정밀 의료 실현의 측면에서도 약물 유전자 뿐 아니라 여러 질병 유전자들에 대해서도 비슷한 연구가 활발히 진행되어, 많은 유전자-형질 및 기능 관계가 밝혀지기를 기대합니다. 다음 번 포스팅에서는 실제로 이러한 연구가 진행된 사례와 그 연구 방법론에 대해서 글을 써 보도록 하겠습니다.

[참고 문헌]

Bush, William S., et al. “Genetic variation among 82 pharmacogenes: The PGRNseq data from the eMERGE network.” Clinical Pharmacology & Therapeutics 100.2 (2016): 160-169.

http://www.pgrn.org/functional-pharmacogenes.html

약물유전체학 연구 네트워크: PGRN

오늘은 약물 유전학 분야에서 정밀 의료 실현을 위해 연구와 노력을 이어가고 있는 약물유전체학 연구 네트워크 (Pharmacogenomic Research Network; PGRN)에 대해서 소개하고자 합니다. 사실 이 연구 네트워크를 소개하는 이유에는 크게 2가지 이유가 있는데, 우선 제가 현재 약물 유전체학을 공부하기 때문이기도 하거니와 당장 정밀 의료의 실현을 위한 최전선에서 노력하고 연구하고 있는 사람들이기 때문입니다. 더불어, 아직 우리나라에서는 PGRN에 포함되어 연구를 하고 있는 연구자가 거의 없고, 정밀 의료 실현을 위한 약물 유전체학의 중요성에 대해서도 외국에 비해서 관심이 너무 적기에, 우리나라에서 많은 관심과 연구가 있기를 바래봅니다.

PGRN
[PGRN 홈페이지] 약물 유전체학 관련 연구를 하는 사람들이 서로 연구를 공유하고, 시너지를 일으켜 정밀의료의 실현을 위해서 노력하고 있습니다.
PGRN2_00000

PGRN의 identity를 잘 보여주는 문장이라 가져왔습니다. 약물의 치료 효과와 부작용과 관련된 유전적 차이 (genomic variation)를 연구하여 정밀 의료의 실현을 목표로 하는 연구자 네트워크라는 것을 알 수 있습니다. 한 가지 눈여겨 볼 점은 이 연구자 네트워크에 단순히 약물 유전체 전공자만 있는 것이 아니라, 다양한 전공의 연구자들을 포용하고 서로 연구에 시너지를 내고 있다는 점 입니다. 또한 연구자들 간의 활발한 교류를 위해서 구축된 네트워크가 서로 윈-윈 할 수 있는 매우 긍정적인 방향으로 진행 중이라 것도 부러운 점이 많습니다.

PGRN2

위에는 PGRN 주도로 진행되었던 또는 진행되고 있는 연구를 바탕으로 구축된 연구 Resource들입니다. 단순히 하나의 연구에서 끝나는 것이 아니라, 연구의 효용성을 극대화하고 실제로 적용하는데까지 필요한 모든 하나 하나의 세부 단계들을 생각하고 구축해가고 있다는 점이 정말로 부러운 점입니다. 사실 정밀 의료를 실현하기 위해서는 그 것을 뒷받침할 수 있는 연구 결과도 중요하지만, 연구 결과를 통해 도출한 지식들은 잘 엮고 실제 임상 환경이나 사회에 적용하기 까지도 많은 노력이 필요하게 되는데, PGRN의 연구자들은 이 점에도 많은 공을 들이고 있는 모습이 보입니다. 사실 세부적인 프로젝트 소개나 구성원, 약물 유전체 데이터 베이스 등 소개해야할 내용이 많지만, 이번 글은 간단히 PGRN을 소개하는 것에서 마무리하고자 합니다. 연구자들 부터 일반 대중까지 정밀 의료 실현을 위한 이해와 공감대가 형성되기를 바라며, 오늘 글은 이것으로 마치겠습니다.

 

전장 유전체 연관 분석, GWAS란 무엇인가?

어제 정신과 전문의 친구와 점심을 먹었습니다. 제가 병원 연구실에서 유전체 연구를 하는 것을 듣고, 함께 연구할 아이디어에 대해서 이야기를 나누자고 만났는데, 안타깝게도 GWAS에 대한 개념이 전혀 없더군요. 지금은 바야흐로 GWAS의 시대입니다. 그래서 이번 글을 유전학 전공자가 아닌 일반인도 쉽게 이해할 수 있도록 전장 유전체 연관 분석 (Genome Wide Association Study; GWAS)의 개념과 연구 방법론에 대해서 글을 써 보고자 합니다.

저는 새로운 개념을 배울 때 항상 그 이름이 의미하는 바를 이해하려고 노력합니다. 그런 의미에서 GWAS라는 이름부터 파헤쳐보겠습니다.

Genome Wide = 전장 유전체 : 모든 유전체 위치에 대해서,

Association Study = 연관 분석: 관심을 가진 형질(Target phenotype)연관성을 갖는 유전적 위치를 찾는다.

GWAS
[GWAS 분석 방법의 개념] 일반적으로 Case (관심 형질을 가진 집단; 환자군)Control (형질을 갖지 않는 집단; 정상군)의 유전 정보를 서로 비교하여, case에서 더 많은 빈도를 갖는 = 연관성을 가진 유전자를 찾게 됩니다.
앞선 글에서 최근의 유전학 연구는 각 유전자 위치와 관련된 형질을 밝혀 그 발현 기전을 이해하는데 집중되고 있다는 말을 했습니다. GWAS는 그러한 유전자와 연관된 형질을 찾는 하나의 탐색 (Exploratory) 방법을 말합니다. 사실 무수히 많은 형질이 어떤 유전자와 관련되어 있는지 실험적으로 찾아내는 것은 정말로 어렵습니다. GWAS는 모든 유전자 위치에 대해 연관성의 정도를 분석하기 때문에, 관심있는 형질 또는 질환에 1차적으로 관련되어 있는 후보 유전자를 찾아내는 데 매우 유용한 탐색 도구 (screening method)가 됩니다.

GWAS는 일반적으로 Case (관심 형질을 가진 집단; 환자군)Control (형질을 갖지 않는 집단; 정상군)의 두 집단의 유전 정보를 얻은 후에 서로 비교하여, case에서 더 많은 빈도를 갖는, 즉 연관성을 가진 유전자를 찾게 됩니다. 한 가지 중요한 내용은 GWAS에서 찾아낸 유전자라 하더라도, 그것이 항상 원인 유전자는 아니라는 점입니다. 즉 GWAS는 인과 관계를 찾는 것이 아니라 우연히 연관되어 나타나는 유전자들의 후보를 찾는 과정입니다.

따라서 일반적으로 연구는 GWAS를 통한 후보 유전자 탐색 > 그리고 이 후에 더 많은 환자군에서 확인 (replication cohort) > 동물 & 세포 실험에서 생물학적 입증의 결과를 거쳐 최종적으로 유전자-형질의 관계를 밝히는 과정으로 진행됩니다. 이러한 GWAS 연구의 역사도 10년이 넘었습니다. GWAS는 강력한 툴 임에 틀림이 없지만, 그 원리가 통계적 연관성 분석에 기인하는 것이기 때문에 그 한계점도 분명히 인식하는 것이 중요합니다. 따라서 명확한 Case와 Control군을 확보하고, 통계적으로 분석이 가능한 충분한 수의 환자수를 확보하는 점도 중요하겠습니다. 하지만 현실에서는 이것이 쉽지만은 않죠.

linkage_disequilibrium
우리는 부모로 부터 두 쌍의 염색체 쌍 (상동 염색체)을 물려 받아 무작위적으로 재조합이 일어나게 됩니다. 그러나 유전자 재조합은 덩어리로 일어나기 때문에, 서로 거리가 가까운 유전자 위치 끼리는 유전형이 섞이지 않고 모자이크 패턴으로 함께 이동하게 되며, 이러한 하나의 덩어리를 일반적으로 LD block이라고 부릅니다.

더불어 GWAS 분석 방법을 이해하는 데 중요한 개념이 있는데, 흔히 LD (Linkage Disequilibrium)라고 부르는 ‘연관 비평형’ 입니다. 우리는 부모로부터 한 쌍씩 유전자를 물려받게 되는데, 생식 세포는 분열되면서 같은 세포 내에서도 끊임없이 유전형의 재배열이 일어납니다. 그러나 유전자 재조합은 덩어리로 일어나기 때문에, 서로 거리가 가까운 유전자 위치 끼리는 유전형이 섞이지 않고 모자이크 패턴으로 함께 이동하게 되며, 이러한 하나의 덩어리를 일반적으로 ‘LD block’이라고 부릅니다. 같은 LD block에 포함된 위치에 대해서는 연관성 분석을 하게 되면, 동일한 연관성을 보인 p 값을 보이기 됩니다. LD block의 존재는 다음과 같이 4가지를 시사합니다.

  1. GWAS 분석은 30억쌍의 모든 염기 서열에 대해서 할 필요가 없다. 같은 LD block에서 대표적인 하나의 마커만 이용해도 된다. > 분석 위치의 수가 축소화 됩니다.
  2. GWAS 연관 분석으로 후보 위치를 찾았다 하더라도, 정확한 원인 유전자의 위치는 LD block 내에 존재한 다른 위치일 수 있다. > GWAS로 찾아낸 후보 위치 근처의 유전형을 상세하게 다시 살펴봐야 하는 이유입니다.
  3. GWAS에 흔히 이용되는 Manhattan plot (맨하탄 플롯)에서 시그널이 하나의 탑처럼 주위에서 모두 높게 나오는 이유가 됩니다.
  4. 흔히 Imputation이라고 부르는 과정을 통해, 같은 LD block 내의 검사하지 않은 부위의 유전형도 추정이 가능해집니다.

Manhattan_Plot
[Manhattan plot] GWAS 분석 결과 의미 있는 시그널이 마치 맨하탄 가에 위치한 고층 빌딩들처럼 나온다고 하여 맨하탄 플롯 이라는 이름이 붙게 되었습니다.
마지막으로 GWAS에 관한 글은 GWAS catalog를 소개하면서 마치도록 하겠습니다. 지금 까지 무수히 많은 형질에 대한 GWAS 연구가 진행되었고, 최근에는 일반적인 형질에 대해서 UK biobank에 유전 정보와 형질이 공개되면서, 많은 부분 형질과 유전형 간의 GWAS 연구 및 관계가 드러나는 중입니다. 하지만 다시 한번 강조하면, 연관성과 인과 관계는 다릅니다. 따라서 확실한 생물학적 메카니즘으로 이를 설명하기 위해서는 후속 연구가 중요하게 됩니다. 이러한 GWAS 연구를 통해 형질과 유전자 위치의 관계가 명확하게 드러난 데이터를 모아 놓은 것이 GWAS catalog입니다. GWAS catalog는 지금도 계속 업데이트 되는 중이며, 나중에는 많은 질병과 유전병에 대해서 정보가 추가되기를 기대합니다.

아래 유튜브 자료에 GWAS catalog에 관한 내용이 잘 소개되어 있어 참고하면 좋을 것 같습니다.

[References]

Bush, William S., and Jason H. Moore. “Genome-wide association studies.” PLoS computational biology 8.12 (2012).

MacArthur, Jacqueline, et al. “The new NHGRI-EBI Catalog of published genome-wide association studies (GWAS Catalog).” Nucleic acids research 45.D1 (2017): D896-D901.

http://www.ebi.ac.uk/gwas/

휴먼 게놈 프로젝트, 그 이후.. 그리고 정밀 의료시대까지

Hx of HGP
The landscape of Human Genome Project (National Human Genome Research Institute 에서 발췌)

인간 게놈 프로젝트 (Human Genome Project; HGP)는 인간의 모든 유전자 염기 서열을 밝히는 것을 목표로 1990년 처음 시작되었습니다. 그리고 당초 목표보다 2년 빠른 2003년도에 목표를 완수하게 되었죠. 이 당시만 해도, 인간의 유전체 암호가 모두 해독되어서 마치 모든 유전병을 정복가능하게 될 거라고 기대가 매우 컸습니다. 그렇지만 당시의 기대와 흥분도 잠시, 지금까지 무려 14년이 흘렀지만 아직도 게놈 프로젝트는 현재 진행형입니다. 이번 글에서는 게놈 프로젝트의 역사와 의의, 그리고 앞으로 유전체 연구 진행 방향에 대해서 논의해 보겠습니다.

사실 게놈 프로젝트를 말하는데 있어서, 염기서열 분석 기술의 발전을 떼놓고는 말하기가 어렵습니다. 하지만 각 세부적인 분석 기술 소개하는 것 만으로도 엄청난 분량이 되어버리므로, 이번 글에서는 간단히만 언급하겠습니다.

Frederick-Sanger-and-a-DN-009
1958년 노벨 화학상 수상자, Frederick Sanger (1918 – 2013). 그의 이름을 딴 생거 시퀀싱 방법은 아직까지도 염기 서열 분석 방법의 고전적 분석 표준(Gold standard)으로 인정받고 있습니다.

유전자의 염기 서열을 분석하는 가장 고전적인 방법은 생거 시퀀싱(Sanger sequencing)법 입니다. 영국의 생화학자였던 프레데릭 생거에 개발된 방법은 아직까지도 염기 서열 분석의 표준 방법(Gold standard)로 인정되고 있습니다. 그러나 기술의 발전으로 점점 더 빠르고 정확하게, 대용량의 유전 정보를 시퀀싱하는 것이 가능하게 되었고, 최근에는 이를 두고 차세대 염기 서열 분석법 (Next-generation sequencing, NGS) 라고 부르고 있습니다. 사실 우리는 이미 NGS의 시대에 살고 있기 때문에 엄밀한 의미에서 차세대 라는 말은 맞지 않습니다. 따라서 일부에서는 3세대 염기서열 분석 (Third generation sequencing, TGS) 또는 대용량 염기 서열 분석 (Massively parallel sequencing, MPS)라고 부르기도 합니다. 하지만, 편의상 널리 NGS로 통용되고 있습니다. 예전에는 염기 서열을 밝히는데 수년이 걸렸던 인간 게놈 프로젝트도, NGS 기술의 발달로 이 글을 작성하는 지금도 매우 저렴한 가격에 며칠이면 가능해졌으며, 소요 시간과 가격은 점점 감소하고 있습니다. 그렇다면 이렇게 저렴해진 유전체 서열 분석 기술이 의미하는 바는 무엇일까요?

costs_plummeting_x9001.jpg
2000년대 초, 백만불이었던 전체 유전체 분석 가격은 2017년 현재 이미 1,000불 아래로 떨어졌습니다. 즉, 개인이 100만원의 비용이면 본인의 모든 염기 서열 정보를 알 수 있는 시대에 도달했다는 의미가 됩니다.

사실 인간 게놈 프로젝트 이후에 진행된 프로젝트는 1000 게놈 프로젝트 (1000 Genome Project)가 있습니다. 1000 게놈 프로젝트는 1000명의 사람들의 전체 유전체를 분석해서 서로 차이를 보이는 염기 서열에 무엇이 있고, 이것이 개인마다 어떻게 다름으로써 개인별 특징을 나타내는지를 찾고자하는 첫 시도였다고 볼 수 있죠. 그리고 현재 알게된 사실은 사람들은 무수히 다른 단일 유전자 변이 (Single Nucleotide Variant, SNV)를 가지고 있으며, 이러한 SNV가 각기 어떻게 작용을 해서 서로 다른 형질을 보내는지에 연구의 포커스가 맞춰진 상태입니다. 인간이 가지고 있는 형질과 질병은 무수히 많습니다. 그리고 인간의 유전체도 SNV를 포함해서 매우 다양하며, 무궁 무진한 상호 작용과 조절을 받고 있습니다. 즉, 인간 게놈 프로젝트 초기에 기대했던 목적을 완전히 이수하려면 이러한 모든 유전체의 발현과 조절, 그리고 개개인의 유전 정보와의 관계를 밝히는 것이 필수라는 것이죠. 1000명에서 시작된 프로젝트는 이제 나라와 인종별로 10만명, 100만명 수준으로 확대되고 있으며, 앞서 언급한 유전체와 형질간의 관계를 확인하기 위한 데이터 수집 과정입니다.

즉 앞으로의 유전체 프로젝트와 연구 방향은 이러한 형질 또는 질병과 유전 정보 간의 관계를 파헤치는데 집중될 것입니다. 유전자 지도 완성 뿐 아니라, 유전자 지도 안의 각 위치가 어떠한 역할을 하고, 어떤 형질과 질병을 일으키는지 완벽하게 이해를 해야한 엄밀한 의미의 정밀 의료가 실현 가능하다는 것이죠.  유전체 정보는 매우 방대하고, 이를 분석하는데는 매우 많은 시간과 노력이 필요합니다. 따라서 뒤이어 발전하게 된 것이 이러한 유전 정보를 분석하는 생물 정보학 (Bioinformatics)입니다. 더 나아가 최근에는 이러한 유전 정보를 빅데이터로 간주하여, 인공지능 방법론을 활발하게 적용하고 있는 상황입니다. 정밀 의료를 논의하는데 있어, 유전학, 생물 정보학, 그리고 인공 지능 등을 함께 이해할 필요가 있는 대목입니다.

2-DNA-computer
유전 정보 데이터를 바탕으로 한 정밀 의료 를 실현하기 위해서는 생물 정보학과 같은 분석 도구가 필수적이며, 유전체 데이터가 매우 크기 때문에 이를 효과적으로 처리하기 위해 빅데이터와 인공 지능 기술 적용이 크게 각광 받고 있습니다.

궁극적으로 정밀 의료 시대에는 모든 개인이 자신의 유전 정보를 보유하게 될 것이고, 앞에서 알게된 지식을 바탕으로 사는 시대에 있게 될 것입니다. 그리고 지금은 연구자들이 그러한 지식의 틈을 메꿔가는 과정이라고 볼 수 있겠죠.

유전 정보 분석 및 생물 정보학, 그리고 빅 데이터와 인공지능. 각각의 세부적인 내용은 나중에 더 자세히 알아보도록 하고 이번 글은 여기서 마치겠습니다.

미래의료와 P4 Medicine

지난 학기에 치과대학 학생들의 유전학 시험 답안지를 채점할 일이 있었습니다. 그 중에 시험 문제로 미래의료와 P4 Medicine의 개념을 쓰라는 문제가 있었습니다. 시험을 채점하면서 학생들의 창의적인 오답에 (e.g. Premium, Precious, Portal, Perfect 등등) 채점이 재미있더군요. 사실 P4 Medicine은 미래 의료가 어떠한 방향으로 흘러갈지 개념적으로 잘 보여주는 이정표입니다. 그래서 이번 포스팅에서는 P4 Medicine이 무엇인지에 대해서 작성해보도록 하겠습니다.

Medicine will move from a reactive to a proactive discipline over the next decade—a discipline that is predictive, personalized, preventive and participatory (P4). P4 medicine will be fueled by systems approaches to disease, emerging technologies and analytical tools. There will be two major challenges to achieving P4 medicine—technical and societal barriers—and the societal barriers will prove the most challenging.

Predictive, personalized, preventive, participatory (P4) cancer medicine, Nature Reviews Clinical Oncology 8184-187

위의 글은 P4 Medicine에 관해 잘 정리된 논문의 초록 중 일부를 가져온 것입니다. 이를 이해하기 위해서는 과거의 의료 행위가 어떻게 이루어졌는지, 의료의 특성을 이해하는 것이 중요합니다. 과거의 의료는 전문가인 의사에 의해 이루어졌기 때문에, 상당히 정보 비대칭적이었으며 환자 개인도 전적으로 모든 것을 의사에게 맡길 수 밖에 없었습니다. 또한 의사는 본인의 경험을 바탕으로 환자를 치료했고, 대부분의 진료는 질병이 발생한 이후에 일어날 수 밖에 없었죠.

9780333930700
과거의 의료는 환자가 모든 것을 전문가인 의사에게 전적으로 의존할 수 밖에 없었고, 치료도 의사의 경험에 의해서 결정될 수 밖에 없었습니다.

그러나 이제는 질병의 병인 기전에 대한 이해와 기술, 과학이 발달하면서 의료의 전반적인 패러다임이 바뀌고 있는 것입니다. 이를 단적으로 나타내주는 것이 P4 Medicine이라고 이해하시면 됩니다. P4의 세부적인 내용들을 살펴보면, 그 의미가 명확하게 다가옵니다.

how-p4-medicine-helps-maximize-patient-engagement

  1. Preventive: 의료는 더 이상 질병의 증상이나 질환이 진행되기 시작했을 때 치료를 하는 개념이 아닙니다. 2, 3차 의료에서 질병 발생 자체를 사전에 예방하는 1차 의료로 그 포커스가 옮겨가고 있으며, 이를 잘 나타내주는 것이 Preventive Medicine 입니다. 가장 대표적인 것이 건강인을 대상으로 비만을 예방하기 위한 운동을 하는 것이며, 비슷한 방식으로 여러 알려진 질병 위험 인자들을 사전에 차단하는 것입니다.
  2. Predictive: Predictive Medicine의 많은 부분은 과학과 의료의 발달에 기인합니다. 질병의 진행, 치료 반응, 예후 등 많은 부분을 환자 개개인의 의료 정보를 바탕으로 예측이 가능한 시대로 가고 있습니다. 특히 여기서 가장 중요한 역할을 하는 것이 개인의 유전 정보가 되겠습니다. 아직 많은 부분, 연구가 필요하지만 미래 의료의 방향은 Predictive Medicine의 실현을 향해 가고 있습니다.
  3. Personalized: Precision, Individualized, Tailored Medicine과 일맥 상통하는 개념입니다. 개개인의 특성에 맞는 최적의 의료에 포커스를 두고 있습니다. 대표적으로 약물에 대한 반응이나 용량 처방 결정, 면역 수용체에 따라 다른 종류의 항암제 사용 같은 예가 있습니다.
  4. Participatory: 더 이상 의료는 의사에 의해 한쪽 방향 (unidirectional)으로 일어나는 행위가 아닙니다.  이제는 환자와 의사, 더 나아가 커뮤니티 내에서 서로 상호 작용하면서 일어나는 행위로 변화하고 있습니다. 특히 헬스케어 기술이 발달하면서, 모든 개인들의 스스로의 건강 정보를 1차적으로 관리하고 참여하게 될 것이며, 여기서 생산된 데이터에 기반한 선순환의 고리가 더더욱 의료를 발달시킬 것입니다.

종합하면, 미래의 의료 패러다임은 의료 및 과학 기술의 발전에 기반하여, 질병 발생을 선제적으로 예방하고, 위험도를 예측하며, 질병이 발생된다하더라도 개개인에 맞는 최적의 치료로 시행되는 것으로 바뀔 것이며, 이러한 모든 과정에 개인이 직접 참여함으로써 일어나게 될 것입니다. 이것이 더 이상 의료는 의사라는 전문가 집단이 아니라 하더라도, 모든 개인이 관심을 가져야 하는 이유가 됩니다.

약물 유전학은 왜 정밀의료에서 중요한가?

앞선 글 보기 -> 블로그를 시작하며..

앞선 글에서 소개했던 오바마 대통령이 발표한 PMI (Precision Medicine Initiative)의 짧은 한 단락에도 약물 유전학(Pharmacogenetics)이 정밀 의료에서 왜 중요한지가 분명하게 드러납니다.

“환자의 유전적 정보를 이용하여, 개인에게 맞춘 최적의 약물 치료를 시행한다.”

disease_diagnosis

개개인의 사람들은 외모, 행동, 가치관이 다른 것 처럼 약물에 대한 반응이 모두 다릅니다. 동일한 약을 같은 용량으로 처방하여도, 어떤 사람에게는 처방한 용량이 과용량이어서 약물 부작용이 발생하기도 하고, 어떤 사람에게는 전혀 효과가 없기도 하죠. 약물 유전체학은 유전학을 토대로 이러한 약물 반응을 예측하는데 그 목표가 있습니다. 따라서 약물 유전체학은 정밀 의료의 실현을 위한 하나의 중요한 축을 담당하고 있다고 볼 수 있겠습니다.

더 세부적으로 살펴보면, 약물 유전체학의 연구 목적은 다음과 같습니다.

  1. 약물 독성 부작용의 예측 및 예방 (Prevention of Adverse drug event): 약은 어떤 한계 용량 (최소 독성 용량, minimal toxic concentration)을 넘어서는 순간 우리 몸에 독성 작용을 일으킬 수 있습니다. 안전한 약물 사용을 위해서 유전 정보를 토대로 부작용을 예측하고 예방하는 데 그 첫번째 목표가 있습니다.
  2. 약물의 유효성 및 최적의 처방 용량 수립 (Drug efficacy and optimization of dose): 개인별로 같은 양의 약을 복용하더라도 체내 농도는 모두 다르게 됩니다. 경우에 따라서 어떤 사람은 약효가 나타나기 위한 최소 농도(minimal therapeutic concentration)에 도달하지 못하는 경우도 있고, 유전적 원인에 의해서 약물이 전혀 듣지 않는 경우도 발생합니다.
  3. 약동학 및 약력학 예측: 신약 개발 및 임상 시험에 있어서 약동학 및 약력학은 매우 중요합니다. 앞서 언급한 두가지와 크게 다르지 않지만, 약물 유전체학은 새로운 약을 개발하고 약물의 유효성과 안전성을 평가하는 임상 시험에 있어서도 고려되는 매우 중요한 분야라고 할 수 있겠습니다.

약물 유전학은 크게 위와 같은 공통된 연구 목적을 가지고, 다양한 약물과 유전자 간의 관계를 밝혀가고 있는 학문입니다. 마지막으로, 오늘 글은 이러한 학문적 토대에서 실제로 약물 유전체학을 바탕으로 정밀 의료를 실현하기 위해 노력하고 있는 CPIC을 소개하면서 글을 마치고자 합니다.

cpic_00000.jpg
CPIC 홈페이지

CPIC (Clinical Pharmacogenetics Implementations Consortium)은 약물유전학에서 밝혀진 연구 성과를 실제로 임상 현장에 적용하기 위한 연구자들의 국제 콘소시움입니다. CPIC에서는 실제로 임상 근거가 명확한 약물 유전자와 약물 쌍을 선정하여, 해당 약물 처방 시 유전자 검사 및 이를 바탕으로한 권장 처방 용량에 대한 가이드 라인을 제시하고 있습니다.

CPIC 가이드라인 자세히 보기 -> CPIC Guideline: 유전체 정보를 활용한 약물 처방에 관한 임상 근거 지침

cpic
CPIC에서는 약물과 관련 유전자 쌍에 대한 연구를 바탕으로 임상적 근거 수준을 분류하여, 실제 임상 현장에서 약을 처방할 때 어떻게 해야하는 지에 대한 가이드라인을 제시하고 있습니다.

현재까지 약물과 관련 유전자 간의 관계가 명확히 밝혀져 임상적 유용성이 입증된 약물-유전자 쌍은 많지 않습니다. 앞으로도 더 많은 연구가 필요한 이유입니다. 그러나 지금도 많은 연구자들은 정밀 의료의 실현을 위해 노력하고 있으니, 언젠가는 다음과 같은 날도 올 것으로 생각됩니다.

B46DyypCUAAOBFb

진단검사의학과 소개

저는 올해 2월에 레지던트 수료를 마치고, 진단검사의학과 전문의 자격을 취득했습니다. 진단검사의학은 일반인들에게는 매우 생소하고, 심지어 의과대학 학생들도 정확히 무슨 일을 하는지 잘 알지 못하는 과이기도 합니다. 그래서 이번 글을 진단검사의학과가 어떠한 일을 하는 과이고, 앞으로 정밀 의료의 시대에 어떠한 역할을 할 수 있을지에 대해서 글을 써보고자 합니다.

사실 진단검사의학과는 과거에는 임상병리과라고 알려져있었습니다. 하지만 임상병리과라는 이름은 저조차도 참 낯설게 느껴집니다. 가장 대표적인 진단검사의학과(진검) 의사의 역할은 크게 다음과 같이 4가지가 있습니다.

  1. 검사실 운영 및 관리
  2. 임상 서비스
  3. 학생 교육 및 실습
  4. 임상 연구
Blood samples are on a laboratory form for Finding out the blood values
검사실에서 가장 많이 처리하는 혈액 검체는 검사 목적과 방법에 따라 서로 다른 튜브에 채혈하게 됩니다.

이 중에서도 가장 메인이 되는 일은 ‘검사실 운영 및 관리‘입니다. 대부분의 임상과 의사들이 병원에서 환자를 간호사와 마주 하게 된다면, 진검 의사는 환자의 ‘검체’를 임상병리사(Medical technician)들과 다루게 됩니다. 혈액를 포함해서, 소변, 뇌척수액, 눈물, 정액 등 모든 종류의 환자 유래 검체들이 다양한 방법으로 검사가 진행되고, 그 결과를 판독하고 그 임상적 의미를 다른 과의 많은 의사들에게 알려주게 됩니다.

advia_automation_solutions-00112044-10
최근에는 검사실의 많은 부분이 자동화 기기로 구성되어 짧은 시간에 많은 수의 검체 검사가 가능하게 되었습니다. 그러나 병원에서 시행하는 검사들의 많은 부분은 여전히 수기로 시행되고 있습니다.

최근에는 자동화가 많이 진행되어서 자동화 기기를 통해 대부분의 검사가 진행이 되지만, 작은 하나의 검사 결과 조차도 환자의 질환을 진단하는데 있어서 매우 큰 차이를 만들 수 있기 때문에, 검사 결과에 문제가 생겼을 때 이를 적절히 인지하고, 임상적 상황에 맞게 판독하고, 관리 및 대처하여야 합니다. 그렇기 때문에 단순히 자동화 기기를 다룰 수 있는 기술자들을 관리 감독 및 교육 하는 것 뿐 아니라, 전반적인 의학 지식을 지닌 전문가가 필요하기 때문에 병원 내 검사실 운영을 위해서는 의학 지식을 갖춘 의사가 필요하게 되며, 이러한 역할을 하는 것이 진단검사의학과 의사입니다.

실제로 검사실이 잘 운영되는 경우, 의사는 검사 결과를 믿고 환자의 상태를 평가할 수 있습니다. 그러나 만약 검사실 운영이 엉망이 된다면, 의사는 환자의 검사 결과를 보고 환자 상태를 평가하는데 혼란스러울 수 밖에 없습니다. 이렇듯, 진단검사의학과 의사는 묵묵히 자신의 일을 잘하고 있으면 티가 나지 않으며 오히려 문제가 생겨야만 그 존재 가치를 인식하게 됩니다. 임상과들 조차도 진단검사의학에 대한 인식이 크게 없던 것은 반대로 그만큼 진검의사들이 묵묵히 맡은 바 일을 해왔기 때문이 아닐까 합니다.

마지막으로 다음은 제가 생각하는 진단검사의학과의 특징 및 전망입니다.

  1. 병원에서 시행하는 모든 검사법에 대해 이해하고, 결과를 해석하고 운영관리해야 하기 때문에 의학 전반에 관한 상대적으로 얕지만 폭넓은 지식을 요구한다.
  2. 전담 입원 환자가 없어 환자와 대면하는 일이 제한적이다. 일부 혈액은행 및 검체 검사, 임상 유전 클리닉 상담 등을 통해 환자를 마주하게 되기도 합니다. 그러나 입원 환자가 없어, 병원에서 밤을 새며 야간 당직을 하는 경우는 많지 않습니다.
  3. 의사로서 경제적 수입이 상대적으로 떨어지지만, 반대로 삶의 질은 매우 좋은 편이다.
  4. 검사실에서 수많은 검체와 검사 결과들을 쉽게 얻을 수 있어, 다양한 연구를 용이하게 할 수 있는 좋은 환경이 갖고 있다.
  5. * 검사실은 의료 빅데이터의 보고입니다.* 최근, 정밀 의료의 흐름에 따라 빅데이터를 통한 인공지능 활용이 활발한데, 이를 위해서는 데이터의 특성과 각 변수를 정확히 파악하는 것이 매우 중요합니다. 진단검사의학과 의사는 검사실 데이터들의 특성을 잘 파악하고 있는 전문가 라는 점에서 매우 큰 장점을 지닌다고 할 수 있습니다.

사실 진단검사의학과에 대해 짧은 하나의 글로 소개하기에는 너무 부족하기 때문에, 이번 글을 여기서 마치도록 하겠습니다. 마지막으로 학회에서 잘 만든 유튜브 영상이 있어 함께 첨부합니다.

블로그를 시작하며..

2015년 백악관에서 오바마 대통령은 Precision Medicine Initiative (PMI)를 발표합니다.

wh_precision_medicine_header2

THE PRECISION MEDICINE INITIATIVE

“Doctors have always recognized that every patient is unique, and doctors have always tried to tailor their treatments as best they can to individuals. You can match a blood transfusion to a blood type — that was an important discovery. What if matching a cancer cure to our genetic code was just as easy, just as standard? What if figuring out the right dose of medicine was as simple as taking our temperature?”
– President Obama, January 30, 2015

의료의 패러다임은 계속 변화했지만, PMI 발표 후 앞으로 의료가 향할 방향은 명확해졌습니다. 환자의 개개인의 특성에 맞는 개별적인 최상의 진료 실현. 이를 실현하기 위한 첫번째 시도로 개인의 유전형에 따른 맞춤 치료와 맞춤 약물 처방이 제안되었습니다.

정밀의료는 현재진행형입니다.

아직까지는 정밀 의료의 실현을 위해서는 넘어야할 산들이 많고, 선행되어야 할 연구들도 많습니다.

본 블로그에서는 이러한 정밀 의료를 주제로 하여, 현재 의료 및 연구 현장에서 진행 중인 여러 가지 시도들과 관련 지식들을 모으고, 소개하고자 합니다.