[유전학 중요개념 정리] 오믹스 (Omics) 와 단일 세포 시퀀싱 (Single cell sequencing)

현재 있는 미국의 연구실은 다양한 Omics 데이터를 종합적으로 분석하여, 소아 신증후군의 정밀 의료 실현을 위한 연구를 진행하고 있습니다. 아래의 관련 포스팅과 같이, 다양한 유전체 연구 결과 대부분의 복합질환 질병 발생은 유전체의 유전자 발현을 조절하는 부분, 그리고 non-coding 영역에 존재함을 확인하게 되었습니다. 이에 연구자들은 이러한 부분이 어떠한 기작을 통해서, 질병을 발생을 시키는지에 대한 연구를 진행하고 있으며, 이러한 연구 방법론의 하나로 다양한 오믹스 관련 생명 정보들을 통합적으로 분석하고 있습니다. 오늘은 (최근에 미국의 PI와 관련 리뷰 논문을 준비하게 되어,) 오믹스 관련 분석 중에서 중요한 단일 세포 시퀀싱 (Single Cell Sequencing) 기술에 대해서 정리하는 포스팅을 남기고자 합니다.

[관련 포스팅 보기]

Omics의 개념

단일 세포 시퀀싱을 언급하기에 앞서, Omics 의 개념에 대해서 간단히 정리하고자 합니다. -ome은 집합체 (집단, 묶음)를 의미하는 접미어로 Genome (유전자의 집합체 = 유전체), Epigenome (후성 유전인자의 집합체 = 후성유전체), Transcriptome (전사인자의 집합체 = 전사체), Proteome (단백질의 집합체 = 단백체) 등 일반적으로 생물 유래의 집합체를 모두 총칭합니다. 아래 그림과 같이, 이외에도 Metabolome (대사체), Microbiome (미생물군유전체) 등을 포함하고 있습니다. 인간의 유전자 서열 (Genome)은 고정되어 있지만, 조직과 세포 종류에 따라서 유전자의 발현이 달라지고, 그에 따라 단백질의 양과 기능도 달라지게 됩니다. 즉, 유전자 서열을 해독하는 것 이상으로 훨씬 더 복잡한 유전자의 조절 기작을 이해하는 것이 질병 발생 메커니즘을 밝혀, 치료에 적용하는데 매우 중요하게 됩니다. 따라서, 유전자 서열 만으로는 설명이 되지 않는 많은 부분들은 그 보다 더 높은 차원에 존재하는 다양한 Omics들을 분석함으로써 이해하고자 하는 것이 Omics의 목표입니다.

단일 세포 분석이 왜 중요한가? Bulk vs. Single cell

우리 몸의 모든 세포는 체세포 변이 (Somatic mutation)를 제외하고 기본적으로 동일한 유전자의 염기 서열 (Germline)을 공유하고 있습니다. 그러나 조직과 기관에 따라 다양한 세포군이 서로 다른 기능을 수행하면서 생명현상을 이어나가고 있습니다. 따라서 세포의 종류에 따라 세포 특이적인 유전자의 발현 패턴의 차이를 확인하는 것은 매우 중요하게 됩니다. 그러나 전통적인 Bulk RNA-seq (전사체 시퀀싱)의 경우는 모든 세포들을 하나로 pooling하여 유전자의 발현량의 평균 값만을 구할 수 있게 됩니다. 그에 반해 단일 세포 시퀀싱 (Single cell RNA-seq)은 개별 세포를 세포의 종류에 따라 분류하고, 개별 세포의 발현량을 구할 수 있기 때문에 더 정확하게 개별 세포의 유전자 발현량의 차이를 알 수 있다는 장점이 있습니다. 특히나 종양 세포와 같은 경우에는 이질성 (Tumor heterogeneity)이 매우 크기 때문에, 집단의 유전자 발현이 개별 세포를 모두 대표하기 어려운 경우가 많습니다. 이러한 장점으로 인해, 최근에는 단일 세포의 다양한 omics data를 profiling하는 것이 점점 폭넓게 연구되고 있습니다.

[Bulk vs. Single cell RNA 시퀀싱의 비교] 기술적 발전으로 인해, 개별 세포의 유전자 발현 패턴을 더 정확하게 검출할 수 있게 되었습니다.

어떻게 단일 세포로 분리하는가?

[세포를 단일 세포로 분류하는 다양한 방법들]

위 그림은 세포들을 개별 세포로 분리하는 다양한 기술들을 보여주고 있습니다. 최근 널리 쓰이는 가장 대표적인 기술은 세포들을 개별 미세 유체 방울로 분리하는 Microfluidic droplet 기반의 기술 (Chromium 10X)과 비슷하게 하나의 plate에서 미세하게 세포를 흘려 분리하는 Microfluidic plate 기반의 기술 (Fluidigm C1)이 있습니다. Fluidigm C1 기술은 구분할 수 있는 세포의 수는 적지만 더 폭넓고 많은 전사체 시퀀싱 결과를 얻을 수 있다는 장점이 있고, Chromium 기술은 그에 반해 더 많은 수의 세포를 얻을 수 있지만, 얻을 수 있는 시퀀싱 리드의 정보는 제한적이라는 차이가 있습니다. 아래 표와 같이 연구자들은 실험의 목적에 따라서 각 방법의 장단점을 파악하고 사용하는 것이 좋겠습니다.

다음 포스팅에서는 이러한 단일 세포 분석 기술을 바탕으로 Epigenome과 Transcriptome을 분석하는데 중요한 개념인 scATAC-seq에 대해서 정리하도록 하겠습니다.

[ References ]

Murphy, Rachel. “An Integrative Approach to Assessing Diet–Cancer Relationships.” Metabolites 10.4 (2020): 123.

Kolodziejczyk, Aleksandra A., et al. “The technology and biology of single-cell RNA sequencing.” Molecular cell 58.4 (2015): 610-620.

Kashima, Yukie, et al. “Single-cell sequencing techniques from individual to multiomics analyses.” Experimental & Molecular Medicine 52.9 (2020): 1419-1427.

[논문소개] 면역억제제 Tacrolimus의 약물 유전체 연구

작년부터 미국에 오기 전까지 부랴 부랴 동시에 4개의 논문을 쓰고 있었는데, 그중 2개 논문의 온라인 출판이 완료 되었습니다. 그래서 앞의 논문을 소개한 김에, 함께 출판된 다른 약물 유전체 연구도 소개를 해볼까 합니다. 이번 연구의 프로젝트도 약리학 교실에 처음 박사 과정으로 들어오면서 부터 시작했던 프로젝트인데, 장기 이식 후의 면역 억제제로 널리 사용하는 Tacrolimus와 관련된 약물 유전체 연구입니다. 개인적으로는 처음으로 본격적으로 NGS 패널과 Microarray인 한국인칩을 분석하면서 진행했던 프로젝트입니다.

[관련 논문 보기]

https://journals.lww.com/transplantjournal/Abstract/9000/Unraveling_the_Genomic_Architecture_of_the_CYP3A.95339.aspx

논문의 제목은 “Unraveling the Genomic Architecture of the CYP3A Locus and ADME Genes for Personalized Tacrolimus Dosing“으로, 장기 이식 수술 후 면역 억제 반응을 위해 사용하는 Tacrolimus의 약물 대사에 관여하는 약물 유전자의 변이들과 개인간의 약물 농도의 변화를 살펴봄으로써, 유전자의 기능에 따라 환자 개인별 최적 처방 용량을 guide하기 위해 진행했던 연구입니다.

[관련 포스팅 보기]

사실 본 연구 주제는 그동안 많은 연구자들이 달려들어서 진행해왔고, CYP3A5의 변이 (rs776746)가 Tacrolimus 대사능과 관련이 있다는 것이 매우 잘 알려져 왔으나, 해당 변이로는 개인간 편차의 50% 정도 밖에 설명할 수가 없어서, 추가적으로 다른 유전자를 발굴하는 것이 많은 연구자들이 목표였습니다. 이번 연구에서는 약물 유전자 전체를 스크리닝할 수 있는 약물 유전체 NGS 패널 (PGx panel) 과 한국인 특이 변이를 탐색할 수 있는 한국인칩 (Korean Chip)를 이용하여, 해당 문제를 풀려고 하였습니다.

연구 결과, 역시 기존에 알려져 있던 CYP3A5의 rs776746 변이 가 제일 중요한 인자로 작용함을 확인했고, 개인별로 드물게 존재하는 CYP3A5, CYP3A4의 희귀 변이 (rare variant)를 이용하면, 추가적으로 rs776746 의 변이가 설명하지 못했던 개인간 편차를 더 잘 설명할 수 있음을 확인하였습니다. 이 결과는 개별 맞춤 약물 처방을 하는데, 개인별로 드물게 존재하는 희귀 변이 (rare variant)를 고려하는 것이 매우 중요함을 시사합니다.

특히, 연구의 분석을 위해서, 서울대 이승근 교수님께서 개발하신 SKAT이라는 분석 방법을 이용하였는데, 이 tool을 이용하여 최초로 CYP1A1 유전자의 희귀 변이들과 Tacrolimus 개인간 편차와의 연관성을 확인하였습니다. 다만, 이번 연구를 통해 다시 한번 약물의 대사는 매우 복잡하고 다양한 인자들이 confounder로 작용하기 때문에 개별 유전형 외에도 유전자 발현에 영향을 미치는 다양한 환경적 변수들을 고려해야함을 깨달을 수 있었습니다. 본 연구 결과가 면역 억제제 Tacrolimus를 투여 받는 환자들이 개별 약물 유전형에 따라서, 부작용이 발생하지 않는 최적의 처방 용량을 결정하는데 도움이 되고, 이를 통해 정밀 의료 (Precision Medicine) 가 실현될 수 있기를 기대합니다.

[관련 Commentary 보기]

https://journals.lww.com/transplantjournal/Citation/9000/COMMENTARY__Unraveling_the_Genomic_Architecture_of.95395.aspx

Genomics of Drug Sensitivity in Cancer (GDSC): 항암제에 대한 암세포주 반응 Database

종양학 (Oncology)에서의 정밀 의료암세포의 돌연변이 프로필 (Mutational Profile)에 대한 정보를 얻고, 이를 바탕으로 항암제 또는 기타 약물의 효과를 예측해서, 환자에게 최적의 치료 효과를 낼 수 있는 치료를 하는 것이 목적입니다. 하지만, 종양 세포가 가지고 있는 복잡하고 다양한 돌연변이로 인해서, 특정 바이오 마커를 이용하여 실제 임상 현장에서 약물의 치료 효과를 예측하고 활용하는데에는 많은 한계가 존재합니다. 특히, 이를 위해서는 실제로 약물의 효과를 예측하는 효과적인 바이오마커가 발굴되어야 하는데, 이러한 작업은 다양한 변수들로 인해서 쉽지가 않습니다. 오늘 포스팅할 내용은 이러한 노력의 연장선에서,  약  1000여개의 확립된 인간 암세포주들에 대해 500여개의 항암제로 처리하여 각각의 세포를 죽일 수 있는 농도 (IC50 values, 50%의 세포가 죽는 농도)를 스크리닝하고, 각각의 세포주가 가지고 있는 돌연변이 프로필에 대한 정보를 제공하고 있는 Database인 Genomics of Drug Sensitivity in Cancer (https://www.cancerrxgene.org/)에 대해서 소개하고자 합니다. 이러한 대규모 스크리닝과 통계적 접근을 통해서, 어떠한 돌연변이가 어떠한 약물에 효과가 있는지 또는 저항성을 보이는지에 대한 분석이 가능하고, 궁극적으로 약물 효과를 예측하는 바이오 마커를 찾아내는게 가능해지게 됩니다.

title

overview
GDSC Website (https://www.cancerrxgene.org/)에서는 다양한 암종의 Pathway를 타겟으로 하는 약물에 대한 암세포주의 스크리닝 결과를 제공하고 있습니다.

위의 사이트에 들어가면, 다양한 세포주 정보, 돌연변이 정보, 그리고 약물 스크리닝 결과를 항목별로 조회할 수 있으면, 해당 데이터도 다운로드가 가능합니다.

kras

위의 그림은 KRAS 돌연변이를 가지고 있는 세포주들에 대해서 통계적으로 유의미하게 효과가 있거나, 저항성을 나타내는 약물에 대한 Volcano plot을 보여주고 있습니다. 이러한 세포주 결과를 통해서, KRAS 돌연변이 암세포에 대해서는 효과를 나타내는 약물 (위 그림의 초록색)을 타겟 치료의 후보로 생각해 볼 수 있습니다.

scatter

또한 비슷하게, 개별 약물에 대해서 조회를 하면, 세포주 중에서 해당 돌연변이를 가지고 있는 세포주와 가지고 있지 않은 세포주의 반응을 통계적으로 분석하여 Scatter Plot으로 제공해주고 있기도 합니다. 위의 그림은 Ibrutinib에 대해서 KRAS 돌연변이를 가지고 있는 세포들이 더 높은 IC50를 가져서, 저항성이 높다는 것을 보여주고 있습니다.

현재 위와 같은 시도는 인간 유래의 확립된 세포주 (Human Cancer Cell Lines)들에 대해서 스크리닝이 진행되고 있습니다.  추후에는 궁극적으로는 환자 개개인의 암 세포 또는 종양 오가노이드 (Organoid)를 이용하여 비슷한 접근을 한 후에, 치료 효과를 판정하고, 이를 바탕으로 치료제를 선택하는 날이 올 것으로 기대되고 있습니다. 다만, 위의 방법은 약물에 의해 세포를 직접적으로 죽이는 효과이기 때문에 면역항암제와 같이 환자 체내에서 일어나는 면역 반응을 이용하는 치료제에 대해서는 효과를 보기 어렵다는 단점이 있습니다. 위의 GDSC 프로젝트에 대해서자세히 나와있는 논문들을 Reference에 남기며, 이번 포스팅은 마무리하도록 하겠습니다.

 

관련 포스팅 보기>

DNA 손상 복구 기전과 타겟 치료 항암제

[실험실 노트] Organoid의 기본 개념과 활용

면역 항암제, Immune checkpoint inhibitor의 원리 및 종류

동반 진단, Companion diagnostics란 무엇인가?

 


[References]

Yang, Wanjuan, et al. “Genomics of Drug Sensitivity in Cancer (GDSC): a resource for therapeutic biomarker discovery in cancer cells.” Nucleic acids research 41.D1 (2012): D955-D961.

Garnett, Mathew J., et al. “Systematic identification of genomic markers of drug sensitivity in cancer cells.” Nature 483.7391 (2012): 570-575.

Iorio, Francesco, et al. “A landscape of pharmacogenomic interactions in cancer.” Cell 166.3 (2016): 740-754.

블로그 포스팅 작성 과정과 작성 이유

가끔 지인들과의 모임에 가면, 제 블로그를 잘 봤다면서 먼저 얘기를 꺼내주는 경우가 있습니다.   그러면서 블로그 글과 관련하여 여러가지 내용들을 물어봐주시곤 하는데, 사실 블로그를 운영하는 것은 어떠한 경제적 이득도 없거니와,  생각보다 시간도 많이 들고, 어떤 때는 귀찮은 일이기도 합니다. 그래도 간간히 글을 봐주시는 숨은 구독자를 위해서, 오늘은 블로그의 글 작성 과정과 작성 이유에 대한 글을 써보겠습니다.

Blog icons design

 

0. 블로그 포스팅의 작성 과정

10632.extract

보통 1개의 토픽에 대해서 포스팅을 올리기 위해서는 적어도 관련 논문 3~4개를 읽고 공부하여야 합니다. 이를 저만의 방식으로 이해하고 소화해서 가장 쉽고 빠르게 이해할 수 있도록 하는 집약적인 이미지를 찾습니다. 그래서 일반적으로는, 수일 간의 공부 및 정보 습득 과정, 반나절 정도의 글쓰기 과정이 소요됩니다. 이미 작성한 글들에 대해서는 퇴고를 하려고 노력하고 있습니다만, 아무래도 쉽지는 않습니다.

블로그 포스팅 작성에서 중점적으로 두는 것은 정보가 난무하는 인터넷의 홍수 속에서 아무 글이나 그대로 긁어서 블로그 내용을 늘리는데, 급급하기 보다는 하나의 글을 쓰더라도 최대한 집약적이고 간결하면서도, 핵심을 담은 포스팅을 작성하려고 노력합니다.

 

1. 블로그에 글을 올리는 이유

블로그를 시작하게 된 계기는 여러 가지가 있지만, 가장 첫번째 이유는 개인적으로 이를 계기로 꾸준히 공부를 하기 위해서 였습니다. 저에게 이 블로그는 대학원 시절의 연구 내용들의 기록임과 동시에, 연구자로서의 내공을 쌓고 꾸준함을 유지하는 연습장이기도 합니다. 비록 아직 갈길이 멀지만, 지난 2년정도의 시간동안 약 100개의 포스팅을 올렸는데, 처음과 비교하면 지금은 확실히 지식의 폭이 넓어진 것은 느끼곤 합니다.

사실 정밀 의료 (precision medicine)라는 토픽은 다양한 학문들이 융합되어 새롭게 출현하는 분야이기 때문에,  새로운 지식과 학문들에 대한 끊임없는 공부가 필요 합니다. 하지만, 자칭 전문가라고 부르는 사람들도 과거의 지식에 머물러 있거나, 제한적인 분야에 대해서만 알고 있는 경우가 많습니다. 더불어, 정밀 의료의 가장 핵심을 이루는 의료와 바이오 분야는 정보의 비대칭성이 매우 큰 분야이기도 합니다. 이 때문에 일반인들은 자칭 사이비 전문가나 유사 과학자 (라고 쓰고 사기꾼이라 읽는다.) 등등의 언론 플레이에 현혹되어 휘둘리기 쉽기도 합니다.

 

 

앞으로의 시대에는 바이오 기술의 발달과 의료의 패러다임 변화에 따라, 다양한 회사가 세워지고 돈이 몰리면서, 이러한 일들이 훨씬 빈번하게 발생할 것입니다. 의료와 연관하여 발생하는 문제들은 최종적으로 생명과 직결된 피해를 일으킬 수 있습니다. 전문 분야 임에도 일반인들이 기본 배경 지식이 필요한 이유입니다. 다만 아직까지는 높은 진입 장벽과 제한된 교육, 정보로 인해, 바이오와 의료, 그리고 정밀 의료라는 개념은 일반인들에게 생소하기만 합니다. 블로그에 다양한 연구 주제와 정보를 업로드하는 것은 이러한 정보의 비댕칭성을 조금은 해소함과 동시에, 소개의 목적도 있습니다.

영국의 정밀 의료 사례: UK biobank, 100,000 Genome Project, NHS England 까지

정밀 의료 (Precision Medicine)와 관련하여 최근에 매우 감명을 받은 영국(UK)의 사례를 보면서, 전반적인 연구 동향 및 정밀 의료가 실제 의료 시장 변화에 미치는 동향에 관한 글을 남겨봅니다. 영국은 확실히 사회 복지 체계가 잘 잡혀서 의료 분야에서도 많은 변화를 주도하고 있으며, 체계도 매우 구체적이고 잘 잡혀있습니다.

 

UK BioBank

uk biobank

이러한 특성은 가장 선도적으로 영국인들의 유전체 정보를 구축하는 UK Biobank project에도 잘 나타나있으며, UK Biobank를 활용하여 나온 무수한 많은 연구와 논문들, 그리고 이를 쫓는 많은 개별 국가들의 정책들이 이를 입증합니다. 우리 나라에서도 한국인 유전체 은행을 구축해야 한다는 목소리도 동일한 선상에 위치합니다.

UK Biobank국가 주도 단위의 유전체 은행으로 다양한 질환과 형질을 대표하는 사람들의 검체를 수집하고, 임상 정보를 정리하고, 수집한 검체를 통해서 유전체 정보를 데이터 베이스로 구축하고 있습니다. 국가 주도 단위로 매우 큰 인구 집단을 대변하기 때문에 그 파급력은 매우 크다고 할 수 있습니다.

 

100,000 Genomes Project

genomics england

UK Biobank와 비슷하게 진행되고 있는 다른 프로젝트는 우리 나라의 보건 복지부에 해당하는 영국의 Department of Health & Social Care. 산하의 Genomics England에서 진행하고 있는 100,000 Genomes Project 입니다. 희귀질환과 암 질환특정 질환 환자들 10만명의 게놈을 전장 유전체 시퀀싱(Whole Genome Sequencing)하여, 전체 유전체 정보를 수집하는 것을 목표로 하는 프로젝트로, 연구자의 입장에서도 매우 파급력이 크지만, 다양한 질환의 환자들과 일반인들에게도 미칠 파급력이 엄청 날 것으로 예상됩니다. 해당 프로젝트는 2018년 12월 10만번째 참여자의 유전체를 시퀀싱하면서 목표에 도달했고, 이 결과를 바탕으로 앞으로 어떠한 결과가 나올지 매우 기대가 됩니다.

The UK has sequenced 100,000 whole genomes in the NHS

 

NHS England

nhs england_00000

마지막으로 위와 같은 유전체 프로젝트의 결과를 활용하고, 실제로 의료를 변화 시키기 위해 장기적인 관점에서 영국은 NHS England를 출범시켜서 정밀 의료를 바탕으로 한 10년 이후의 의료 서비스에 대해서 계획하고 있습니다. 재미있는 점은 많은 일반 국민들이 실제로 관심을 가지고, 직접 프로젝트에 참여하며, 이를 통해서 공동체 전체의 발전을 이끌어내는 각각의 톱니바퀴가 잘 물려서 돌아가고 있다는 점입니다.

특히, 이러한 큰 테마 안에 속해 있는 각각의 세부 과제들의 짜임새와 디테일들을 보면, 의료인으로서 소름끼칠 정도로 정교하고 놀랍습니다. 그 안에서 얼마나 많은 전문가들이 노력하여 상의하고 정책을 수립했을지, 하나의 문서를 작성하는데도 얼마나 많은 고민이 있었을지가 여실히 느껴집니다.

우리나라의 보건 복지부에서 의료 정책을 기획하시는 분들도 이러한 점을 꼭 염두해두고 장기적인 계획은 수립했으면 하는 바람으로 글을 마칩니다.

 

임상 빅데이터와 딥러닝(Deep Learning)을 활용한 연구와 고려사항

2년전부터 임상 빅데이터딥러닝 (Deep Learning) 기술을 접목하여 준비했던 논문이 있는데, 최근에 미국 심장학회 (American Heart Association)에서 발간하는 Stroke 지에 게제 승인이 나서, 관련된 내용을 정리하는 포스팅을 남길까 합니다.

의료 정보 빅데이터에 기계 학습 (Machine Learning) 기술을 활용하여 발표 하였던 저희의 첫번째 논문에서는 800명 정도의 환자 데이터를 이용하였는데, 당시 논문은 DIC 진단에 대해 기존 방법에 비해 진단 정확도를 높일 수는 있었지만, 딥러닝 기술이 다른 머신 러닝 기법 (Logistic regression, SVM, Random Forest, ANN)과 비교해서 우수한 성능을 보이지 못했습니다. 해당 연구를 통해, 다음과 같은 한계점을 느꼈습니다.

  1. 머신 러닝 기법이 통계적 기법보다 더 강한 성능을 보이기 위해서는 충분한 수와 양질의 데이터가 필요하다.
  2. 그러나 임상 메타데이터는 수는 많지만 매우 지저분 (messy)하다. (전처리 과정에 매우 큰 노력이 들어가야 한다.)
  3. 딥러닝의 강점을 충분히 활용하기 위해서는 매우 큰 양질의 코호트 데이터가 필요하다.

관련 포스팅 및 논문 보기>

의학 연구를 위한 기계학습 1: Supervised learning의 연구 설계 구조

의료 정보 빅데이터를 활용한 연구와 고려 사항

첫번째 머신 러닝 논문>> https://www.ncbi.nlm.nih.gov/pubmed/29718941

위와 같은 경험을 토대로 양질의 코호트를 찾던 중, 매우 운이 좋게도 신경과에 있는 친구와 의견을 나눌 수 있었고, 다행히 10년 정도 매우 잘 정리된 뇌졸중 환자 코호트를 활용할 수 있었습니다. 아래의 이를 토대로, 이번에 발표한 논문의 내용입니다.

 

Machine Learning–Based Model for Prediction of Outcomes in Acute Stroke

 

I. 논문의 배경 및 내용 소개

뇌졸중 (Stroke)은 고혈압, 흡연, 비만, 고콜레스테롤 등의 다양한 질환에 의해서, 뇌혈관의 혈류가 원활하지 않게 되면서 뇌세포의 사멸이 발생하는 급성 질환입니다. 다만, 빠른 처치 (약물 투여 또는 수술)를 통해서, 뇌혈류를 정상화 시키게 되면 정상적으로 회복 시키는 것이 가능하고, 그렇지 못할 경우에는 영구적인 뇌손상이 남게 됩니다.

저희는 응급실에 뇌졸중이 발생하여 내원한 환자 2,604명의 다양한 임상 정보를 토대로, 3개월 후 시점에서 환자의 예후가 좋을지 나쁠지를 예측하는 머신 러닝 모델을 개발하였습니다. 그동안 임상적으로 예후 예측에 널리 쓰이던 ASTRAL score 는 6가지 임상 정보를 이용하여, 환자의 예후를 예측했는데 저희는 응급실 도착 후에 환자로 부터 얻은 38가지 임상 정보에 딥러닝을 활용하여 환자의 예후를 예측했고, 5% 정도 더 정확하게 환자의 예후를 예측할 수 있었습니다. 재미있는 점은 아무리 딥러닝 기술을 이용하더라도, ASTRAL에서 사용하는 6개의 임상 정보만을 이용하는 경우에는 두 모델 (ASTRAL score 및 딥러닝) 간의 차이가 없었다는 점입니다.

 

II. 논문의 의의 및 시사점

6개의 임상 정보만을 활용하여, 딥러닝을 시켰을 때의 성능이 ASTRAL score와 차이가 없었다는 점은 딥러닝 기술이라고 해서 없는 정보를 더 잘 만들어 냄을 의미하지 않습니다. 즉, 환자의 예후에 영향을 미치는 다양한 요인을 더 세밀하게 수집을 해야만 더 정확한 예후를 예측할 수 있음을 의미합니다. 다른 말로 하면, 환자의 다양한 임상 정보를 매우 정확하고 다양한 측면에서 세밀하게 데이터를 얻어야만, 진정한 의미의 정밀 의료 (Precision Medicine)의 실현이 가능하다는 뜻이 됩니다.

 

AI(Artificial Intelligence) concept, 3D rendering, abstract image visual

II. 딥러닝 기술을 적용한 의학 연구시 고려할 사항

딥러닝 기술은 심층 신경망 (Deep neural network)을 형성함으로써, 기존 통계적 기법에서는 무시되는 데이터들 간의 매우 사소한 인과 관계도 활용할 수 있는 장점이 있습니다. 이러한 특징은 정밀 의료라는 프레임에 매우 적합한 점이라고 할 수 있습니다. 그러나, 이러한 네트워크를 제대로 형성 시키기 위해서는 충분한 수의 양질의 데이터가 필수  (Garbage In, Garbage Out)입니다. 즉, 사금을 채취 과정과 동일하게 아무리 모래 (빅데이터)를 많이 퍼와서, 딥러닝을 시킨다고 의미 있는 결과가 얻어지지 않습니다. 그러나, 딥러닝 기술을 모방한 많은 연구들은 이러한 점을 충분히 고려하지 않거나, 한계점을 지닌채 수행되었습니다.

또한 딥러닝이 충분한 성능을 발휘하기 위해서는 적어도 10,000개 이상의 데이터가 필요한 것으로 알려져 있습니다. 다행히 저희의 이번 연구에서는 10년간 매우 신경 써서 모은 4,000명 이상의 데이터를 이용할 수 있었고, 그럼에도 불구하고 초창기 5~6년의 데이터는 상대적으로 데이터 퀄리티가 떨어져서, 연구에서 제외할 수 밖에 없었습니다. 결국, 최근 3~4년 간 신경써서 모은 38개 임상 정보의 2,604명의 환자의 데이터 (38 x 2,604) 만을 이용하게 되었습니다. 그럼에도 딥러닝 기술과 ASTRAL score 간의 차이는 5% 정도 밖에 되지 않았습니다. 추후에 딥러닝의 장점을 더 잘 살리기 위해서는, 더 크고 정밀한 수의 데이터가 필요한 이유입니다. 그러나 이는 단일 기관에서는 거의 불가능하고, 따라서 국가 주도 또는 콘소시엄 형식의 연구가 필요한 이유가 됩니다.

 

[References]

Heo J, Yoon JG, et al., “Machine Learning–Based Model for Prediction of Outcomes in Acute Stroke”. Stroke: 2019

동반 진단, Companion diagnostics란 무엇인가?

오늘은 정밀 의료 (Precision Medicine)약물 유전학 (Pharamacogenetics) 분야에서 공통적으로 중요한 개념인 ‘동반 진단’ (Companion Diagnostics)에 대해 정리하는 포스팅을 남길까 합니다.  저는 개인적으로 우리 나라의 ‘동반 진단’이라는 어휘를 별로 좋아하지 않습니다. 어휘는 들었을 때 이해하기 쉽고 개념이 바로 연상되어야 하는데, 동반 진단이라는 단어는 이해가 어렵기 때문이죠 (영어식 표기를 단순히 우리말로 번역한 결과).

그러면 ‘Companion diagnostics’ (이하 CD)를 좀 더 쉽게 이해하기 위해서, 어떤 의미의 단어인지 부터 살펴보겠습니다.

‘Companion’: 흔히 동행, 동반자, 친구 등으로 번역되는데 쉽게 말해서 ‘졸졸 따라 다니는’ 의 의미 입니다. / + ‘Diagnostics’ : ‘진단 방법’을 의미 합니다.

즉, Companion diagnostics 는 어떤 약물 치료 또는 처치를 하기 위해, 수반되어 시행해야 하는 (권장되는) 진단 방법 또는 검사를 일컫게 됩니다. 더 쉽게 말하면, ‘너 이 약이나 치료 쓰려면, 이 검사하고 나서 써.’ 입니다. (무슨 이런 쉬운 말을 이렇게 어렵게 이름 붙인답니까..) 더 자세한 정의 및 의미는 아래에서 살펴 보겠습니다.

약물 유전학 관련 포스팅 보기 -> 약물 유전학은 왜 정밀의료에서 중요한가?

 

Companion Diagnostics가 나타나게 된 배경

사실 CD의 개념은 오래 전부터 있었습니다. 대부분의 CD는 종약학 (Oncology) 분야의 항암제 치료와 밀접한 관련이 있습니다. 1970년 대 진행성 유방암 환자에서 ER (Estrogen Receptor) status에 따라 항암제인 Tamoxifen 의 치료 성적이 달라진다는 사실을 알게 되었고, 1980년 대에는 HER2 유전자의 변이 여부에 따라 유방암의 예후가 달라진다는 사실을 알게되면서, HER2에 변이를 가진 환자에서만 특이적으로 치료 효과를 갖는 HER2 antagonist인 Trastuzumab (일명 Herceptin)이 개발되었습니다. 이렇듯 어떠한 약물 (항암제)의 치료 효과 또는 반응이 떠한 유전자의 변이 여부에 따라 다르게 나타나게되면서, 치료 대상자의 선정도 변이 여부에 따라 선택적으로 이루어 지게 된 것입니다. 이러한 개념이 점차 확대되면서, 약물의 개발 과정에서 부터 CD가 깊게 관여하게 되었고, 최근 개발된 많은 항암제에는 이러한 CD marker가 추가되었습니다. 대표적으로, 최근 유명한 면역 항암제인 PD-1 inhibitor인 Pembrolizumab, Nivolumab 등이 여기에 해당합니다.

CD1
[종양학 분야의 항암제 개발과 Companion Diagnostic 마커] 최근 많은 항암제가 유전자의 돌연변이를 타겟으로 하면서, 항암제 사용을 위한 동반진단 마커가 함께 개발되고 있습니다.

 

Companion Diagnostics의 정의

실제 의료 현장에서 위에서 언급한 신약들을 정착시킴에 있어 미국 FDA의 승인이 필요하게 되었습니다. 따라서 동시에 CD에 해당하는 진단 검사 방법에 대한 의료 기기 및 검사에 대한 승인을 받기 위해서 CD가 정확히 무엇이다 라는 정의가 필요하게 되었습니다. 이에 따라 현재 널리 쓰이는 CD의 정의는 이 때 FDA에서 정의한 내용을 쓰고 있습니다. FDA에 따르면, Companion Diagnostics란 다음의 내용을 포함하는 체외 진단 검사를 일컫습니다.

  1. To identify patients who are most likely to benefit from the therapeutic product;
  2. To identify patients likely to be at increased risk of serious adverse reactions as a
    result of treatment with the therapeutic product;
  3. To monitor response to treatment with the therapeutic product for the purpose of adjusting treatment
  4. To identify patients in the population for whom the therapeutic product has been
    adequately studied, and found safe and effective

정리하면, 약물을 안전하고 효과적으로 사용할 수 있는 대상자를 선정하고, 치료를 모니터링할 수 있도록 도움을 주는 체외 진단 검사 방법Companion Diagnostics 인 셈입니다.

CD3
[Companion Diagnostics의 적응 약물, 관련 질환 및  해당 바이오마커]
 

 

Companion Diagnostics의 임상 활용 및 전망

마지막으로 CD의 임상 활용 및 전망에 대해 살펴 보고 포스팅을 마치고자 합니다. 현재 CD의 개념은 대부분 항암제에 국한된 것이 사실입니다. 많은 연구를 통해 암의 발생 메커니즘 (carcinogenesis)를 이해하면서 이에 근거하여 치료제를 개발하다보니 항암제-유전자 변이 마커 쌍이 성공적으로 정립되고 있기 때문입니다. 그러나 이것은 좁은 의미의 CD이며, 더 넓게는 다양한 의료 현장에서 치료의 선택에 활용이 가능합니다. 또한 앞으로 개발되는 많은 신약들에는 이러한 CD의 개념이 더 폭넓게 적용 및 요구될 가능성이 높습니다. (Drug-diagnostic co-development)

신약 개발 과정 관련 포스팅 보기 ->  신약 개발과 임상 시험, 그리고 시판 후 조사

CD2
[Drug-diagnostic co-development] 최근 Companion Diagnostics는 신약 개발 과정에서부터 함께 고려되어야 하는 중요한 부분이 되었습니다.
더불어, 우리나라에서도 2015년에 식약처에서 체외동반진단기기에 대한 가이드라인을 정립하였습니다. (우리 나라의 현황 및 실무와 관련된 내용은 다음 포스팅에서 다루도록 하겠습니다.) 유전자 검사법이 점점 발전하게 되면서, 앞으로는 더 다양한 치료 효과를 예측하고 모니터할 수 있는 많은 마커들이 발견될 것이며, 이를 통해 조금 더 정밀 의료의 실현에 가까워 질 수 있을 것으로 기대되고 있습니다.  많은 CD 마커들이 발굴되고, 실제로 환자들이 도움을 받을 수 있기를 희망합니다.

 

[참고 문헌]

Jørgensen, Jan Trøst, and Maria Hersom. “Companion diagnostics—a tool to improve pharmacotherapy.” Annals of translational medicine 4.24 (2016).

CPIC Guideline: 유전체 정보를 활용한 약물 처방에 관한 임상 근거 지침

지난 포스팅에서 약물 유전학이 왜 정밀 의료의 실현에 중요한지에 대해서 간단하게 포스팅했습니다. 오늘은 조금 더 구체적으로 약물 유전체 정보에 근거하여 실제 임상 진료 시 약물의 처방에 대한 지침을 제공하고 있는 CPIC (Clinical Pharmacogenetic Implementation Consortium) Guideline에 대해서 구체적으로 소개해 보고자 합니다.

지난 포스팅 보기 -> 약물 유전학은 왜 정밀의료에서 중요한가?

CPIC 홈페이지 방문하기 -> CPIC 홈페이지

CPIC 가이드 라인 및 중요도 구분

CPIC 가이드 라인은 약물과 관련 유전자 쌍 (Gene-Drug pair)에 대한 다양한 연구 결과들을 바탕으로, 실제 임상 적용에 대한 중요도를 Level로 구분하고 있습니다.  아래는 이러한 중요도를 평가하는 기준을 나타내주고 있습니다.

  • Is there prescribing actionability?
  • What is the severity of the clinical consequences (adverse effects, lack of response) if genetics are not used to inform prescribing?
  • Is the gene already subject to other CPIC guidelines?
  • Is there an available genetic test for that gene?
  • How commonly used are the affected drugs?
  • How common are the high-risk genetic variants?
  • Is there mention of genetic testing in drug labelling?
  • Are there pharmacogenetically-based prescribing recommendations from professional organizations or others?

즉, 실제 처방에 활용할 수 있는 용이성과 그 임상적 중요도를 바탕으로 하여, 아래 표와 같이 4가지 레벨 A, B, C, D로 구분하고 있습니다. CPIC 홈페이지는 작성일자 기준 352개의 약물-유전자 쌍에 대한 CPIC level을 제공하고 있는데, 이 중에서도 가장 중요도가 높은 A로 분류된 약물-유전자 쌍에 대해서는 실제 임상 가이드 라인이 출판되거나, 진행 되는 중입니다. 또한, CPIC 에서는 Level A 및 B로 구분된 약물-유전자 쌍에 대해서는 실제 유전형에 따라 다르게 약물을 처방하는 것이 효과적이라고 구분하고 있습니다.

cpic level
CPIC 가이드 라인은 약물과 관련 유전자 쌍에 대한 임상적 활용의 중요도에 따라 4가지 기준으로 구분하고, 중요도가 높은 A 및 B에 대해서는 실제 임상 진료 지침을 수립하고 있습니다.

CPIC 가이드 라인의 실제 적용 예

다음으로 CPIC 가이드 라인의 실제적인 예를 살펴 보도록 하겠습니다. 면역 억제제로 흔하게 사용하고 있는 Tacrolimus와 CYP3A5 유전자에 대한 지침을 살펴보겠습니다. CPIC은 우선적으로 CYP3A5 유전자에 대한 유전형을 검사하여, 실제 약물 대사 표현형을 3개의 단계로 구분하고, 각 표현형에 따라 서로 다른 약물 농도를 처방할 것을 권장하고 있습니다.

cpic level_00000
CYP3A5 유전형에 따른 표현형을 구분한 표. CYP3A5 유전형에 따라 약물을 얼마나 잘 대사하는지에 따라 표현형을 Extensive / Intermediate / Poor Metabolizer와 같이 구분합니다.

cpic level_00001
위의 CYP3A5 유전형에 따라 구분된 표현형에 따라, Extensive/Intermediate 그룹과 Poor Metabolizer 그룹에 속하는 환자의 권장 처방 용량이 달라집니다.

 

CPIC 가이드 라인의 한계 및 나아가야 할 방향

마지막으로 CPIC 가이드 라인의 한계 및 앞으로 정밀 의료의 측면에서 보완해야할 내용을 짚어보고 포스팅을 마치고자 합니다. 위의 실제 예를 살펴보면, 임상 지침이 상당히 간단(?)한 것을 볼 수 있습니다. 사실 이는 우리가 흔히 꿈꾸고 있는 정밀 의료의 모습과는 상당히 멀다는 것을 알 수 있습니다. 사실 지금도 이 분야에서 많은 연구자들이 노력하고 있지만, 저런 간단한 유전형에 따른 약물 처방 지침 조차도 현재까지는 19개의 약물 유전자 쌍에 대해서만 출판이 된 상태입니다. 즉 아직도 많은 약물 반응과 유전 정보와의 관계가 불명확하거나, 근거가 부족한 상태입니다. 또한 이러한 임상 지침은 흔한 변이에 근거하여 축적된 관찰에 근거하기 때문에, 매우 드문 변이 (Rare variant)를 갖는 환자에 대해서는 적절한 정보를 제공해 주지 못합니다. 또한 표현형의 구분이 3~4개의 카테고리로 매운 단순하기 때문에 같은 표현형 내에서도 여전히 많은 차이를 보이게 됩니다. 더 세밀한 구분과 관련 지침 수립이 필요한 부분입니다.

또한, 수많은 약물과 유전형과의 추가적인 연구와 덧붙여, 기존에 알려진 약물-유전형에 대한 가이드 라인도 여전히 문제가 많습니다. 위의 임상 지침은 미국을 기준으로 하고 있으나, 약물 반응은 인종별로도 차이가 크게 다르며, 따라서 위의 임상 근거 및 처방 용량이 한국인에서 그대로 적용될 것이라고는 말하기 어렵습니다. 따라서 엄밀한 의미의 정밀 의료를 위해서는 인종별 약물 반응에 대한, 각 지역별 근거도 함께 수립이 되어야 합니다. 한국인 맞춤 진료 지침이 필요한 이유입니다.

여기까지 살펴보면, 실제 유전 정보를 이용하여 약물 반응을 설명하는 것이 쉽지 않음을 깨닫게 됩니다. 이는 약물 반응이라는 형질 또는 표현형이 단순히 한 두가지 유전자의 조합으로만 쉽게 설명되지 않는 경우가 대부분이기 때문입니다. 그러나 동시에 여전히 많은 연구자들은 정밀 의료 실현을 위해 노력하고 있음을 알아야 할 것입니다.

약물유전체학 연구 네트워크: PGRN

오늘은 약물 유전학 분야에서 정밀 의료 실현을 위해 연구와 노력을 이어가고 있는 약물유전체학 연구 네트워크 (Pharmacogenomic Research Network; PGRN)에 대해서 소개하고자 합니다. 사실 이 연구 네트워크를 소개하는 이유에는 크게 2가지 이유가 있는데, 우선 제가 현재 약물 유전체학을 공부하기 때문이기도 하거니와 당장 정밀 의료의 실현을 위한 최전선에서 노력하고 연구하고 있는 사람들이기 때문입니다. 더불어, 아직 우리나라에서는 PGRN에 포함되어 연구를 하고 있는 연구자가 거의 없고, 정밀 의료 실현을 위한 약물 유전체학의 중요성에 대해서도 외국에 비해서 관심이 너무 적기에, 우리나라에서 많은 관심과 연구가 있기를 바래봅니다.

PGRN
[PGRN 홈페이지] 약물 유전체학 관련 연구를 하는 사람들이 서로 연구를 공유하고, 시너지를 일으켜 정밀의료의 실현을 위해서 노력하고 있습니다.
PGRN2_00000

PGRN의 identity를 잘 보여주는 문장이라 가져왔습니다. 약물의 치료 효과와 부작용과 관련된 유전적 차이 (genomic variation)를 연구하여 정밀 의료의 실현을 목표로 하는 연구자 네트워크라는 것을 알 수 있습니다. 한 가지 눈여겨 볼 점은 이 연구자 네트워크에 단순히 약물 유전체 전공자만 있는 것이 아니라, 다양한 전공의 연구자들을 포용하고 서로 연구에 시너지를 내고 있다는 점 입니다. 또한 연구자들 간의 활발한 교류를 위해서 구축된 네트워크가 서로 윈-윈 할 수 있는 매우 긍정적인 방향으로 진행 중이라 것도 부러운 점이 많습니다.

PGRN2

위에는 PGRN 주도로 진행되었던 또는 진행되고 있는 연구를 바탕으로 구축된 연구 Resource들입니다. 단순히 하나의 연구에서 끝나는 것이 아니라, 연구의 효용성을 극대화하고 실제로 적용하는데까지 필요한 모든 하나 하나의 세부 단계들을 생각하고 구축해가고 있다는 점이 정말로 부러운 점입니다. 사실 정밀 의료를 실현하기 위해서는 그 것을 뒷받침할 수 있는 연구 결과도 중요하지만, 연구 결과를 통해 도출한 지식들은 잘 엮고 실제 임상 환경이나 사회에 적용하기 까지도 많은 노력이 필요하게 되는데, PGRN의 연구자들은 이 점에도 많은 공을 들이고 있는 모습이 보입니다. 사실 세부적인 프로젝트 소개나 구성원, 약물 유전체 데이터 베이스 등 소개해야할 내용이 많지만, 이번 글은 간단히 PGRN을 소개하는 것에서 마무리하고자 합니다. 연구자들 부터 일반 대중까지 정밀 의료 실현을 위한 이해와 공감대가 형성되기를 바라며, 오늘 글은 이것으로 마치겠습니다.

 

휴먼 게놈 프로젝트, 그 이후.. 그리고 정밀 의료시대까지

Hx of HGP
The landscape of Human Genome Project (National Human Genome Research Institute 에서 발췌)

인간 게놈 프로젝트 (Human Genome Project; HGP)는 인간의 모든 유전자 염기 서열을 밝히는 것을 목표로 1990년 처음 시작되었습니다. 그리고 당초 목표보다 2년 빠른 2003년도에 목표를 완수하게 되었죠. 이 당시만 해도, 인간의 유전체 암호가 모두 해독되어서 마치 모든 유전병을 정복가능하게 될 거라고 기대가 매우 컸습니다. 그렇지만 당시의 기대와 흥분도 잠시, 지금까지 무려 14년이 흘렀지만 아직도 게놈 프로젝트는 현재 진행형입니다. 이번 글에서는 게놈 프로젝트의 역사와 의의, 그리고 앞으로 유전체 연구 진행 방향에 대해서 논의해 보겠습니다.

사실 게놈 프로젝트를 말하는데 있어서, 염기서열 분석 기술의 발전을 떼놓고는 말하기가 어렵습니다. 하지만 각 세부적인 분석 기술 소개하는 것 만으로도 엄청난 분량이 되어버리므로, 이번 글에서는 간단히만 언급하겠습니다.

Frederick-Sanger-and-a-DN-009
1958년 노벨 화학상 수상자, Frederick Sanger (1918 – 2013). 그의 이름을 딴 생거 시퀀싱 방법은 아직까지도 염기 서열 분석 방법의 고전적 분석 표준(Gold standard)으로 인정받고 있습니다.

유전자의 염기 서열을 분석하는 가장 고전적인 방법은 생거 시퀀싱(Sanger sequencing)법 입니다. 영국의 생화학자였던 프레데릭 생거에 개발된 방법은 아직까지도 염기 서열 분석의 표준 방법(Gold standard)로 인정되고 있습니다. 그러나 기술의 발전으로 점점 더 빠르고 정확하게, 대용량의 유전 정보를 시퀀싱하는 것이 가능하게 되었고, 최근에는 이를 두고 차세대 염기 서열 분석법 (Next-generation sequencing, NGS) 라고 부르고 있습니다. 사실 우리는 이미 NGS의 시대에 살고 있기 때문에 엄밀한 의미에서 차세대 라는 말은 맞지 않습니다. 따라서 일부에서는 3세대 염기서열 분석 (Third generation sequencing, TGS) 또는 대용량 염기 서열 분석 (Massively parallel sequencing, MPS)라고 부르기도 합니다. 하지만, 편의상 널리 NGS로 통용되고 있습니다. 예전에는 염기 서열을 밝히는데 수년이 걸렸던 인간 게놈 프로젝트도, NGS 기술의 발달로 이 글을 작성하는 지금도 매우 저렴한 가격에 며칠이면 가능해졌으며, 소요 시간과 가격은 점점 감소하고 있습니다. 그렇다면 이렇게 저렴해진 유전체 서열 분석 기술이 의미하는 바는 무엇일까요?

costs_plummeting_x9001.jpg
2000년대 초, 백만불이었던 전체 유전체 분석 가격은 2017년 현재 이미 1,000불 아래로 떨어졌습니다. 즉, 개인이 100만원의 비용이면 본인의 모든 염기 서열 정보를 알 수 있는 시대에 도달했다는 의미가 됩니다.

사실 인간 게놈 프로젝트 이후에 진행된 프로젝트는 1000 게놈 프로젝트 (1000 Genome Project)가 있습니다. 1000 게놈 프로젝트는 1000명의 사람들의 전체 유전체를 분석해서 서로 차이를 보이는 염기 서열에 무엇이 있고, 이것이 개인마다 어떻게 다름으로써 개인별 특징을 나타내는지를 찾고자하는 첫 시도였다고 볼 수 있죠. 그리고 현재 알게된 사실은 사람들은 무수히 다른 단일 유전자 변이 (Single Nucleotide Variant, SNV)를 가지고 있으며, 이러한 SNV가 각기 어떻게 작용을 해서 서로 다른 형질을 보내는지에 연구의 포커스가 맞춰진 상태입니다. 인간이 가지고 있는 형질과 질병은 무수히 많습니다. 그리고 인간의 유전체도 SNV를 포함해서 매우 다양하며, 무궁 무진한 상호 작용과 조절을 받고 있습니다. 즉, 인간 게놈 프로젝트 초기에 기대했던 목적을 완전히 이수하려면 이러한 모든 유전체의 발현과 조절, 그리고 개개인의 유전 정보와의 관계를 밝히는 것이 필수라는 것이죠. 1000명에서 시작된 프로젝트는 이제 나라와 인종별로 10만명, 100만명 수준으로 확대되고 있으며, 앞서 언급한 유전체와 형질간의 관계를 확인하기 위한 데이터 수집 과정입니다.

즉 앞으로의 유전체 프로젝트와 연구 방향은 이러한 형질 또는 질병과 유전 정보 간의 관계를 파헤치는데 집중될 것입니다. 유전자 지도 완성 뿐 아니라, 유전자 지도 안의 각 위치가 어떠한 역할을 하고, 어떤 형질과 질병을 일으키는지 완벽하게 이해를 해야한 엄밀한 의미의 정밀 의료가 실현 가능하다는 것이죠.  유전체 정보는 매우 방대하고, 이를 분석하는데는 매우 많은 시간과 노력이 필요합니다. 따라서 뒤이어 발전하게 된 것이 이러한 유전 정보를 분석하는 생물 정보학 (Bioinformatics)입니다. 더 나아가 최근에는 이러한 유전 정보를 빅데이터로 간주하여, 인공지능 방법론을 활발하게 적용하고 있는 상황입니다. 정밀 의료를 논의하는데 있어, 유전학, 생물 정보학, 그리고 인공 지능 등을 함께 이해할 필요가 있는 대목입니다.

2-DNA-computer
유전 정보 데이터를 바탕으로 한 정밀 의료 를 실현하기 위해서는 생물 정보학과 같은 분석 도구가 필수적이며, 유전체 데이터가 매우 크기 때문에 이를 효과적으로 처리하기 위해 빅데이터와 인공 지능 기술 적용이 크게 각광 받고 있습니다.

궁극적으로 정밀 의료 시대에는 모든 개인이 자신의 유전 정보를 보유하게 될 것이고, 앞에서 알게된 지식을 바탕으로 사는 시대에 있게 될 것입니다. 그리고 지금은 연구자들이 그러한 지식의 틈을 메꿔가는 과정이라고 볼 수 있겠죠.

유전 정보 분석 및 생물 정보학, 그리고 빅 데이터와 인공지능. 각각의 세부적인 내용은 나중에 더 자세히 알아보도록 하고 이번 글은 여기서 마치겠습니다.