
[관련 링크 보기]
https://www.broadinstitute.org/medical-population-genetics
매주 목요일에는 Broad Institute가 주관하는 Medical and Population Genetics 세미나가 있습니다. 세미나에 참석할 때마다, 매주 따끈 따끈하고 핫한 연구들을 마주할 수 있다는 게 감사하고 행복하기까지 합니다. 특히, 흔한 유전학 연구 내용 뿐 아니라 그에 따른 윤리적 문제 (ELSI), 어떻게 환자에게 유전 정보를 설명하고 임상 진료에 활용할 것인가? (Genetic Counselling), MIT의 공학자들과의 협업을 통한 인공 지능 (AI, Machine Learning) 활용 연구 등 매우 넓은 범위의 Talk을 Cover하고 있어서, 하나의 대규모 유전체 프로젝트를 진행함에 있어 다양한 분야의 사람들이 유기적으로 함께 고민을 하고 진행한다는 점이 인상 깊습니다.
유전체 분석을 위해서는 대규모 인구 집단 내에서 변이의 분포 (Population frequency)를 확인하는 것은 매우 중요합니다. 특히, 희귀 변이 (Rare variant)의 경우에는 그 해석과 의미를 위해서는 더더욱 인구 집단의 크기가 커야 통계적 분석이 가능해집니다. 그런 의미에서 아직 출판되지 않은 이런 대규모 유전체 연구들을 세미나를 통해 미리 마주할 수 있다는 점이 매우 즐겁습니다. WGS은 WES에 비해 데이터 사이즈가 기본 10배 이상 크기 때문에 Computing resource의 스케일에서 엄청난 차이가 납니다. WES 스케일에서는 워크 스테이션급 컴퓨터로도 충분히 작업이 가능했다면, WGS 스케일은 대용량 서버급 연산 능력이 요구됩니다. 일반인들이 자발적으로 참여하여, 전세계의 연구자들과 함께 이렇게 방대한 크기의 데이터를 협력하여 생산하고, 그로부터 생명과학과 의학 분야의 의미 있는 연구 결과를 도출하고 있다는 점이 매우 고무적입니다.



최근의 유전체 연구는 점점 더 큰 인구 집단 (population size)을 더 높은 Depth의 전장 유전체 데이터로 (30X이상의 High-quality-depth WGS) 생산하는 쪽으로 진행되고 있습니다. Population size가 수천~수만명 단위를 넘어, UK Biobank의 경우는 곧 백만명 이상의 Whole Genome Sequencing (WGS) 데이터를 생산할 예정이라고 합니다. 미국의 TOPMed의 경우도 수만명 이상의 다양한 질환의 유전체 데이터셋을 구축하였고, 우리나라의 경우도 최근에 UNIST에서 한국인 만명의 WGS (Korea10K)을 구축했다고 발표하였습니다. 단순하게 숫자를 넘어서, 다양한 형질 정보와 질환을 아우르는 생명 정보 데이터베이스가 구축되기를 기대해 봅니다.
[관련 포스팅 보기]