NGS Target enrichment method: Hybridization vs. Amplicon capture

우리가 흔히 차세대 염기 서열 시퀀싱이라고 부르는 NGS 기술에서 가장 현실적으로 중요한 요소는 아직까지는 ‘비용 (cost)’일 것입니다. 시퀀싱 비용이 점점 떨어지고 있기는 하지만, 여전히 가격대비 효율성을 고려할 때 임상적인 목적으로는 질병 특이적인 타겟 패널 시퀀싱 (Targeted panel Sequencing)을, 그리고 연구용으로 이용할 때는 엑솜 시퀀싱 (Whole Exome Sequencing)을 주로 이용하고 있습니다.  타겟 패널 시퀀싱과 엑솜 시퀀싱은 시퀀싱 과정에서 게놈 시퀀싱과는 다른 점이 있는데, 바로 Target enrichment 과정의 유무입니다. 그래서 이번 포스팅은 시퀀싱 과정 중 Target enrichment 방법과 원리, 그리고 각 방법별 장단점을 정리해보고자 합니다.

관련 포스팅 보기>

NGS 검사: Whole Genome & Exome, Targeted Sequencing 비교

 

게놈 시퀀싱과 달리 엑솜 시퀀싱을 포함하는 타겟 시퀀싱은 전체 유전체의 매우 적은 부분을 시퀀싱하는 방법입니다. (참고로 엑솜 영역은 전체 유전체의 2~3% 미만입니다.) 따라서, 원하는 해당 부위만 특이적으로 capture를 해야합니다. 즉, 엉뚱한 부위에 가서 프로브가 붙어서 시퀀싱 데이터를 생산하면 안된다는 소리입니다. 이를 위해서는 타겟으로 하는 영역을 적절하게 검출하고 분리하는 방법이 필요한데, 민감도와 특이도를 모두 높히기 위해 일반적으로 Target enrichment (타겟 영역만 선택적으로 분리하여 증폭시키는 방법) 과정이 포함되어 있습니다.

Target enrichment는 크게 아래와 같은 3가지 방법들이 사용되고 있습니다.

1) Hybrid capture 방법, 2) Selective Circularization 방법, 3) PCR 기반 Amplicon 방법

1

Hybrid capture는 타겟 영역에 특이적인 capture probe로 구성되어 원하는 부분만 caputre하는 방법이고, Circularization 방법은 probe가 circle 형태로 달라 붙어 원하는 부위를 증폭한 후에 연결하는 방법입니다. 마지막으로 Amplicon 방법은 원하는 타겟 영역을 PCR로 증폭시켜서 분석하는 방법에 기반합니다. 이 때 catpure 방법의 가장 중요한 요소는 크게 아래와 같습니다.

 

  • Sensitivity: 얼마나 민감하게 원하는 타겟 영역들을 잘 검출할 수 있는가?
  • Specificity: 타겟 영역 특이적으로 검출이 되는가? = 타겟 영역 이외의 영역 (Off-target)을 증폭하거나 검출하지는 않는가?
  • Coverage uniformity: 다수의 타겟 영역을 증폭할 때, 모든 타겟 영역들이 bias 없이 고르게 증폭되는가? > 특정 영역만 depth가 낮게 증폭된다면 해당 영역을 검출하는데 문제가 됩니다.

 

가장 대표적인 Hybrid capture와 Amplicon 방법의 장단점을 정리하면 아래와 같습니다. 다만, 요즘 추세는 대부분 Hybrid capture 방법으로 가고 있는 것 같습니다. Hybrid capture 방법의 단점으로는 상대적으로 DNA 검체량이 조금 더 많이 필요하고, 좀 더 작업 과정이 복잡하여 까다롭다는 점을 들 수 있겠습니다. 따라서 최근 개발되는 엑솜 시퀀싱 capture 패널은 대부분 이러한 단점들을 개선하여 요구되는 검체 최소량을 줄이고, 전체 엑손 영역을 고르게 검출할 수 있다는 점을 부각시킨 제품들로 출시가 되고 있습니다.

 

improved-reagents-methods-for-target-enrichment-in-next-generation-sequencing-5-638

 

[Reference]

Mertes, Florian, et al. “Targeted enrichment of genomic DNA regions for next-generation sequencing.” Briefings in functional genomics 10.6 (2011): 374-386.

 

마지막으로 비록 조금 오래된 영상이기는 하지만, 슬라이드 정리가 잘 된 유투브 영상이 있어 첨부합니다.

 

영국의 정밀 의료 사례: UK biobank, 100,000 Genome Project, NHS England 까지

정밀 의료 (Precision Medicine)와 관련하여 최근에 매우 감명을 받은 영국(UK)의 사례를 보면서, 전반적인 연구 동향 및 정밀 의료가 실제 의료 시장 변화에 미치는 동향에 관한 글을 남겨봅니다. 영국은 확실히 사회 복지 체계가 잘 잡혀서 의료 분야에서도 많은 변화를 주도하고 있으며, 체계도 매우 구체적이고 잘 잡혀있습니다.

 

UK BioBank

uk biobank

이러한 특성은 가장 선도적으로 영국인들의 유전체 정보를 구축하는 UK Biobank project에도 잘 나타나있으며, UK Biobank를 활용하여 나온 무수한 많은 연구와 논문들, 그리고 이를 쫓는 많은 개별 국가들의 정책들이 이를 입증합니다. 우리 나라에서도 한국인 유전체 은행을 구축해야 한다는 목소리도 동일한 선상에 위치합니다.

UK Biobank국가 주도 단위의 유전체 은행으로 다양한 질환과 형질을 대표하는 사람들의 검체를 수집하고, 임상 정보를 정리하고, 수집한 검체를 통해서 유전체 정보를 데이터 베이스로 구축하고 있습니다. 국가 주도 단위로 매우 큰 인구 집단을 대변하기 때문에 그 파급력은 매우 크다고 할 수 있습니다.

 

100,000 Genomes Project

genomics england

UK Biobank와 비슷하게 진행되고 있는 다른 프로젝트는 우리 나라의 보건 복지부에 해당하는 영국의 Department of Health & Social Care. 산하의 Genomics England에서 진행하고 있는 100,000 Genomes Project 입니다. 희귀질환과 암 질환특정 질환 환자들 10만명의 게놈을 전장 유전체 시퀀싱(Whole Genome Sequencing)하여, 전체 유전체 정보를 수집하는 것을 목표로 하는 프로젝트로, 연구자의 입장에서도 매우 파급력이 크지만, 다양한 질환의 환자들과 일반인들에게도 미칠 파급력이 엄청 날 것으로 예상됩니다. 해당 프로젝트는 2018년 12월 10만번째 참여자의 유전체를 시퀀싱하면서 목표에 도달했고, 이 결과를 바탕으로 앞으로 어떠한 결과가 나올지 매우 기대가 됩니다.

The UK has sequenced 100,000 whole genomes in the NHS

 

NHS England

nhs england_00000

마지막으로 위와 같은 유전체 프로젝트의 결과를 활용하고, 실제로 의료를 변화 시키기 위해 장기적인 관점에서 영국은 NHS England를 출범시켜서 정밀 의료를 바탕으로 한 10년 이후의 의료 서비스에 대해서 계획하고 있습니다. 재미있는 점은 많은 일반 국민들이 실제로 관심을 가지고, 직접 프로젝트에 참여하며, 이를 통해서 공동체 전체의 발전을 이끌어내는 각각의 톱니바퀴가 잘 물려서 돌아가고 있다는 점입니다.

특히, 이러한 큰 테마 안에 속해 있는 각각의 세부 과제들의 짜임새와 디테일들을 보면, 의료인으로서 소름끼칠 정도로 정교하고 놀랍습니다. 그 안에서 얼마나 많은 전문가들이 노력하여 상의하고 정책을 수립했을지, 하나의 문서를 작성하는데도 얼마나 많은 고민이 있었을지가 여실히 느껴집니다.

우리나라의 보건 복지부에서 의료 정책을 기획하시는 분들도 이러한 점을 꼭 염두해두고 장기적인 계획은 수립했으면 하는 바람으로 글을 마칩니다.

 

NGS 검사: Whole Genome & Exome, Targeted Sequencing 비교

임상 검사 및 연구 목적의 검사로 시행하는 염기서열 분석 방법은 기존의 생거 시퀀싱에서 차세대 염기서열 분석법 (Next-generation sequencing; 이하 NGS)로 빠르게 바뀌어서, 이제는 대부분 NGS로 생산된 엄청난 유전체 데이터가 쏟아지고 있습니다. 하지만 이러한 데이터의 생산보다 더 중요한 것은 어떠한 목적과 목표를 가지고 생산된 데이터를 활용할 것인가에 있다고 하겠습니다. 그래서 이번 포스팅에서는 NGS 기술을 이용하여 DNA 시퀀싱을 하는 대표적인 3가지 검사법에 대해서 비교 및 정리하고자 합니다.

관련 포스팅 보기>

NGS 타깃 시퀀싱 패널 검사의 분석 및 해석시 고려할 사항

NGS Targeted Gene Panel 디자인을 위한 고려 사항

Exome sequencing을 위해 고려할 요소들: capture kit와 target coverage 선택

SNP array와 array CGH의 원리 및 UK Biobank Array, Korean Chip

 

Genomic_comparison3

I. Whole Genome Sequencing (WGS)

유전체 전체의 시퀀스를 모두 검사하는 방법입니다. 유전체 전부를 보기 때문에, 개별 시퀀스의 깊이 (depth)는 낮아지지만, 이론적으로 유전체 모든 영역의 SNP (Single Nucleotide Polymorphism), INDEL (Insertion & Deletion), SV (Splicing variant), CNV (Copy number variant) 등을 확인할 수 있습니다 (물론 short-read에서는 repetitive 영역을 모두 보는 것은 불가능합니다). 단, 검사 단가가 비싸고 생산된 유전체의 크기가 매우 커서 분석 및 저장에도 많은 비용이 들어갑니다. 그러나 non-coding 영역의 regulatory variant를 발굴하고, 전체 유전체 영역을 동일하게 가정하는 Genome-wide Null 분석이 가능한 장점이 있습니다.

 

II. Whole Exome Sequencing (WES)

유전체 중에서 단백질을 직접 코딩하는 엑손 영역 (Exome; 엑솜)의 유전체만을 분석하는 방법입니다. 사람의 경우, Exome은 전체 유전체의 2% 미만이기 때문에 WGS보다 생산되는 데이터의 크기가 작아, 저장 및 연산 용량도 줄어들고 가격도 저렴합니다. WGS을 분석하더라도 많은 경우, non-coding 영역의 변이는 해석이 어렵고 크게 의미 있는 결과를 얻는 경우가 많지 않기 때문에 WES이 더 경제적이고 더 높은 depth를 얻을 수 있는 장점이 있습니다. 하지만, 타겟 영역을 제외한 부위 (Intergenic 또는 Intron 영역의 regulatory variant)는 검출이 어렵습니다.

 

III. Targeted Gene Sequencing (TGS)

특정 질병 또는 목적에 부합하는 유전자들로만 구성된 Customized 패널을 구성하여 검사하는 방법입니다. 상대적으로 좁은 영역의 유전체만을 대상으로 하기 때문에, 적은 용량의 데이터를 생산해도 높은 시퀀싱 Depth를 얻을 수 있고, 가격적으로도 가장 저렴합니다. 효율적으로 원하는 유전자들로 입맛에 맞게 유전자 패널을 구성하여, 데이터의 연산 및 저장 용량도 줄일 수 있습니다. 대표적으로 약물 대사에 관련된 유전자로 구성된 약물 유전체 패널, 암 발생과 관련된 유전자들로 구성된 고형암 패널 등이 있습니다. 타겟으로 하는 유전자가 명확하고 보고자 하는 영역이 명확한 경우에 가장 적절하여, 임상 검사실에서 가장 많이 사용하는 검사 방법입니다.

NGS modalities
[유전체 검사의 범위에 따른 가격, 용도 및 도구] 더 폭넓은 유전체를 검사할수록 가격은 일반적으로 더 비싸지고, Depth는 낮아지게 됩니다. 검사 목적에 따라 적절한 modality를 활용하는 것이 중요합니다.

위의 3가지 검사법을 결정해야할 때 고려해야할 요소는 크게 다음과 같습니다.

  1. 검사 목적: 진단용인가? 연구용인가? 연구용이라면, 연구 대상의 유전자가 제한된 연구인가 또는 새롭게 발굴하는 것이 목적인가?
  2. 분석 대상: 특정 유전자에 한정할 것인가? 해석이 용이한 엑손 영역에서 새로운 유전자를 발굴할 것인가? 전체 유전체에서 탐색적으로 연구할 것인가?
  3. 검체 이용 및 시퀀싱 깊이: 어떠한 검체를 이용할 것이며, 시퀀싱 깊이는 어느 정도가 적절한가?
  4. 검사 비용 및 분석 능력: 시퀀싱 결과 생산된 데이터의 크기가 매우 크기 때문에 이것을 분석하는 컴퓨팅 파워 및 용량, 전체적인 비용도 고려해야 합니다.

올해부터 한시적으로 임상 검사의 목적으로는 타겟 시퀀싱 패널 (TGS)에 대해서 보험 급여가 인정되어 임상 검사실에서 시행되고 있고, WES 및 WGS의 경우에는 진단의 목적보다는 연구 목적으로 새로운 후보 유전자 또는 영역을 발굴하는 목적으로 많이 사용하고 있습니다. 위의 3가지 외에도 최근에는 Clinical Exome Sequencing이라고 하여, 전체 엑손 영역 중에서 임상적으로 질병과 연관된 유전자들로만 구성된 일종의 광범위 타겟 시퀀싱 패널과 같은 검사도 WES보다 좀 더 저렴하게 검사가 가능합니다.

또한, 연구자의 입장에서 비용 만을 생각하면 시퀀싱보다는 micro-array 기반의 검사가 더 저렴하고 간편한 경우도 있기 때문에 (e.g. 한국인칩 ㅠㅠ), 목적에 적합한 검사를 선택하는 것이 중요하다고 할 수 있겠습니다. Array 검사법과 시퀀싱 검사법의 비교는 나중 포스팅에서 다루도록 하겠습니다.

 

[References]

https://blog.genohub.com/2015/02/21/whole-genome-sequencing-wgs-vs-whole-exome-sequencing-wes/

https://blog.genohub.com/2016/10/24/targeted-gene-panels-vs-whole-exome-sequencing/