Copy Number Variation (CNV)는 Single Nucleotide Variation (SNV)과 더불어, 유전적 다양성을 나타내는 주요한 원인으로 생각되고 있습니다. 유전자 sequence의 염기 하나가 치환된 SNV와 달리 CNV는 유전자 전체 또는 일부의 copy가 중복되거나 줄어들수도 있기 때문에 훨씬 넓은 영역에서 나타나는 Structural variation의 일종입니다.
관련 포스팅 보기 -> 유전학 중요개념 정리: Structural variation 및 Copy-number variation
일반적으로 NGS는 SNV를 보기 위한 목적으로 검사를 시행하지만, 해당 데이터를 활용하면 CNV 분석도 할 수 있기 때문에, 오늘은 NGS 데이터를 활용한 CNV 분석 방법에 대해 포스팅하고자 합니다.

위의 그림은 CNV 분석을 위한 NGS 데이터의 5가지 활용 원리를 나타내주고 있습니다. 그러나 가장 핵심이 되는 원리는 Read depth입니다. Target sequencing과 같이 Read depth가 충분한 경우에, 다른 검체들에 비해 해당 영역의 depth가 월등히 떨어지거나, 또는 월등히 높은 경우에는 해당 영역의 deletion 또는 duplication을 의심할 수 있습니다.

사실 NGS 데이터는 CNV를 목적으로 한 것이 아니라, SNV 검출 목적의 데이터를 부수적으로 활용하는 것이기 때문에 많은 제한점이 있습니다. 따라서, 임상적으로 CNV 검사 목적의 NGS는 권장되지 않으며 적절한 가이드라인도 존재하지 않기 때문에 다양한 Computational tool 들이 개발되어 서로의 장점을 홍보하는 상황입니다. 다음은 다양하게 개발된 대표적인 CNV 검출 tool 들을 정리한 표입니다. 많은 경우 BAM 파일을 활용하는 것을 볼 수 있으며 대부분 R package를 제공하고 있어, 사용이 용이합니다.
좋은 정보 감사합니다
좋아요좋아요
좋은 글 잘 보았습니다.
혹시 “그림2″를 그리신 도구나 그림의 출처를 알려주실 수 있을까요?
좋아요Liked by 1명
특별히 패키지는 없었던 것 같고 그냥 R로 그렸던 것 같습니다.. 하도 오래전 자료라서 정확히 기억이 안나네요.
좋아요좋아요
직접 그리신 거군요. 답변 감사합니다 ^^
좋아요좋아요
안녕하세요. 훌륭하신 선생님의 블로그 글을 볼 수 있어 기쁩니다. 다름이 아니오라, targeted NGS panel data로 in-silico CNV 분석을 하는데 있어서 Pattrec과 같은 Graphic user interface data를 이용하려다 실패했습니다. 선생님께서는 많은 경험이 있으신데, screening 목적으로 CNV 검출을 위해서 어떤 프로그램을 사용하는 것이 좋을까요? workbench의 프로그램으로 확인하는 데는 성공했는데, 실제로 clinical setting에서 사용할만한 무료 프로그램이 있는지 궁금합니다.
좋아요Liked by 1명
NGS 패널을 이용한 CNV 검출에서 사실 더 중요한 것은 프로그램보다는 “시퀀싱의 Depth와 패널 디자인”입니다. 충분한 Depth의 read가 확보되어야 하고, 패널 크기도 충분히 커야 그나마 쓸만합니다. Amplicon 기반의 패널은 Off-target read를 활용할 수 없어서 CNV 검출에는 더욱 쓰기 어렵고, 그나마 Hybrid capture 기반이 쓸만합니다. 더불어 CNV 검출의 resolution도 고려해보셔야 하는데, 작은 크기의 타겟 패널은 기껏해야 염색체 이상 정도의 매우 큰 크기의 CNV만 검출이 가능하다고 보시면 됩니다. 그래서 프로그램의 차이보다 먼저 타겟 패널이 CNV 검출을 위해 적절하게 제작되었는지를 먼저 살펴보시는게 좋습니다. 프로그램은 위 표의 것들을 많이 사용하는데, 저는 ExomeDepth나 CNVkit이 그나마 사용하기 편한 것 같고, GUI 기반의 프로그램은 Nexus Copy Number와 같은 유료 프로그램을 쓰셔야 할 겁니다. (별로 추천하지는 않습니다.)
좋아요좋아요
많은 정보 감사합니다.
좋아요좋아요