[유전학 중요개념 정리] Hardy-Weinberg Equilibrium과 Variant Frequency

시퀀싱 데이터를 분석하는데 가장 중요한 정보를 제공하는 것 중 하나가 Minor Allele Frequency (MAF) 또는 변이 빈도 (Variant Frequency) 입니다. Variant Frequency는 전체 인구 집단 (Population)내에서 해당 변이가 어떠한 빈도로 존재하는지를 나타냅니다. 한가지 중요한 점은 여기서의 변이 빈도는 인구 집단의 관점에서의 빈도를 나타내기 때문에, 시퀀싱 데이터의 VAF (Variant Allele Frequency)와는 개념이 다르다는 점입니다. 일반적으로 NGS 데이터에서의 VAF는 해당 변이의 (전체 Read Depth에서 변이를 가진 Read의 Depth의 비율)을 나타내고, 암의 Tumor proportion을 추정하거나, Haplotype 결정에 쓰이는 변수로 대상이 완전히 다릅니다. 인구 집단에서의 변이 빈도를 해석하기 위해서는 Population Genetics에 대한 이해가 중요한데, 그래서 이번 포스팅에서는 그 중에서 가장 중요한 개념인 하디-바인베르크 평형 (Hardy-Weinberg Equilibrium; HWE)과 그 예외 상황에 대해서 정리해보려고 합니다.

 

하디-바인베르크 평형 (Hardy-Weinberg Equilibrium; HWE)은 유전학 교과서라면 항상 등장할 정도로 중요하면서도, 매우 단순한 수식입니다. 전체 집단에서의 대립 형질의 변이 빈도를 각각 p, q라고 하면 (p+q)=1 이기 때문에, diploid (n=2)로 존재하는 사람의 경우, 세대를 거듭해도 유전형의 조합은 (p+q)^2=1 의 빈도를 만족하면서 존재한다는 것이 하디-바인베르크 평형의 가정입니다.  하지만 현실 상황에서 생물학이 이렇게 단순한 수식을 따를 수 있을까요? 그렇기 때문에 사실 하디-바인베르크 평형은 그 수식 자체보다도 평형 상태의 가정과 예외 상황이 훨씬 더 중요합니다.

andrews_figure4_ksm

[하디-바인베르크 평형의 가정]

  1. No natural selection: 특정 변이에 대한 자연 선택 (Natural Selection)이 존재하지 않는다. 사실 이러한 변이는 기능적 차이가 없어야 하는데, 이러한 변이는 거의 없습니다. 표현형과 관련된 변이, 특히 질병과 관련된 변이에는 항상 자연 선택이 일어나게 되어 있습니다.
  2. Population size is sufficiently large (infinite): 전체 집단의 크기가 충분히 커서 (거의 무한대로), 변이의 빈도가 다른 요인에 의해 쉽게 영향을 받지 않는다고 가정합니다.
  3. Neither mutation nor migration: 또한 집단 내에서 새로운 변이가 발생 (mutation)하거나, 특정 변이를 가진 집단이 다른 곳으로 이주 (migration)함으로써 변이 빈도에 변화가 발생하지 않는다고 가정합니다. 그러나 사실 이러한 가정도 mutation 의한 질병의 발생이나, 아메리카 대륙으로 집단 이주를 해서 인종의 용광로가 된 미국을 보면 현실 상황은 많이 다르다는 것을 알 수 있습니다.
  4. Absence of assortative mating: 선택 교배가 아닌 무작위 교배 (random mating)가 일어난다. 그러나 다양한 작물, 가축의 품종 개량 과정, 인간의 결혼 등을 보면 항상 무작위 교배가 일어나는 것은 아닙니다.

현실 상황은 위의 HWE의 평형 가정과 많이 동떨어져있고, 그렇기 때문에 HWE 평형 가정과 위배 되는 상황들이 변이 빈도의 변화에 영향을 미치는 주요 인자들로 작용하게 됩니다. 이러한 관점에서 파생된 중요한 개념으로는 1) Selective Pressure, 2) Population Bottleneck Effect, 3) Migratory Effect or Founder Effect, 4) Genetic Drift 등이 있는데, 이러한 체계들이 유전적 다양성과 진화 방향성에 영향을 미치게 됩니다. 이러한 요인들이 복합적으로 맞물려 전체 집단에서의 특정 유전자의 변이들의 빈도를 결정하게 됩니다. 특히 이러한 요인들은 매우 드물게 발생하는 특정 Mutation에 의해서 질병을 일으키는 희귀 질환보다는, 일반 인구 집단에서의 다양한 변이 빈도와 형질간의 관계를 살펴보는 분야 (e.g. 복합 형질, 약물 유전학 등)에서 더욱 중요하게 됩니다.

What-is-the-Bottleneck-Effect.jpg

mechanisms-of-change_med

 

마지막으로 시퀀싱 변이 분석의 관점에서 HWE는 데이터의 QC 또는 필터링 과정에서 이용할 수가 있습니다. 변이 빈도 p 또는 q는 항상 < 1 이기 때문에,  Homozygote allele (p^2, q^2)은 항상 Heterozygote allele (2pq) 보다 빈도가 작아야 합니다. Call된 변이에서 Homozygote allele (Recessive)이 Heterozygote allele보다 더 흔하게 나타난다면, 시퀀싱 데이터 처리 과정 또는 검사 과정에 오류가 존재할 가능성이 있기 때문에 더 주의 깊게 살펴볼 필요가 있습니다.

 

[Reference]

Andrews, C. (2010) The Hardy-Weinberg Principle. Nature Education Knowledge 3(10):65

The Genetic Variation in a Population Is Caused by Multiple Factors

Evolution | BioNinja

Wigginton, Janis E., David J. Cutler, and Gonçalo R. Abecasis. “A note on exact tests of Hardy-Weinberg equilibrium.” The American Journal of Human Genetics 76.5 (2005): 887-893.

광고

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

%s에 연결하는 중