최근 수정 시각 : 2024-05-15 22:59:53

F-통계량




{{{#!wiki style="margin: -5px -10px; padding: 5px 10px; background-image: linear-gradient(to right, #3300ff, #9966ff)"
'''[[집단유전학|집단유전학
{{{#!wiki style="font-family: Times New Roman, serif; font-style: Italic; display: inline;"
]]'''
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px)"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px"
<tablewidth=100%> 기반 학문
유기화학 · 생물학( 분자생물학 · 유전학 · 계통 생물학) · 수학​( 선형대수학 · 미분적분학 · 수치 해석학 · 자료구조) · 통계학
<colcolor=#000,#fff> 기반 및 법칙
멘델 유전 법칙 · 자연 선택 · 유전적 부동( 유전자 병목현상 · 창시자 효과) · 유전자 흐름( 종분화 · 고리종) · 하디-바인베르크 법칙( 멘델 집단) · 집단구조 · F-통계량( FST · FIS · FIT) · 발룬드 효과 · 할데인의 딜레마 · 베르그만 법칙 · 알렌 법칙 · 볼프의 법칙 · 로지스틱 방정식 · 먹이사슬 · PCR · SNP( SSCP · AFLP · RFLP · RAPD ·) · STR · 인간 게놈 · 인간 게놈 프로젝트 · Fitness landscape · 피셔의 자연선택의 기본정리 · 무한 대립유전자 모델 · Ewens의 추출 공식 · Watterson 추정량 · 타이포스트로피 변형 · 힐-로버슨 간섭
현상 & 연구
진화( 수렴적 진화 생태적 지위 · 지위의 미세분화 · 공동진화 · 포괄 적합도) · 고고학( 고대인류 · ANE · 아나톨리아 수렵채집인 · ANS · WSHG · EHG · WHG) · 종분화- 생식적 격리( ) · 어족( 우랄-알타이어족 · 알타이 제어 · 우랄어족) · 생활양식( 수렵채집인 · 반농반목 · 유목민 · 농경민) · 문화( 말타-뷰렛 문화) 상 염색체 다양성 · 베스터마르크 효과 · 형질( 어깨너비 · · 피부색 · 두형) · 질병( 바이러스 · · 정신질환 · 유전병) · 하플로그룹( 하플로그룹/집단 · 하플로그룹 지도)
하플로그룹
Y-DNA (부계) <colcolor=#000,#fff> 하플로그룹 A · 하플로그룹 BT( 하플로그룹 B · 하플로그룹 C · 하플로그룹 D · 하플로그룹 E · 하플로그룹 F · 하플로그룹 G · 하플로그룹 H · 하플로그룹 I · 하플로그룹 J · 하플로그룹 K · 하플로그룹 L) · 하플로그룹 M · 하플로그룹 NO( 하플로그룹 N · 하플로그룹 O) · 하플로그룹 P · 하플로그룹 Q · 하플로그룹 R
mt-DNA (모계) 하플로그룹 D (mt-DNA)
관련 문서 & 개념
유전자( 유전체 · 성염색체) · 유전자 검사(23And me, 유후) · 인종( 북유럽인 · 북아시아인 · 동남아시아인 · 동유럽인 · 동아시아인 · 서유럽인 · 서아시아인 · 남유럽인 · 남아시아인 · 북아프리카인 · 아프리카인) · 민족( 에스니시티) · ISOGG
}}}}}}}}}}}} ||

1. 개요2. 소개3. 정의
3.1. 근친교배가 포함된 대립유전자계 관점3.2. 집단구조로 인한 분할3.3. 고정지수에서
4. 해석5. 증명6. 관련문서

1. 개요

F-통계량(F-statistics)은 개체 집단에서 통계학적으로 예상되는 다양한 모집단 간의 대립 유전자 빈도의 분산을 의미한다. [1]

특히, 유전적 유사성을 측정하는 고정지수(FST, Fixation index)와 밀접한 관련이 있다.

2. 소개

F-통계량은 좀 더 구체적으로 집단유전학에서 사용되는 지표 중 하나로, 주로 모집단 내의 유전적 다양성과 모집단 간의 유전적 차이를 평가하는 데 사용된다.

특히, F-통계량은 유전적 유사성, 즉 유전적 유사성(유전적 거리, 유전적 다양성 등)을 측정하는 FST(Fixation index)와 관련이 있다.

바꿔 말하면 하디-바인베르크 법칙의 기댓값과 비교할 때 예상되는 이형접합성 감소 정도를 의미한다.

F- 통계량은 소의 근친 교배에 관심이 있던 미국의 유전학자 Sewall Wright에 의해 1920년 대에 개발됐다.

그러나 표현형 중 완전 우성은 동형접합체 우성과 이형접합체의 표현형이 동일하게 하기 때문에 분자유전학이 탄생하기 시작한 1960년대 이전까지는 개체 집단의 이형접합을 측정할 수 없었다. [2]

통계학의 F-분포와는 다른 것이다. t-분포와도 연관 없다.

들어가기 전에 반드시 알아야 할 것은 집단구조 하디-바인베르크 법칙이다.

위 두 개념에 대한 이해나 기본기가 없다면 본 문서에서 소개할 내용은 이해한 게 이해한 것이 아닐 것이다.

3. 정의

F-통계량의 구성은 집단구조와 동일하게 [math(F_{IS})], [math(F_{ST})], [math(F_{IT})]로 이루어져 있으며, 다양한 집단 구조에서 이형접합성의 양과 관련이 있고, 근친 교배 계수인 F에서 파생된다.

기본적으로 유전자의 빈도에 대한 것이며, 하디-바인베르크 법칙을 기반으로 한다.

하디-바인베르크 법칙을 기반으로 하는 만큼, 해당 법칙의 기본적인 이해와 어느정도의 문제 풀이 솔루션이 필요하니 본 문서를 읽기 전, 저 법칙에 대한 기본기를 쌓고 읽기 바란다. [3]

3.1. 근친교배가 포함된 대립유전자계 관점

하디-바인베르크 법칙을 근친 교배가 포함된 상황에 맞게 조정한 식이다.

{{{#!wiki style="text-align: center"

여기서 [math(F)][0, 1] 근친교배 계수를 의미한다. [math(p^2, 2pq, q^2)]에 관한 건 하디-바인베르크 법칙을 참고하자.

상술했듯 하디-바인베르크 법칙을 기반으로 하듯 기본 원리나 식의 개형 자체가 하디-바인베르크 법칙과 흡사하다.

여기서 의문이 발생할 수 있는데, 하디-바인베르크 법칙은 멘델 집단을 전제로하는, 멘델 집단이 성립하는 공간에서만 성립한다.

멘델 법칙에 의하면 여러 조건이 있지만 그 중 하나가 근친교배가 없어야 한다는 것이다.

하지만 이 적용된 식은 근친교배가 적용된 대립유전자계의 관점이다. 즉, 멘델 집단이 성립할 수 없는 상태란 것이다.

따라서 해당 방정식은 근친교배와 같은 외부 요인이 유전자 빈도에 영향을 미치는 경우에서만 사용된다.

위 식을 F에 대한 식으로 바꿔보면 다음과 같다.

{{{#!wiki style="text-align: center"

여기서 [math(O Aa)]는 관찰된 실제 빈도, [math(E Aa)]는 예상되는 표현형 빈도를 의미한다.

3.2. 집단구조로 인한 분할

집단 유전학에서는 세 가지의 집단구조(FIS, FST, FIT)로 나뉘는데, F-통계량의 구성에 대해 설명할 때 잠깐 소개했다.

자세한 개념에 대해선 집단구조의 문서를 확인하길 바라고 우리는 FIT에 집중할 필요가 있다.

FIT는 Fixation index for Total Population, 즉 전체 집단에 대한 고정지수를 의미한다.

이 FIT는 모집단 내의 근친교배 정도와 모집단 간의 유전적 차이를 모두 반영한다.

즉, 모집단의 유전적 다양성을 측정을 하기에 매우 적합한 척도란 것이다.

그렇기 때문에 집단구조를 구성하는 개념들의 특성들을 역으로 적용해보면 다음과 같이 나타낼 수 있다.

{{{#!wiki style="text-align: center"

그리고 이항정리에 의해 확장이 될 수 있고, 이는 집단 하위 구조에 대해 추가로 더 분할될 수 있음을 시사하므로 개체(I)에 대한 분할은 다음과 같이 나타낸다.

{{{#!wiki style="text-align: center"

3.3. 고정지수에서

FST는 다방면의 정의로 나뉘어 혼동을 주기 쉽다. 하지만 F-통계에선 다음과 같은 간략한 정의로 적용돼서 직관적으로 이해하기 쉽다.

{{{#!wiki style="text-align: center"

4. 해석

5. 증명

6. 관련문서


[1] 대립 유전자의 이명은 이형접합이다. [2] 멘델의 우열의 원리에 의해 이형접합의 표현형은 우성의 형질과 같게 나타나기 때문이다. [3] 생명과학2 기출이나 수능특강을 풀면 된다.