본문 바로가기

Statistical Analysis/R

[R] Fisher's exact test, 피셔의 정확 검정

피셔의 정확 검정은

카이제곱 검정의 가정에서 독립성 가정만 충족할 때 사용한다.

 

따라서, 독립성 가정만 충족하면 사용할 수 있다.

 

가설은 카이제곱 검정과 동일하다.

- 귀무 가설 : 두 변수는 서로 독립적이다.

- 대립 가설 : 두 변수는 서로 독립적이지 않다.

 

카이제곱 검정의 2번 가정이,

"기대 빈도가 5 미만인 셀은 전체 셀의 20% 미만이어야 한다"인데,

예제를 통해 이게 무슨 뜻인지 알아보자.


# 데이터 불러오기
sample = read.csv("F:/Sw-tastics/Statistics Analysis/example/10. Fisher exact test.csv", header = T)

# table
tab = table(sample)
tab

# chi-sq test
model = chisq.test(tab)

# 기대 빈도
model$expected

# Fisher's exact test
fisher.test(tab)

10. Fisher exact test.csv
0.00MB

데이터는 저번 카이제곱 검정 데이터와 비슷한데,

차이점은 관측치를 절반으로 줄였다.

 

# 데이터 불러오기
sample = read.csv("F:/Sw-tastics/Statistics Analysis/example/10. Fisher exact test.csv", header = T)

# table
tab = table(sample)
tab

 

# chi-sq test
model = chisq.test(tab)

뭔가 경고를 해준다.

가정이 충족되지 않아서 경고 메시지를 출력한 것이다.

 

# 기대 빈도
model$expected

기대 빈도를 출력해서 보도록 하자.

총 셀이 9개가 있고, 기대 빈도가 5 미만인 셀이 6개가 있다.

즉, 6/9 = 66.6...%개의 셀이 5 미만인 셀인 것이다.

그래서 2번 가정이 충족되지 못했다.

어쨌든 카이제곱 검정의 가정이 충족되지 못한 것을 확인했으니,

피셔의 정확 검정을 해보자.

 

# Fisher's exact test
fisher.test(tab)

p-value가 0.05 미만이므로 귀무 가설을 기각한다.

즉, 국적과 선호하는 영화 장르는 서로 독립적이지 않다는 결론을 낼 수 있다.