본문 바로가기
Data Science/R 분석과 실습

F Test(F 검정)의 이해와 R 실습

by 쿡북 2017. 9. 27.

| 들어가며

지난 블로깅에 이어 이번은 F Test에 대한 내용을 설명한다.


전체 연관 내용은 아래 링크를 참고하기 바란다.

1) T Test : 표본의 평균차이 검정 (모집단의 분산이 같다는 가정 하에 함)

2) Welch Test : 표본의 평균차이 검정 (모집단의 분산이 같지 않을 수 있다는 가정하에 함)

3) F Test (Var Test) : 표본의 분산 차이 검정

4) Ansari-Bardley Test : 동질적 2개집단 표본 분포 비모수 검정

5) Mode Test : 이질적 2개 집단 표본 분포의 비모수 검정

6) Fligner Test : K개 집단의 표본 분포 비모수 검정

7) Battlett Test : K개 집단앞으로 몇 차수에 걸쳐 다변량 분석 중 집단간 차이 유의성 분석에 대한 내용을 정리한다.

이번은 T Test에 대한 내용이다.

용어에 대한 것은 해당 용어를 클릭하면 이동한다.


| F Test란?

표본의 분산에 대한 차이를 검정하는 방법은 카이제곱 검정과 F Test(F 검정)으로 구분된다.

카이제곱 검정은 단일표본의 모집단이 정규분포를 따르며 분산을 미리 알고 있는 경우에 적용된다.

그러나 통계 과정에서 이를 알고 있는 경우는 드물기 때문에 모집단을 알고 있지 않은 경우의 F Test를 중심으로 분석한다.

F Test는 두 표본의 분산에 대한 차이가 통계적으로 유의한가를 판별하는 검정기법이다.

분산의 유의차 분석이기 때문에 var test로도 불린다.


| F Test 실습

T-test에 설명했던 데이터를 가지고 그대로 F Test에 적용해보자


  • 남녀의 영어 성적에 대한 분산 분석

> boy <-  c(46,47,58,47,27,58,56,26,47,25)

> girl <- c(78,57,31,28,67,77,36,57,36,57)

> var.test(boy,girl)


F test to compare two variances


data:  boy and girl

F = 0.4923, num df = 9, denom df = 9, p-value = 0.306

alternative hypothesis: true ratio of variances is not equal to 1

95 percent confidence interval:

 0.1222795 1.9819824

sample estimates:

ratio of variances 

         0.4922964 


결과를 보면 유의수준 0.05보다 높이 P-value가 나왔기 때문에 

귀무가설인 차이가 없다를 채택한다.

결론 : 남녀의 영어 성적에 대한 분산은 차이가 없다.


  • 2개 대응 표본의 분산 차이 검정 사례
영화의 광고 전후에 대한 선호도 데이터를 다음과 같다고 할때
광고로 인한 선호도의 분산 차이가 있는지 검정을 해보자

> bf <- c(11,14,18,21,26,28,37,45,48,60,64)

> af <- c(13,15,17,18,19,23,25,28,29,36,37)

> var.test(bf,af)


F test to compare two variances


data:  bf and af

F = 5.0344, num df = 10, denom df = 10, p-value = 0.01746

alternative hypothesis: true ratio of variances is not equal to 1

95 percent confidence interval:

  1.354493 18.711705

sample estimates:

ratio of variances 

           5.03437 

유의 수준 0.05 보다 p-value의 값이 작기 때문에 귀무가설을 버리고, 

대립 가설을 채택하여  영화 전후에 선호도 분포는 차이가 있다 라고 결론 내린다.



| 결론

간단히 분산 차이 검정을 실시해보았다.

다음 블로깅에서는 Ansari-Bradley Test에 대해 알아보자


| 참고자료

도서 : 다변량 분석 및 데이터마이닝(이재길 지음) 


공감버튼이 큰 힘이 됩니다.

댓글