| 들어가며
지난 블로깅에 이어 이번은 F Test에 대한 내용을 설명한다.
전체 연관 내용은 아래 링크를 참고하기 바란다.
1) T Test : 표본의 평균차이 검정 (모집단의 분산이 같다는 가정 하에 함)
2) Welch Test : 표본의 평균차이 검정 (모집단의 분산이 같지 않을 수 있다는 가정하에 함)
3) F Test (Var Test) : 표본의 분산 차이 검정
4) Ansari-Bardley Test : 동질적 2개집단 표본 분포 비모수 검정
5) Mode Test : 이질적 2개 집단 표본 분포의 비모수 검정
6) Fligner Test : K개 집단의 표본 분포 비모수 검정
7) Battlett Test : K개 집단앞으로 몇 차수에 걸쳐 다변량 분석 중 집단간 차이 유의성 분석에 대한 내용을 정리한다.
이번은 T Test에 대한 내용이다.
용어에 대한 것은 해당 용어를 클릭하면 이동한다.
| F Test란?
표본의 분산에 대한 차이를 검정하는 방법은 카이제곱 검정과 F Test(F 검정)으로 구분된다.
카이제곱 검정은 단일표본의 모집단이 정규분포를 따르며 분산을 미리 알고 있는 경우에 적용된다.
그러나 통계 과정에서 이를 알고 있는 경우는 드물기 때문에 모집단을 알고 있지 않은 경우의 F Test를 중심으로 분석한다.
F Test는 두 표본의 분산에 대한 차이가 통계적으로 유의한가를 판별하는 검정기법이다.
분산의 유의차 분석이기 때문에 var test로도 불린다.
| F Test 실습
T-test에 설명했던 데이터를 가지고 그대로 F Test에 적용해보자
- 남녀의 영어 성적에 대한 분산 분석
> boy <- c(46,47,58,47,27,58,56,26,47,25)
> girl <- c(78,57,31,28,67,77,36,57,36,57)
> var.test(boy,girl)
F test to compare two variances
data: boy and girl
F = 0.4923, num df = 9, denom df = 9, p-value = 0.306
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1222795 1.9819824
sample estimates:
ratio of variances
0.4922964
결과를 보면 유의수준 0.05보다 높이 P-value가 나왔기 때문에
귀무가설인 차이가 없다를 채택한다.
결론 : 남녀의 영어 성적에 대한 분산은 차이가 없다.
- 2개 대응 표본의 분산 차이 검정 사례
> bf <- c(11,14,18,21,26,28,37,45,48,60,64)
> af <- c(13,15,17,18,19,23,25,28,29,36,37)
> var.test(bf,af)
F test to compare two variances
data: bf and af
F = 5.0344, num df = 10, denom df = 10, p-value = 0.01746
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
1.354493 18.711705
sample estimates:
ratio of variances
5.03437
유의 수준 0.05 보다 p-value의 값이 작기 때문에 귀무가설을 버리고,
대립 가설을 채택하여 영화 전후에 선호도 분포는 차이가 있다 라고 결론 내린다.
| 결론
간단히 분산 차이 검정을 실시해보았다.
다음 블로깅에서는 Ansari-Bradley Test에 대해 알아보자
| 참고자료
도서 : 다변량 분석 및 데이터마이닝(이재길 지음)
공감버튼이 큰 힘이 됩니다.
'Data Science > R 분석과 실습' 카테고리의 다른 글
T Test, Welch Test 의 이해와 R 실습 (12) | 2017.09.25 |
---|---|
R을 활용한 변곡점 탐색하기 (loess function) :: Data 쿡북 (12) | 2017.08.20 |
R을 활용한 요인 분석(인자분석, Factor Analysis) 정리 :: Data 쿡북 (15) | 2017.03.17 |
R을 활용한 공분산과 상관계수 이해 :: Data 쿡북 (12) | 2017.03.12 |
R을 활용한 주성분 분석(principal component analysis) 정리 :: Data 쿡북 (4) | 2017.03.07 |
댓글