비모수통계
비모수검정방법 모수 검정방법과 같이 가정들이 엄격하지 않다. 비모수검증은 이를 분포무관법(distribution-free method): 모수에 대한 언급x 2오류를 범할 가능성이 높다. 모수검정은 등간척도와 비율척도로 측정된 자료를 분석 비모수검정은 명목척도와 순서척도로 측정된 자료를 분석 비모수검증은 계산이 쉽다 모수검정의 가정을 충졳기키기 어렵고 수집된 자료의 수가 적을 때, 그리고 자료의 분포형태를 가정할 수 없을 때 적용된다. 모수검증이 더 적합할 때는 비모수검증보다 모수검증을 사용함.
비모수적 방법의 특징은 최소한의 가정을 전제로 하므로 가정이 만족하지 않음으로서 발생하는 오류를 줄일 수있다. 대부분의 경우 관측값보다는 상대적 순위를 이용하여 검정통계량을 유도하므로 순서척도로 관측된 자료의 검정에 유용하다. 계산과정이 단순하고 통계적 의미를 이해할 수 있으므로 통계에 대한 깊은 지식을 필요로 하지 않는다.
비모수 검정 방법 요약 표본특성 명목척도 서열척도 1표본(단일변수) 카이제곱검정 콜로고로프-스미르노프 2표본(두 변수) 맥니머 부호검정, 윌콕슨검정 K-표본 코크란검정 프리드만검정 2개 독립표본 크로스탭 중위수검정, 맨-휘트니검정 K 독립표본 크루스칼-왈리스검정
Overview SPSS 12.0 통계 패키지를 통해 비모수 검정과 모수 검정 절차와 결과를 비교하자 비교대상 집단수 관계 단일 표본 분석 Sign test (Binomial test 이용) T test Kolmogorov-Smirnov test 2표본 독립 Mann-Whitney 대응 자료 Wilcoxon 부호-서열 test Paired T test K표본 Kruskal-Wallis H test ANOVA test Friedman test
카이제곱검증 관찰치와 기대치간에 차이가 나는가를 검정하는 것으로 적합도 검증(goodness-of-fit)을 할 때, 명목척도와 서열척도로 이루어진 변수간의 독립성을 검정할 때 사용한다.
χ² 단일표본검정 범주의 기대치와 관찰치의 빈도수가 차이가 있는지를 검정하는 것이다.
비모수검정의 개요 및 LAB
Introduction Overview 모집단의 가정이 만족되지 않는다면 T-검정 대신 비모수적 방법인 Mann-Whitney 검정을 사용해야 됨 비모수검정은 일반적으로 모수검정보다 검정능력이 떨어짐 비모수검정은 데이터가 정규분포를 따르지 않을 때 이용하는 것이 좋음
Mann-Whitney test 독립인 두 집단의 평균의 차이를 비교할 때 모집단의 가정이 만족된다면, ( )검증을 사용해야 한다. 모집단의 가정이 만족하지 않는다면, ( )검증 대신에 비모수적인 방법인 ( )검정을 사용해야 한다. 이때 데이터를 순위 또는 구간으로 나타낼 수 있어야 한다. 모수검정이 적절치 못한 상황이란? 데이터가 명목 혹은 순서 데이터로 측정되었을 때 구간 데이터라 하더라도 정규분포를 따르지 않을 때
흡연자 28 53 39 27 41 68 45 48 65 78 비흡연자 32 35 61 43 82 44 38 85 63 46 30 47 57
Mann-Whitney test 정확한 유의확률의 p값이 0.232이므로 유의수준 0.05보다 크므로 H0가설을 수용함
독립 2표본 분석
독립 2표본 분석 Mann-Whitney 의 U통계량 값이 63.5 이다. 유의확률 P값이 0.297>0.05 이므로 귀무가설을 기각할 수 없다. 또한 근사 유의확률(양쪽)의 P값이 0.291>0.05 이므로 귀무가설을 기각할 수 없다. 따라서 흡연자와 비흡연자 집단사이의 운전기술의 차이가 없다.
대응표본에 대한 부호검정(sign test) 영가설: 두 생산 라인의 일별 생산량 중에서 불량품의 수의 분포는 동일하다. 대립가설: 두 생산 라인의 일별 생산량 중에서 불량품의 수의 분포는 동일하지 않다.
일자 생산라인 라인1 라인2 D(라인2-라인1) 1 170 201 29 2 179 164 -15 3 140 159 19 4 184 195 11 5 174 177 6 142 28 7 191 183 -8 8 169 10 9 161 200 212 12
차이 D는 단일표본을 이루게 되어, 거기에 부호 검정을 적용할 수 있다. 영가설은 처리가 하등 개선을 가져오지 못한다. 즉, H0: 중위수, v=0 이된다.
양수가 8개이고 음수가 2개, 그리고 동률이 0개이다. -가설이 양측검정이므로 p 값은 0.109로 유의수준 0.05보다 크므로 영가설을 채택 하게 된다. 즉, 두 생산라인의 일별 생산량 중에서 불량품의 수의 분포는 동일하다 는 결론을 내릴 수 있다.
Wilcoxon Signed Rank test 대응 2 표본 Wilcoxon Signed Rank test 대응되는 두 쌍의 데이터를 분석할때 쓰인다. 부호와 차이의 크기를 가지고 분석한다. 모수통계에서 Paired t-test 에 대응된다. Id pre post Diff 1 63.1 41.4 -21.7 2 46.5 55.3 8.8 3 40.1 49.7 9.6 4 48.5 51.6 3.1 5 33.2 37.3 4.1 6 38.8 39.6 0.8 7 48.3 50.1 1.8 8 40.5 43.8 3.3 9 36.9 37.6 0.7 10 50.8 10.3 11 42.2 43.6 1.4 12 34.9 37.4 2.5
대응 2 표본
대응 2 표본 부호 검정 결과 유의확률 0.006<0.05이므로 귀무가설을 기각할 수 있다. 또한 부호순위검정결과에서도 양측검정 유의확률이 0.034로써 유의수준 0.05에서 부호검정과 동일한 결론을 내릴 수 있다.
Kruskal-Wallis의 일원배치 분산분석 모수검정에서 T-검정이 분산분석으로 일반화 될 수 있듯이 비모수검정에서 Mann-Whitney 검정은 Kruskal-Wallis 검정으로 일반화 될 수 있다.
사료의 종류 1 2 3 4 257 201 248 202 205 237 265 276 206 197 187 207 164 185 220 204 190 212 230 214 215 227 228 281 203
카이제곱 통계량은 21.811이다. 유의확률 은 0.000으로 유의수준 0.05보다 작으므로 영가설을 기각하고 대립가설을 채택하게 된다. 5가지 질환의 종류에 의해 수행력에 차이가 난다고 결론을 내릴 수 있다.
Kruskal-Wallis test 독립 K 표본 검정 모수검정시 ANOVA 검정과 대응되는 비모수 검정 법 2표본의 Mann-Whitney test 를 다변량 분석으로 확장 예제 4종류의 사료를 사용하여 실험용 쥐를 사육하고 있다. 4종류의 사료에 따라서 성장에 차이가 있는지를 검정하기 위하여 4종류의 사료를 사용하여 12주동안 사육한후 체중을 측정하였다. 사료의 종류 1 2 3 4 257 201 248 202 205 237 265 276 206 197 187 207 164 185 220 204 190 212 230 214 215 227 228 281 203
독립 K 표본 검정
독립 K 표본 검정 결과 유의확률 0.239 < 0.05 이므로 귀무가설을 기각할 수 없다. 따라서 4종류의 사료에 의한 체중차이가 없다고 판단된다.
H1 : 4개의 시스템에 차이가 있다. (한 개라도 다를 수 있다) 대응 K 표본 Friedman Two-Way 테스트 측정치값들이 동일한 모집단에서 나왔는가를 검정하는 것으로 randomized-Block Design에서 모수통계 기법 ANOVA 에 대응된다. 예제 새로운 시스템을 도입하려는 회사가 있다. 이 회사는 6명의 관리자에게 4개의 시스템별 순위를 매기도록 하였다. 관리자들이 준 점수들로 인해 시스템 평가가 유의한 차이가 있는가? H0 : 4개의 시스템이 차이가 없다. H1 : 4개의 시스템에 차이가 있다. (한 개라도 다를 수 있다) 관리자 시스템A 시스템B 시스템C 시스템D 1 3 4 2 5 6
대응 K 표본
Kolmogorov-Smirnov 검증 K-S 검정은 샘플의 분포가 특정 분포(정규분포, 균일분포,포아송분포,지수분포 중의 하나) 를 따르는지에 대한 검정이다. 가설은 H0 : 모든 x 에 대하여 F(x)=F0(x) H1 : 적어도 한 x 에 대하여 F(x)≠F0(x) 예제 다음은 한 반의 시험 점수이다. 정규분포를 따르는지 검정하시오. 시험점수 496.6 488.4 514.27 491.28 495.53 482.15 484.76 510.13 507.35 505.84
Kolmogorov-Smirnov 검증 원하는 검정분포 체크
Kolmogorov-Smirnov 검증 검정 결과 유의확률 0.940 이므로 유의수준 0.05에서 정규분포를 따른다고 볼 수 있다.