논문을 위한 통계 집단간 평균 차이: t-test, ANOVA 하성욱 한성대학교 대학원
모수통계검정 vs. 비모수통계검정 Parametric vs. Nonparametric statistical test 관계 상관관계 Pearson Correlation Spearman Rank Order Correlation Kendall’s Tau b or Tau c 교차분석 (cross- tabulation) Chi-Square Independence Test 독립성 검정 Fisher’s Exact Test/ Binomial Test 집단간 차이 Independent Sample T-Test Mann-Whitney U-Test Paired Sample T-Test Wilcoxon Matched-Pairs Signed-Ranks Test One-Way ANOVA Kruskal-Wallis Test
두 집단간 평균 차이 I 두 독립집단간 평균 차이의 분석 순서 σi2 Yes xij Normal ? No (e.g. Ordinal) SPSS, 기술통계량-데이터 탐색 σi2 Known Unknown Sample Size Large (n > 30) Small (n ≤ 30) Z-Test Z-Test (≈ T-Test) T-Test Mann-Whitney U-Test SPSS, 평균비교-독립표본 T검정 SPSS, 비모수검정- 독립2-표본 비모수검정
두 집단간 평균 차이 II 두 독립집단간 평균 차이 xi1, xi2, ……, xi ni ~ iid N (μi, σi2)
두 집단간 평균 차이 III Independent Sample T-Test Assumption 모집단 평균에 대한 가설 x11, x12, ……, x1n1 ~ iid N (μ1, σ12) x21, x22, ……, x2n2 ~ iid N (μ2, σ22) 모집단 평균에 대한 가설 H0 : μ1 = μ2 Ha : μ1 ≠ μ2 모분산 동일성 F-검정 H0 : σ1 = σ2 Ha : σ1 ≠ σ2 F = max[ S12, S22 ] / min[ S12, S22 ] e.g. Levene’s Test for Equality of Variance
두 집단간 평균 차이 IV 모분산이 같은 경우 (i.e. σ1 = σ2) 모분산이 다른 경우 (i.e. σ1 ≠ σ2) Sp2 = n1 + n2 – 2 (n1-1)S12 + (n2-1)S22 x1 x2 - t = Sp2 n1 n2 + degree of freedom = n1 + n2 - 2 S12 = n1 – 1 ∑i=1n1 (x1i - )2 x1 x1 x2 - t = S12 n1 S22 n2 + S22 = n2 – 1 ∑i=1n2 (x2i - )2 x2
두 집단간 평균 차이 V 두 독립집단의 T-Test 단계 <지역조사 데이터.sav> 로 실습 Step 1 : 집단별 정규성 검정 (normality test) SPSS, 기술통계량-데이터 탐색 Shapiro-Wilk Test or Kolmogorov-Smirnov Test (H0: normal) 특히, 표본 수가 작을 때 Graphical Methods 표본 수가 크면 정규성 기각이 잘 됨 e.g. Q-Q Plot (quantile-quantile plot) Step 2 : T-Test 시행 SPSS, 평균비교-독립표본T-검정 분산 동일성 검정 결과의 확인 Levene’s Test for Equality of Variance Step 3: 분산 동일성 검정 결과에 따른 T-value 확인 Equal variance assumed Equal variance not assumed <지역조사 데이터.sav> 로 실습
Wilcoxon Matched-Pairs 두 집단간 평균 차이 VI 두 대응집단간 평균 차이의 분석 순서 Yes xij Normal ? No (e.g. Ordinal) SPSS, 기술통계량-데이터 탐색 대응표본 (σ1 = σ2) T-Test Wilcoxon Matched-Pairs Signed-Ranks Test SPSS, 평균비교-대응표본 T검정 SPSS, 비모수검정-대응2-표본 비모수검정
두 집단간 평균 차이 VII Paired Sample T-Test 사전-사후 비교 t = Sd / – d0 d n di = x1i – x2i d0 = difference by H0 Sd2 = n – 1 ∑i=1n (di - )2 d degree of freedom = n - 1
두 집단간 평균 차이 VIII 두 대응집단의 T-Test 단계 <집단연습.sav> 으로 실습 Step 1 : 집단(시기)별 정규성 검정 (normality test) SPSS, 기술통계량-데이터 탐색 Shapiro-Wilk Test or Kolmogorov-Smirnov Test (H0: normal) 특히, 표본 수가 작을 때 Graphical Methods 표본 수가 크면 정규성 기각이 잘 됨 e.g. Q-Q Plot (quantile-quantile plot) Step 2 : T-Test 시행 SPSS, 평균비교-대응표본T-검정 T-value 확인 <집단연습.sav> 으로 실습
세 집단 이상 간 평균 차이 I 세 집단 이상 간 평균 차이의 분석 순서 Yes xij Normal ? No (e.g. Ordinal) SPSS, 기술통계량-데이터 탐색 One-Way ANOVA SPSS, 평균비교-일원배치 분산분석 일반선형모형-일변량 Equal Variance ? No Yes Kruskal-Wallis Test OK! Post-Hoc Analysis 검토 Equal Variance Not Assumed SPSS, 비모수검정- 독립K-표본 비모수검정
세 집단 이상 간 평균 차이 II One-Way ANOVA (analysis of variance): 일원분산분석 Assumption x11, x12, ……, x1n1 ~ iid N (μ1, σ12) x21, x22, ……, x2n2 ~ iid N (μ2, σ22) …… Xk1, xk2, ……, xknk ~ iid N (μk, σk2) 모집단 평균에 대한 가설 H0 : μ1 = μ2 = …… = μk Ha : 적어도 한 쌍은 차이가 있다. 모분산 동일성 F-검정 H0 : σ1 = σ2 = …… = σk e.g. Levene’s Test for Equality of Variance
세 집단 이상 간 평균 차이 III One-Way ANOVA 단계 Step 1 : 집단별 정규성 검정 (normality test) SPSS, 기술통계량-데이터 탐색 Shapiro-Wilk Test or Kolmogorov-Smirnov Test (H0: normal) 특히, 표본 수가 작을 때 Graphical Methods 표본 수가 크면 정규성 기각이 잘 됨 e.g. Q-Q Plot (quantile-quantile plot) Step 2 : One-Way ANOVA 시행 SPSS, 평균비교- 일원배치 분산분석 SPSS, 일반선형모형-일변량 (집단별 표본 수의 차이 큼) 분산 동일성 검정 결과의 확인 Levene’s Test for Equality of Variance Step 3: Post-Hoc Analysis (e.g. Duncan, Turkey Test) Equal variance assumed로 된 기존 결과를 해석 Equal variance not assumed로 변경 후 재분석
세 집단 이상 간 평균 차이 IV Notes on ANOVA: <ANOVA_연비.sav> 로 실습 집단 간 차이는 alphabet으로 표시 Two-Way ANOVA & Interaction term e.g. 직위, 성별, 직위*성별 ANCOVA (analysis of covariance) or ANOCOVA Covariate (i.e. metric 통제변수) 추가 MANOVA (multivariate analysis of variance) 종속변수가 여러 개 ANOVA 집단 1 (n=7) 집단 2 (n=10) 집단 3 (n=9) F-value 연비 (on road) 4.0 (a) 3.0 (b) 2.0 (c) 72.123 *** 연비 (off road) 3.5 (a) 3.3 (ab) 2.9 (b) 35.123 *** 주) + : p<0.1; * : p<0.05; ** : p<0.01; *** : p<0.001
Summary 두 독립집단간 평균 차이의 분석 두 대응집단간 평균 차이의 분석 세 집단 이상간의 평균 차이 분석 공통 사항 Independent sample T-Test Mann-Whitney U-Test 두 대응집단간 평균 차이의 분석 Wilcoxon Matched-Pairs Signed Rank Test 세 집단 이상간의 평균 차이 분석 One-way ANOVA(analysis of variance): 일원분산분석 Kruskal-Wallis Test Post-Hoc Analysis (e.g. Duncan Test, Turkey Test) 공통 사항 Normality check Levene’s test for equality of variance