제 6장 분산분석(ANOVA) 분산분석 이란? 여러 개의 모집단의 모평균을 비교하는 분석방법 (여러가지의 처리 효과를 비교하는 분석법) 분산분석의 기본개념 처리효과를 비교하기 위하여 총변동을 처리간 변동(between variation)과 처리내 변동(within variation)으로 분해하여 두 변동의 상대적 크기를 비교하여 처리효과의 유의성을 검정 분산분석의 종류 일원 배치법, 이원배치법, 다중비교법 요인 계획법, 다변량 분산분석, 반복측정 계획법
일원배치법 일원배치법 범주형 설명변수인 요인이 하나이고, 요인은 k개의 수준을 가지고 있는 경우 각 수준에 따른 반응변수의 평균간의 유의성 검정 완전 확률화 계획법(completely randomized design) 모든 실험딘위가 확률화의 원리에 따라 랜던하게 배정되는 실험 모형과 자료구조 가설 및 검정법
ANOVA 절차(일원 배치법) PROC ANOVA <option> ; CLASS variables ; MODEL dependents = effects </options> ; MEANS effects/options ; 예제 6.1) /* ANOVA1.SAS : ONE-WAY LAYOUT */ DATA WEIGHT ; INPUT DIET $ GAIN @@ ; CARDS ; A 5.6 B 4.8 C 5.2 A 6.0 B 6.1 C 5.0 A 5.7 B 4.9 C 4.4 A 6.4 B 5.3 C 4.6 ; RUN ; PROC ANOVA ; CLASS DIET ; MODEL GAIN = DIET ; MEANS DIET ; RUN ;
이원배치법 이원배치법 범주형 설명변수인 요인이 둘이고, 각 요인은 k개와 n개의 수준을 가지고 있는 모형에서 각 수준에 따른 반응변수의 평균간의 유의성 검정 확률화 블럭 계획법(randomized block design) 처리와 블록을 결정하고 처리를 랜덤하게 적용하고 각 블럭내에서 처리의 수준이 랜덤하게 적용되는 실험 모형과 자료구조 가설 및 검정법
ANOVA 절차(이원 배치법) PROC ANOVA <option> ; CLASS variable1 variable2 ; MODEL dependents = variable1 variable2 </options> ; 예제 6.2) /* ANOVA2.SAS : TWO-WAY LAYOUT */ DATA FERTIL ; INPUT BLOCK $ TRTMENT $ YIELD WORTH @@ ; CARDS ; 1 A 32.6 112 1 B 36.4 130 1 C 29.5 106 2 A 4 2.7 139 2 B 47.1 143 2 C 32.9 112 3 A 35.3 124 3 B 40.1 134 3 C 33.6 116 ; RUN ; PROC ANOVA ; CLASS BLOCK TRTMENT ; MODEL YIELD WORTH = BLOCK TRTMENT ; RUN ;
다중비교 K개의 모평균이 모두 같다는 가설이 기각되었을 때, 어느 평균들이 서로 심각하게 차이가 있는지를 검정하는 방법 오류율 1. 실험별 오류율 2. 비교별 오류율 다중비교의 여러가지 방법 1. 튜키(Tukey)방법 2. 던칸(Duncan)방법 3. 피셔(Fisher)방법
예제 6.1) /* ANOVA3.SAS : ONE-WAY LAYOUT : MULTIPLE COMPARISION */ DATA WEIGHT ; INPUT DIET $ GAIN @@ ; CARDS ; A 5.6 B 4.8 C 5.2 A 6.0 B 6.1 C 5.0 A 5.7 B 6.1 C 4.4 A 6.4 B 5.3 C 4.6 ; RUN ; PROC ANOVA ; CLASS DIET ; MODEL GAIN=DIET ; MEANS DIET / LSD DUNCAN TUKEY ALPHA=.1 ;
INPUT BLOCK $ TRTMENT $ YIELD WORTH @@ ; CARDS ; 예제 6.2) /* ANOVA4.SAS : TWO-WAY LAYOUT : MULTIPLE COMPARISION */ DATA FERTIL ; INPUT BLOCK $ TRTMENT $ YIELD WORTH @@ ; CARDS ; 1 A 32.6 112 1 B 36.4 130 1 C 29.5 106 2 A 4 2.7 139 2 B 47.1 143 2 C 32.9 112 3 A 35.3 124 3 B 40.1 134 3 C 33.6 116 ; RUN ; PROC ANOVA ; CLASS BLOCK TRTMENT ; MODEL YIELD = BLOCK TRTMENT ; MEANS TRTMENT / LSD DUNCAN TUKEY ALPHA=.1 ; RUN ;
요인계획법 이요인 계획법(반복이 있는 이원배치법) 다요인 계획법 /* ANOVA5.SAS : TWO-WAY LAYOUT */ DATA DDD ; INPUT GROUP $ DRUG $ SCORE @@ ; CARDS ; N P 50 N R 67 N P 45 N R 60 N P 55 N R 58 N P 52 N R 65 H P 70 H R 51 H P 72 H R 57 H P 68 H R 48 H P 75 H R 55 ; RUN ; PROC ANOVA ; CLASS GROUP DRUG ; MODEL SCORE=GROUP DRUG GROUP*DRUG ; MEANS GROUP DRUG GROUP*DRUG ;
예제 6.4) /* ANOVA6.SAS : THREE-WAY FACTORIAL DESIGN */ DATA DDD ; INPUT GROUP $ DRUG $ SEX $ SCORE @@ ; CARDS ; N P M 50 N R M 67 N P F 45 N R F 60 N P M 55 N R M 58 N P F 52 N R F 65 H P M 70 H R M 51 H P F 72 H R F 57 H P M 68 H R M 48 H P F 75 H R F 55 ; RUN ; PROC ANOVA ; CLASS SEX GROUP DRUG ; MODEL SCORE=GROUP DRUG SEX SEX*GROUP SEX DRUG GROUP*DRUG ; MEANS GROUP DRUG SEX SEX*GROUP SEX*DRUG GROUP*DRUG ;
다변량 분산분석(MANOVA) 다변량 분산분석(multivariate ANOVA)이란? 각 처리수준에서의 관측값이 벡터의 형태로 주어진 경우 (즉, 반복측정과는 다른 의미) 관측값이 벡터로 나타나는 경우 - 다변량 분산분석 분산분석에서 사용되는 통계량 1. Wilks의 Lambda 2. Pillai의 Trace 3. Hotelling-Lawley의 Trace 4. Roy의 최대근
예제 6.5) DATA TUMOUR ; INPUT SEX $ TEMP $ W1 W2 W3 @@ ; CARDS ; M 4 18.15 16.51 0.24 M 20 21.27 23.30 … ; RUN ; PROC ANOVA ; CLASS SEX TEMP ; MODEL W1 W2 W3 = SEX TEMP SEX*TEMP ; MANOVA H=_ALL_ ;
반복측정계획 (REPEATED MEASURES DESIGN) 반복측정계획이란? 심리학, 의학, 약학등에서 개체가 동질적일수록 실험의 효율이 높아지는 경우 실험전과 실험후의 반응값을 동일한 개체에서 얻는 경우실험전과 실험후의 차이를 알아보는 경우를 반복측정 계획이라고 한다. ANOVA 절차 PROC ANOVA option ; CLASS variables ; MODEL dependents = independents</options> ; REPEATED factor-name levels <level-values></options> ;
예제 6.6) 반복측정된 자료의 분석 프로그램 DATA REPEAT ; INPUT GROUP $ PRETEST POSTTEST @@ ; CARDS ; C 80 83 C 85 86 C 83 88 T 82 94 T 87 93 T 84 98 ; RUN ; PROC ANOVA ; CLASS GROUP ; MODEL PRETEST POSTTEST = GROUP ; REPEATED TIME 2(0 1) ;
예제 ) 대응 비교로 분석한 프로그램 DATA REPEAT ; INPUT GROUP $ PRETEST POSTTEST @@ ; DIFF = POSTTEST-PRETEST ; CARDS ; C 80 83 C 85 86 C 83 88 T 82 94 T 87 93 T 84 98 ; RUN ; PROC TTEST ; CLASS GROUP ; VAR DIFF ;
예제 ) 반복측정된 자료를 분석하기 위한 프로그램 DATA REPEAT1 ; INPUT SUBJ GROUP $ TIME TEST @@ ; CARDS; 1 C 1 80 1 C 2 83 2 C 1 85 2 C 2 86 3 C 1 83 3 C 2 88 1 T 1 82 1 T 2 94 2 T 1 87 2 T 2 93 3 T 1 84 3 T 2 98 ; RUN ; PROC ANOVA ; CLASS GROUP SUBJ TIME ; MODEL TEST = GROUP SUBJ(GROUP) TIME GROUP*TIME ; TEST H=GROUP E = SUBJ(GROUP) ; RUN;