제 9장 범주형 자료분석 범주형 자료분석 반응변수가 범주형인 경우 사용 분할표분석 (1) 동질성 검정 (2) 독립성 검정 (3) 연관성의 측도 (4) 심프슨의 모순
FREQ 절차의 이용 FREQ의 절차 PROC FREQ <options> ; TABLES requests</options> ; WEIGHT variables ; BY variables ; 예제 9.1) DATA SURVIVAL ; INPUT HOSP $ SURV $ COUNT @@ ; CARDS ; A DEAD 63 A ALIVE 2037 … ; RUN ; PROC FREQ ORDER=DATA ; TABLES HOSP SURV HOSP*SURV / EXPECTED CHISQ NOCOL MEASURES ; WEIGHT COUNT ; RUN;
로그선형모형과 적합성검정 반응변수가 범주형인 경우의 선형분석법 독립성검정의 기대도수를 log를 취하면 선형인 모형식 이런 모형을 이용하여 예측이 가능 주 효과만 있는 모형을 독립모형이라고 한다 교호작용까지 포함한 모형을 포화모형이라고 한다 CATMOD 절차 PROC CATMOD <options> ; BY variables ; DIRECT variables ; MODEL response_effect_=design_effects</options> ; LOGLIN effects ; POPULATION variables ; RESPONSE <function> </options> ; WEIGHT variable ;
예제 9.1) DATA SURVIVAL ; INPUT HOSP $ SURV $ COUNT @@ ; CARDS ; A DEAD 63 A ALIVE 2037 ….. ; RUN ; PROC CATMOD ; WEIGHT COUNT ; MODEL HOSP*SURV=_RESPONSE_ / ML NOGLS PRED=FREQ ; LOGIN HOSP|SURV ; LOGIN HOSP SURV ;
DATA SURVIVAL ; INPUT HOSP $ SURV $ COND $ COUNT @@; CARDS ; A D L 6 ….. ; RUN ; PROC CATMOD ; WEIGHT COUNT ; MODEL HOSP*SURV*COND=_RESPONSE_ / ML NOGLS PRED=FREQ ; LOGIN HOSP|SURV HOSP|COND SURV|COND ; LOGIN HOSP|COND SURV|COND ;
로짓모형과 로지스틱회귀 모형 로짓모형이란? 두 개의 범주를 갖는 반응변수를 범주형의 설명변수로 설명 두 범주를 취할 확률의 비가 설명변수의 수준에 따라 어떻게 달라지는지를 선형모형으로 표현한 모형 로지스틱회귀 모형 반응변수가 범주가 두 개인 경우 또는 순서형 반응범주 범주형 자료들을 연속형 설명변수들을 이용하여 설명하고자 하는 경우
예제 9.3) DATA MORT ; INPUT S D T COUNT @@ ; CARDS ; 1 1 1 41 1 1 2 12 …. ; RUN ; PROC CATMOD ; WEIGHT COUNT ; POPULATION D T ; MODEL S=D T / FREQ ML NOPROFILE ; MODEL S=D / FREQ ML NOPROFILE ; MODEL S=T / FREQ ML NOPROFILE ; QUIT ; MODEL S*D*T=_RESPONSE_ / ML PRED=FREQ ; LOGLON S|D S|T D|T ;
예제 9.3) DATA INGOTS ; INPUT HEAT SOAK READY TOTAL @@ ; CARDS ; 7 1.0 10 10 …. ; RUN ; PROC LOGISTIC ; MODEL READY / TOTAL = HEAT SOAK ; MODEL READY/TOTAL = HEAT ;