실습 (using SPSS) Department of Biostatistics, Samsung Biomedical Research Institute Samsung Medical Center
Contents Chi-square test/ Fisher’s exact test One-way ANOVA/ Kruskal-Wallis test (Post-hoc test) Multiple linear regression analysis Multiple logistic regression analysis Repeated measurements analysis Survival analysis ← with artificial data (STELLAR TRIAL, JUPITER TRIAL)
Chi-square test For gender,
step1 분석 – 기술통계량 - 교차분석
step2 행, 열에 변수 지정 – 통계량 버튼 click
step3 통계량 : 카이제곱 check – 계속 click
step4 셀 button click
step5 셀 : 빈도 및 퍼센트 check – 계속 click
step6 확인 click
Output
Fisher‘s exact test For atherosclerosis,
step1 분석 – 기술통계량 - 교차분석
step2 행, 열에 변수 지정 – 통계량 버튼 click
step3 통계량 : 카이제곱 check – 계속 click
step4 셀 button click
step5 셀 : 빈도 및 퍼센트 check – 계속 click
step6 정확 button click
step7 정확한 검정 check – 계속 click
step8 확인 click
Output
(참고) For BMI group (>30) step1 연속형 변수 -> 범주형 변수 step3 카이제곱 검정 / Fisher’s exact test
연속형 변수 -> 범주형 변수
Step1 변환 – 다른 변수로 코딩 변경
Step2 BMI를 출력변수 박스에 넘김 – 출력변수이름 입력 – 바꾸기 click
Step3 기존값 및 새로운 값 click
Step4 최저값에서 다음 값까지 범위 check – 30 입력 – 새로운 값에 0 입력
Step5 추가 click
Step6 기타 모든 값 check – 새로운 값에 1 입력
Step7 추가 click – 계속 click
Step8 확인 click
Output
One-way ANOVA Comparison of percent change in LDL cholesterol from baseline to 6 weeks among 4 groups <- Assumption for normality ; satisfied Equal variance assumption; satisfied
Assumption for normality Normality of percent change in LDL cholesterol for each drug group
Step1 분석 – 기술통계량 – 데이터 탐색
Step2 종속변수에 “연속형 변수(percent)”, 요인에 “범주형 변수(drug)를 넘김 – 도표 click
Step3 검정과 함께 정규성 도표 check – 계속 click
Step4 확인 click
Output
Equal variance assumption Equal variance of percent change in LDL cholesterol among drug groups
Step1 분석 – 기술통계량 – 데이터 탐색
Step2 종속변수에 “연속형 변수(percent)”, 요인에 “범주형 변수(drug)를 넘김 – 도표 click
Step3 Levene 검정이 있는 평균 산포 : 제곱갑 추정 check - 계속 click
Step4 확인 click
Output
Assumption for normality ; satisfied Equal variance assumption; satisfied
One-way ANOVA Comparison of percent change in LDL cholesterol from baseline to 6 weeks among 4 groups
Step1 분석 – 평균 비교 – 일원배치 분산분석
Step2 종속변수에 “연속형 변수(percent)”, 요인에 “범주형 변수(drug)” 넘김 BUT, 문자로 coding된 “drug” 변수는 일원배치 분산분석-변수 목록에 활성화 되지 않음 -> 숫자로 다시 recording 필요
(참고) 문자 -> 숫자 record Step1 : 변환 – 다른 변수로 코딩 변경
(참고) 문자 -> 숫자 record Step2 : 기존값 및 새로운 값 click
(참고) 문자 -> 숫자 record Step3 : 기존값 및 새로운 값 입력 – 추가 click – 계속 click
(참고) 문자 -> 숫자 record Step3 : 확인 click ………
Step2 종속변수에 “연속형 변수(percent)”, 요인에 “범주형 변수(drug_1)” 넘김
Step3 확인 click
Output
Post-hoc test Tukey’s test
Step1 일원배치 분산분석: 사후분석 click
Step2 Tukey 방법 check – 계속 click
Step3 확인 click
Output (1:R, 2:A, 3:S, P:4)
(참고) Kruskal-Wallis test Comparison of percent change in LDL cholesterol from baseline to 6 weeks among 4 groups
Step1 분석 – 비모수 검정 – 독립 K 표본
Step2 검정변수에 “연속형변수(percent)”, 집단 변수에 “범주형변수(drug_1)” 를 넘김
Step3 집단정의 click – 집단변수의 범위 지정
Step4 확인 click
Output
Post-hoc test Tukey’s test using ranks
Step1 Rank 부여: 변환 – 순위변수 생성
Step2 “연속형 변수(percent)”를 변수 box에 넘김 - 확인 click
Step3 분석 – 평균비교 – 일원배치 분산분석 – “생성된 순위 변수(Rpercent)”를 종속변수에 넘김
Step4 사후분석 click – Tukey 방법 check – 계속 click
Step5 확인 click
Output
(참고) Dunnett’s test 분석 – 평균비교 – 일원배치 분산분석 – 사후분석 – Dunnett check
Multiple linear regression Comparison of percent change in LDL cholesterol adjusting for age
Step1 분석 – 일반선형모형 - 일변량
Step2 종속변수에 “percent(연속형 변수)”, 모수 요인에 “drug(범주형 변수)”, 공변량에 “age(연속형 변수)”를 넘김
Step3 모형 click – 사용자 정의 check
Step4 항 설정: “주효과”로 바꿈 – drug, age 변수 넘김
Step5 확인 click
Output
어느 그룹간 차이가 있는가? Reference category :R ← Step1: recording (A:1, P:2, S:3, R:4)하여 drug_gr 변수 생성 Step2: 분석 – 일반선형 모형 – 일변량 – 옵션 click
Step3 : drug_gr을 평균 출력기준에 넘김-모수 추정값 check – 계속 click
Step4 : 확인 click
Output (A:1, P:2, S:3, R:4) A(1) vs R(4); p=0.034*3=0.102 P(2) vs R(4); p=<0.001*3=0.001 S(3) vs R(4); p=<0.001*3=0.001
Multiple logistic regression Hypothesis: There is a difference of the proportion of percent change (>30%) between between rosuvastatin and each of other groups adjusting for covariates (Multivariable analysis)
Step1 분석 – 회귀분석 – 이분형 로지스틱
Step2 종속변수에 percent_1(if >30 : 1, else 0), 공변량에 drug_gr(A:1, P:2, S:3, R:4), age(연속형 변수)를 넘김
Step3 범주형 click – drug_gr변수를 범주형 공변량에 넘김 – 계속 click
Step4 옵션 click – exp(B)에 대한 신뢰구간 check - 98.3(=1-0.05/3) 입력 – 계속 click
Output
Output Group 1 vs 4 (A vs R); p=0.699*3=1.000 Group 2 vs 4 (P vs R); p<0.001*3=0.003 Group 3 vs 4 (S vs R); p=0.001*3=0.003 adjusted 95% CI for OR (1-0.05/3)*100% CI로 수정되었음
Repeated measures ANOVA Ex1) 복압성 요실금 환자(≤55, >55)를 대상으로 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의 스트레스 설문지를 이용하여 스트레스 점수를 측정
가설: 시간에 따른 스트레스 점수 변화 양상은 연령 두 군간에 (55세 이하, 초과) 다르다. (교호작용 효과 검정) 연령군이 일정할 때, 시간에 따라 스트레스 점수가 다르다. 시간이 일정할 때, 연령 두 군간에 스트레스 점수가 다르다.
N=16 (complete data without missing) Outcome variable (Continuous type) : 스트레스 점수 Independent variable : age(55세 이하, 초과), time(개월)
Method : Repeated measures ANOVA
Step1 분석 > 일반선형모형 > 반복측정
Step2 수준의 수에 반복측정회수를 입력함 – 추가 click
Step3 반복측정 변수를 개체 내 변수에, 범주형 변수인 age_1(≤55, >55)를 개체 간 요인에 넘김
Step4 모형 click – 사용자 정의 check – 개체 내 모형에 “요인1”, 개체간 모형에 “age_1”
Step5 도표 click – “요인1”을 수평축 변수에, age_1을 선구분 변수에 넘김 – 추가 click
Output
Output 구형성 가정 test P-value > 0.05 ; 구형성 가정 만족
Output-> 일변량 분석 연령군이 일정할 때, 시간에 따라 스트레스 점수는 다르다고 할 수 있음 (P-value = 0.021) Interaction effect(교호작용 효과) : 시간에 따른 스트레스 점수 변화 양상은 연령 두 군간 (55세 이하, 초과) 다르다고 할 수 없다. (P-value = 0.506)
시간이 일정할 때, 연령 두 군간(55세 이하, 초과) 스트레스 점수는 다르다고 할 수 있다. (P-value= 0.048)
Mixed model Ex1) 복압성 요실금 환자를(≤55, >55) 대상으로 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의 스트레스 설문지를 이용하여 스트레스 점수를 측정
N=21 (data with missing) Outcome variable : 스트레스 점수 Independent variable : age(55세 이하, 초과), time(개월)
시간에 따른 스트레스 점수 변화 양상은 연령 두 군간에 (55세 이하, 초과) 다르다. 분석 가설 시간에 따른 스트레스 점수 변화 양상은 연령 두 군간에 (55세 이하, 초과) 다르다. (Interaction effect(교호작용 효과) 검정) → Analysis using Mixed model Random effect : patient effect : due to Much variability between patients Fixed effect : age(55세 초과, 이하), time correlation structure : Ar(1)
Step1 자료 구조 변환
Step2 분석 - 혼합 모형 – 선형 – id를 개체에, visit(time을 나타내는 변수)를 반복에 넘김
Step3 상관구조(AR(1)) 선택 – 계속 click
Step4 “Stress_score”를 종속변수에 age_1(55세 이하, 초과), visit(time 변수)를 요인분석에 넘김
Step5 고정 click – age_1, visit 변수를 Ctrl키를 이용하여 지정 – “추가” 버튼을 이용하여 모형 box에 넘김
Step6 임의 click – 절편 포함 check - 개체 집단: id 변수를 개체에 넘김
Output
GEE(Generalized Estimating Equation) Ex2) 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의스트레스 설문지를 이용하여 스트레스 완화 여부를 측정 가설: 시간에 따른 스트레스 완화 가능성 변화 양상은 연령 두 군간 (55세 이하,초과) 다르다 Outcome variable : 1개월, 3개월, 6개월, 9개월, 12개월 마다 스트레스 완화 여부 측정 Independent variable : 연령 (55세 이하, 초과), time
→ Analysis using Generalized estimating equation (GEE)
Step1 분석 - 일반화 선형 모형 - 일반화 추정 방정식
Step2 개체변수 box에 “Id” 변수를, 개체내 변수에 “visit(time변수)”를 넘김 – 상관행렬(AR(1)) 지정
Step3 모형 유형: 이분형 로지스틱 check
Step4 응답: 종속변수에 “stress(유:1, 무:0)”를 넘김 – 참조범주 click – “처음” check
Step5 예측: 요인분석에 age_1, visit변수를 넘김
Step6 모형: 항 설정을 요인으로 바꿈 - age_1, visit변수를 Ctrl키를 이용하여 block 지정 후 모형에 넘김
Output
Survival analysis Kaplan-Meier 방법: 생존율 추정 Log rank test : 생존 curves간 비교 Cox regression analysis Time dependent Cox regression analysis
(Artificial) Data (JUPITER) fx time event BMI group 1 7 23 placebo 21 8 22 10 28 30 2 46 27 50 53 63 24 59 60 5 20 18 9 rosuvastatin 25 34 35 33 6
Kaplan-Meier method ← 생존율 추정
Step1 분석 – 생존 확률 – Kaplan Meier 생존분석
Step2 Time을 시간변수에, event를 상태 변수에 넘김 – 사건 정의 click
Step3 단일값에 event를 코딩한 값(=1)을 입력- 계속 click
Step4 요인에 group 변수 넘김
Step5 옵션 click – 도표: 생존 click – 계속 click
Output
Log rank test ← 그룹 간 survival curve 비교
Step1 분석 – 생존 확률 – Kaplan Meier 생존분석
Step2 Time을 시간변수에, event를 상태 변수에 넘김 – 사건 정의 click
Step3 단일값에 event를 코딩한 값(=1)을 입력- 계속 click
Step4 요인에 group 변수 넘김
Step5 요인비교 click – Log 순위 check
Step6 옵션 click – 도표: 생존 check – 계속 click
Step7 확인 click
Output
Cox regression analysis First occurrence of a major event에 대한 위험인자 분석 Rosuvastatin의 효과를 다른 인자 (fx, BMI, …)를 보정 후 분석
Step1 분석 – 생존 확률 – Cox 회귀 모형
Step2 시간에 time, 상태 변수에 event, 공변량에 BMI, group, fx변수를 넘김 – 범주형 click
Step3 fx(숫자로 코딩된 범주형 변수)를 범주형 공변량 box에 넘김 – 계속 click (참고) 문자형으로 coding되어 있는 group 변수는 자동으로 범주형 공변량으로 지정됨
Step4 옵션 click
Step5 Exp(B)의 CI check – 계속 click
Step6 확인 click
Output
PH 가정 check Graphical approach Survival curve Log(-log(survival)) curve Statistical test
Step1 : Graphical approach 분석 – 생존 확률 – Cox 회귀 모형
Step2 : Graphical approach 시간에 time, 상태 변수에 event, 공변량에 BMI, group, fx변수를 넘김 – 도표 click
Step3 : Graphical approach 생존 확률, 로그-로그 check – 계속 click - Group을 선구분 집단변수에 넘김
Step4 : Graphical approach 확인 click
Log(-log(survival)) curve Output Survival curves Log(-log(survival)) curve
Step1 : Statistical approach 분석 – 생존 확률 – Cox 회귀 모형
Step2 : Statistical approach 시간에 time, 상태 변수에 event, 공변량에 BMI, group, fx변수를 넘김 – 저장 click
Step3 : Statistical approach 편잔차 check – 계속 click
Step4 : Statistical approach 확인 click Data view variable view
Step5 : Statistical approach 분석 – 상관분석 – 이변량 상관계수
Step6 : Statistical approach Time, 편잔차 fx, 편잔차 BMI, 편잔차 group 변수를 변수 box에 넘김 – Spearman check – 확인 click
Output
(참고) Time dependent Cox regression analysis
Step1 T_를 T_cov의 표현식 box에 넘김
Step2 T_를 T_cov의 표현식 box에 넘김 – 모형 click
Step3 시간에 time, 상태변수에 event, 공변량에 fx, BMI, group, T_cov*group를 넘김 -> T_cov와 group변수를 Ctrl키를 이용하여 block지정 후, a*b 버튼을 이용하여 넘김
Step4 범주형 click
Step5 범주형 click – fx(숫자로 코딩된 범주형 변수) 넘김 - 계속
Step6 옵션 click – exp(B)의 CI 체크 - 계속
Step7 확인 click
Output