Download presentation
Presentation is loading. Please wait.
Published byIlse Färber Modified 6년 전
1
실습 (using SPSS) Department of Biostatistics, Samsung Biomedical Research Institute Samsung Medical Center
2
Contents Chi-square test/ Fisher’s exact test
One-way ANOVA/ Kruskal-Wallis test (Post-hoc test) Multiple linear regression analysis Multiple logistic regression analysis Repeated measurements analysis Survival analysis ← with artificial data (STELLAR TRIAL, JUPITER TRIAL)
3
Chi-square test For gender,
4
step1 분석 – 기술통계량 - 교차분석
5
step2 행, 열에 변수 지정 – 통계량 버튼 click
6
step3 통계량 : 카이제곱 check – 계속 click
7
step4 셀 button click
8
step5 셀 : 빈도 및 퍼센트 check – 계속 click
9
step6 확인 click
10
Output
11
Fisher‘s exact test For atherosclerosis,
12
step1 분석 – 기술통계량 - 교차분석
13
step2 행, 열에 변수 지정 – 통계량 버튼 click
14
step3 통계량 : 카이제곱 check – 계속 click
15
step4 셀 button click
16
step5 셀 : 빈도 및 퍼센트 check – 계속 click
17
step6 정확 button click
18
step7 정확한 검정 check – 계속 click
19
step8 확인 click
20
Output
21
(참고) For BMI group (>30) step1 연속형 변수 -> 범주형 변수
step3 카이제곱 검정 / Fisher’s exact test
22
연속형 변수 -> 범주형 변수
23
Step1 변환 – 다른 변수로 코딩 변경
24
Step2 BMI를 출력변수 박스에 넘김 – 출력변수이름 입력 – 바꾸기 click
25
Step3 기존값 및 새로운 값 click
26
Step4 최저값에서 다음 값까지 범위 check – 30 입력 – 새로운 값에 0 입력
27
Step5 추가 click
28
Step6 기타 모든 값 check – 새로운 값에 1 입력
29
Step7 추가 click – 계속 click
30
Step8 확인 click
31
Output
32
One-way ANOVA Comparison of percent change in LDL cholesterol from baseline to 6 weeks among 4 groups <- Assumption for normality ; satisfied Equal variance assumption; satisfied
33
Assumption for normality
Normality of percent change in LDL cholesterol for each drug group
34
Step1 분석 – 기술통계량 – 데이터 탐색
35
Step2 종속변수에 “연속형 변수(percent)”, 요인에 “범주형 변수(drug)를 넘김 – 도표 click
36
Step3 검정과 함께 정규성 도표 check – 계속 click
37
Step4 확인 click
38
Output
39
Equal variance assumption
Equal variance of percent change in LDL cholesterol among drug groups
40
Step1 분석 – 기술통계량 – 데이터 탐색
41
Step2 종속변수에 “연속형 변수(percent)”, 요인에 “범주형 변수(drug)를 넘김 – 도표 click
42
Step3 Levene 검정이 있는 평균 산포 : 제곱갑 추정 check - 계속 click
43
Step4 확인 click
44
Output
45
Assumption for normality ; satisfied
Equal variance assumption; satisfied
46
One-way ANOVA Comparison of percent change in LDL cholesterol from baseline to 6 weeks among 4 groups
47
Step1 분석 – 평균 비교 – 일원배치 분산분석
48
Step2 종속변수에 “연속형 변수(percent)”, 요인에 “범주형 변수(drug)” 넘김
BUT, 문자로 coding된 “drug” 변수는 일원배치 분산분석-변수 목록에 활성화 되지 않음 -> 숫자로 다시 recording 필요
49
(참고) 문자 -> 숫자 record Step1 : 변환 – 다른 변수로 코딩 변경
50
(참고) 문자 -> 숫자 record Step2 : 기존값 및 새로운 값 click
51
(참고) 문자 -> 숫자 record Step3 : 기존값 및 새로운 값 입력 – 추가 click – 계속 click
52
(참고) 문자 -> 숫자 record Step3 : 확인 click ………
53
Step2 종속변수에 “연속형 변수(percent)”, 요인에 “범주형 변수(drug_1)” 넘김
54
Step3 확인 click
55
Output
56
Post-hoc test Tukey’s test
57
Step1 일원배치 분산분석: 사후분석 click
58
Step2 Tukey 방법 check – 계속 click
59
Step3 확인 click
60
Output (1:R, 2:A, 3:S, P:4)
61
(참고) Kruskal-Wallis test
Comparison of percent change in LDL cholesterol from baseline to 6 weeks among 4 groups
62
Step1 분석 – 비모수 검정 – 독립 K 표본
63
Step2 검정변수에 “연속형변수(percent)”, 집단 변수에 “범주형변수(drug_1)” 를 넘김
64
Step3 집단정의 click – 집단변수의 범위 지정
65
Step4 확인 click
66
Output
67
Post-hoc test Tukey’s test using ranks
68
Step1 Rank 부여: 변환 – 순위변수 생성
69
Step2 “연속형 변수(percent)”를 변수 box에 넘김 - 확인 click
70
Step3 분석 – 평균비교 – 일원배치 분산분석 – “생성된 순위 변수(Rpercent)”를 종속변수에 넘김
71
Step4 사후분석 click – Tukey 방법 check – 계속 click
72
Step5 확인 click
73
Output
74
(참고) Dunnett’s test 분석 – 평균비교 – 일원배치 분산분석 – 사후분석 – Dunnett check
75
Multiple linear regression
Comparison of percent change in LDL cholesterol adjusting for age
76
Step1 분석 – 일반선형모형 - 일변량
77
Step2 종속변수에 “percent(연속형 변수)”, 모수 요인에 “drug(범주형 변수)”, 공변량에 “age(연속형 변수)”를 넘김
78
Step3 모형 click – 사용자 정의 check
79
Step4 항 설정: “주효과”로 바꿈 – drug, age 변수 넘김
80
Step5 확인 click
81
Output
82
어느 그룹간 차이가 있는가? Reference category :R ←
Step1: recording (A:1, P:2, S:3, R:4)하여 drug_gr 변수 생성 Step2: 분석 – 일반선형 모형 – 일변량 – 옵션 click
83
Step3 : drug_gr을 평균 출력기준에 넘김-모수 추정값 check – 계속 click
84
Step4 : 확인 click
85
Output (A:1, P:2, S:3, R:4) A(1) vs R(4); p=0.034*3=0.102
P(2) vs R(4); p=<0.001*3=0.001 S(3) vs R(4); p=<0.001*3=0.001
86
Multiple logistic regression
Hypothesis: There is a difference of the proportion of percent change (>30%) between between rosuvastatin and each of other groups adjusting for covariates (Multivariable analysis)
87
Step1 분석 – 회귀분석 – 이분형 로지스틱
88
Step2 종속변수에 percent_1(if >30 : 1, else 0), 공변량에 drug_gr(A:1, P:2, S:3, R:4), age(연속형 변수)를 넘김
89
Step3 범주형 click – drug_gr변수를 범주형 공변량에 넘김 – 계속 click
90
Step4 옵션 click – exp(B)에 대한 신뢰구간 check - 98.3(=1-0.05/3) 입력 – 계속 click
91
Output
92
Output Group 1 vs 4 (A vs R); p=0.699*3=1.000
Group 2 vs 4 (P vs R); p<0.001*3=0.003 Group 3 vs 4 (S vs R); p=0.001*3=0.003 adjusted 95% CI for OR (1-0.05/3)*100% CI로 수정되었음
93
Repeated measures ANOVA
Ex1) 복압성 요실금 환자(≤55, >55)를 대상으로 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의 스트레스 설문지를 이용하여 스트레스 점수를 측정
94
가설: 시간에 따른 스트레스 점수 변화 양상은 연령 두 군간에 (55세 이하, 초과) 다르다. (교호작용 효과 검정) 연령군이 일정할 때, 시간에 따라 스트레스 점수가 다르다. 시간이 일정할 때, 연령 두 군간에 스트레스 점수가 다르다.
95
N=16 (complete data without missing)
Outcome variable (Continuous type) : 스트레스 점수 Independent variable : age(55세 이하, 초과), time(개월)
96
Method : Repeated measures ANOVA
97
Step1 분석 > 일반선형모형 > 반복측정
98
Step2 수준의 수에 반복측정회수를 입력함 – 추가 click
99
Step3 반복측정 변수를 개체 내 변수에, 범주형 변수인 age_1(≤55, >55)를 개체 간 요인에 넘김
100
Step4 모형 click – 사용자 정의 check – 개체 내 모형에 “요인1”, 개체간 모형에 “age_1”
101
Step5 도표 click – “요인1”을 수평축 변수에, age_1을 선구분 변수에 넘김 – 추가 click
102
Output
103
Output 구형성 가정 test P-value > 0.05 ; 구형성 가정 만족
104
Output-> 일변량 분석 연령군이 일정할 때, 시간에 따라 스트레스 점수는 다르다고 할 수 있음
(P-value = 0.021) Interaction effect(교호작용 효과) : 시간에 따른 스트레스 점수 변화 양상은 연령 두 군간 (55세 이하, 초과) 다르다고 할 수 없다. (P-value = 0.506)
105
시간이 일정할 때, 연령 두 군간(55세 이하, 초과) 스트레스 점수는 다르다고 할 수 있다. (P-value= 0.048)
106
Mixed model Ex1) 복압성 요실금 환자를(≤55, >55) 대상으로 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의 스트레스 설문지를 이용하여 스트레스 점수를 측정
107
N=21 (data with missing) Outcome variable : 스트레스 점수 Independent variable : age(55세 이하, 초과), time(개월)
108
시간에 따른 스트레스 점수 변화 양상은 연령 두 군간에 (55세 이하, 초과) 다르다.
분석 가설 시간에 따른 스트레스 점수 변화 양상은 연령 두 군간에 (55세 이하, 초과) 다르다. (Interaction effect(교호작용 효과) 검정) → Analysis using Mixed model Random effect : patient effect : due to Much variability between patients Fixed effect : age(55세 초과, 이하), time correlation structure : Ar(1)
109
Step1 자료 구조 변환
111
Step2 분석 - 혼합 모형 – 선형 – id를 개체에, visit(time을 나타내는 변수)를 반복에 넘김
112
Step3 상관구조(AR(1)) 선택 – 계속 click
113
Step4 “Stress_score”를 종속변수에 age_1(55세 이하, 초과), visit(time 변수)를 요인분석에 넘김
114
Step5 고정 click – age_1, visit 변수를 Ctrl키를 이용하여 지정 – “추가” 버튼을 이용하여 모형 box에 넘김
115
Step6 임의 click – 절편 포함 check - 개체 집단: id 변수를 개체에 넘김
116
Output
117
GEE(Generalized Estimating Equation)
Ex2) 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의스트레스 설문지를 이용하여 스트레스 완화 여부를 측정 가설: 시간에 따른 스트레스 완화 가능성 변화 양상은 연령 두 군간 (55세 이하,초과) 다르다 Outcome variable : 1개월, 3개월, 6개월, 9개월, 12개월 마다 스트레스 완화 여부 측정 Independent variable : 연령 (55세 이하, 초과), time
118
→ Analysis using Generalized estimating equation (GEE)
120
Step1 분석 - 일반화 선형 모형 - 일반화 추정 방정식
121
Step2 개체변수 box에 “Id” 변수를, 개체내 변수에 “visit(time변수)”를 넘김 – 상관행렬(AR(1)) 지정
122
Step3 모형 유형: 이분형 로지스틱 check
123
Step4 응답: 종속변수에 “stress(유:1, 무:0)”를 넘김 – 참조범주 click – “처음” check
124
Step5 예측: 요인분석에 age_1, visit변수를 넘김
125
Step6 모형: 항 설정을 요인으로 바꿈 - age_1, visit변수를 Ctrl키를 이용하여 block 지정 후 모형에 넘김
126
Output
127
Survival analysis Kaplan-Meier 방법: 생존율 추정
Log rank test : 생존 curves간 비교 Cox regression analysis Time dependent Cox regression analysis
128
(Artificial) Data (JUPITER)
fx time event BMI group 1 7 23 placebo 21 8 22 10 28 30 2 46 27 50 53 63 24 59 60 5 20 18 9 rosuvastatin 25 34 35 33 6
129
Kaplan-Meier method ← 생존율 추정
130
Step1 분석 – 생존 확률 – Kaplan Meier 생존분석
131
Step2 Time을 시간변수에, event를 상태 변수에 넘김 – 사건 정의 click
132
Step3 단일값에 event를 코딩한 값(=1)을 입력- 계속 click
133
Step4 요인에 group 변수 넘김
134
Step5 옵션 click – 도표: 생존 click – 계속 click
135
Output
136
Log rank test ← 그룹 간 survival curve 비교
137
Step1 분석 – 생존 확률 – Kaplan Meier 생존분석
138
Step2 Time을 시간변수에, event를 상태 변수에 넘김 – 사건 정의 click
139
Step3 단일값에 event를 코딩한 값(=1)을 입력- 계속 click
140
Step4 요인에 group 변수 넘김
141
Step5 요인비교 click – Log 순위 check
142
Step6 옵션 click – 도표: 생존 check – 계속 click
143
Step7 확인 click
144
Output
145
Cox regression analysis
First occurrence of a major event에 대한 위험인자 분석 Rosuvastatin의 효과를 다른 인자 (fx, BMI, …)를 보정 후 분석
146
Step1 분석 – 생존 확률 – Cox 회귀 모형
147
Step2 시간에 time, 상태 변수에 event, 공변량에 BMI, group, fx변수를 넘김 – 범주형 click
148
Step3 fx(숫자로 코딩된 범주형 변수)를 범주형 공변량 box에 넘김 – 계속 click (참고)
문자형으로 coding되어 있는 group 변수는 자동으로 범주형 공변량으로 지정됨
149
Step4 옵션 click
150
Step5 Exp(B)의 CI check – 계속 click
151
Step6 확인 click
152
Output
153
PH 가정 check Graphical approach Survival curve
Log(-log(survival)) curve Statistical test
154
Step1 : Graphical approach
분석 – 생존 확률 – Cox 회귀 모형
155
Step2 : Graphical approach
시간에 time, 상태 변수에 event, 공변량에 BMI, group, fx변수를 넘김 – 도표 click
156
Step3 : Graphical approach
생존 확률, 로그-로그 check – 계속 click - Group을 선구분 집단변수에 넘김
157
Step4 : Graphical approach
확인 click
158
Log(-log(survival)) curve
Output Survival curves Log(-log(survival)) curve
159
Step1 : Statistical approach
분석 – 생존 확률 – Cox 회귀 모형
160
Step2 : Statistical approach
시간에 time, 상태 변수에 event, 공변량에 BMI, group, fx변수를 넘김 – 저장 click
161
Step3 : Statistical approach
편잔차 check – 계속 click
162
Step4 : Statistical approach
확인 click Data view variable view
163
Step5 : Statistical approach
분석 – 상관분석 – 이변량 상관계수
164
Step6 : Statistical approach
Time, 편잔차 fx, 편잔차 BMI, 편잔차 group 변수를 변수 box에 넘김 – Spearman check – 확인 click
165
Output
166
(참고) Time dependent Cox regression analysis
167
Step1 T_를 T_cov의 표현식 box에 넘김
168
Step2 T_를 T_cov의 표현식 box에 넘김 – 모형 click
169
Step3 시간에 time, 상태변수에 event, 공변량에 fx, BMI, group, T_cov*group를 넘김
-> T_cov와 group변수를 Ctrl키를 이용하여 block지정 후, a*b 버튼을 이용하여 넘김
170
Step4 범주형 click
171
Step5 범주형 click – fx(숫자로 코딩된 범주형 변수) 넘김 - 계속
172
Step6 옵션 click – exp(B)의 CI 체크 - 계속
173
Step7 확인 click
174
Output
Similar presentations