Download presentation
Presentation is loading. Please wait.
Published by정남 내 Modified 6년 전
1
PASW 17.0 활용하기 일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
2
내용 자료 입력하기, 저장하기 엑셀로 입력된 자료 불러오기 실제 분석 절차 및 결과 제시
S/W : PASW (Predictive Analytics Software) 17.0
3
초기 화면
4
자료 입력 및 저장하기 PASW에서 Data 직접 입력하기 입력한 변수 정보 확인하기 Data 저장하기
5
자료 입력 하기 PASW에서 Data 직접 입력하기
6
Step1
7
Step2
8
Step2
9
Step2 클릭 !!!
10
Step2
11
Step2
12
Step2
13
Tip. 문자형 자료 입력하기 클릭 !!!
14
Tip. 문자형 자료 입력하기
15
Tip. 문자형 자료 입력하기
16
Tip. 문자형 자료 입력하기
17
입력한 변수 정보 확인하기
18
파일 > 데이터 파일 정보 표시 > 작업 파일
20
Data 저장하기 -> ***.sav
21
Step1 파일 > 저장
22
Step2: 경로 지정
23
Step3 : 파일 이름 입력
25
Tip. Excel로 저장하기 저장 유형을 (*.xls)로 바꿔 준다
26
자료 불러오기 엑셀로 입력된 자료 불러오기
27
엑셀 자료
28
Step1 파일 > 열기 > 데이터
29
Step2 : 파일 유형 지정
30
Step3 : 불러올 파일 이름 지정 -> 열기
31
Step4 : 워크시트 지정 -> 확인
33
연관성 분석
34
Example 1-1 Ex) 흡연상태(C, P, N)와 폐암 발생간 연관성 환자군 정상군 total C 28 (80%)
(53%) 7 (20%) (22%) 35 P 20 (67%) (38%) 10 (33%) (31%) 30 N 5 (25%) (9%) 15 (75%) (47%) 53 32 85
35
가설 : 흡연 상태간 폐암 발생 비율이 차이가 있다.
가설 : 폐암군과 정상군간 흡연상태 비율이 차이가 있다.
36
-> Chi-square test, Fisher’s exact test 수행
37
분석할 자료 불러오기
38
분석 절차 가중치 부여하기 Chi-Square test or Fisher’s Exact test 수행
39
가중치 부여 :Step1 데이터 > 가중 케이스 39
40
가중치 부여 :Step2 40
41
가중치 부여 :Step2 41
42
Output
43
Chi-square test, Fisher’s exact test :Step1
분석 > 기술통계량 > 교차분석 43
44
Chi-square test, Fisher’s exact test :Step2
44
45
Chi-square test, Fisher’s exact test :Step2
클릭 !!! 45
46
Chi-square test, Fisher’s exact test :Step3
46
47
Chi-square test, Fisher’s exact test :Step4
클릭 !!! 47
48
Chi-square test, Fisher’s exact test :Step4
48
49
Output : 빈도분포표
50
Output : 카이제곱 검정 결과
51
Example 1-2 Ex) 하루 흡연량(0, <=10/day, >10/day)과 폐암 발생 여부간 연관성
52
Example 1-2 가설 : 세 군(흡연량)간 폐암 발생 비율이 다르다. 가설 : 폐암군과 정상군간 흡연량 비율이 다르다.
가설 : 하루 흡연량이 많을수록 폐암 발생 비율이 높다. 가설 : 폐암군은 정상군보다 흡연량이 많다.
53
가설 : 세 군(흡연량)간 폐암 발생 비율이 다르다.
가설 : 폐암군과 정상군간 흡연량 비율이 다르다. Chi-square test, Fisher’s exact test
54
가설 : 하루 흡연량이 많을수록 폐암 발생 비율이 높다.
Cochran-Armitage test
55
분석 절차 문자형 변수 Group(정상군, 환자군)을 숫자형 변수로 바꾸기 가중치 부여하기
Cochran-Armitage test 수행
56
데이터 변환 - 문자 -> 숫자: Step1
변환 > 다른 변수로 코딩변경
57
데이터 변환 - 문자 -> 숫자 : Step2
58
데이터 변환 - 문자 -> 숫자 : Step2
59
데이터 변환 - 문자 -> 숫자 : Step3
60
데이터 변환 - 문자 -> 숫자 : Step3
61
Data 변환 결과
62
가중치 부여:Step1 데이터 > 가중 케이스 62
63
가중치 부여:Step2 63
64
가중치 부여:Step2 64
65
Output
66
Cochran-Armitage test: Step1
분석 > 기술통계량 > 교차분석 66
67
Cochran-Armitage test: Step2
67
68
Cochran-Armitage test: Step2
클릭 !!! 68
69
Cochran-Armitage test: Step3
69
70
Cochran-Armitage test: Step4
클릭 !!! 70
71
Cochran-Armitage test: Step5
71
72
Output : 빈도분포표
73
Output : 분석결과
74
가설 : 폐암군은 정상군보다 흡연량이 많다. Mann-Whitney test
75
분석 절차 가중치 부여하기 Mann-Whitney test 수행
76
Mann-Whitney test: Step1
분석 > 분산분석 > 비모수적 검정 > 독립 2 표본 76
77
Mann-Whitney test: Step2
78
Mann-Whitney test: Step2
79
Mann-Whitney test: Step3
클릭 !!!
80
Output
81
Example 1-3 Ex) 하루 흡연량(0, <=10/day, >10/day)과 BP level (SBP;
<130, 130<= < 150, >=150)간 연관성 가설 : 세 군(흡연량)간 BP level 비율이 다르다 가설 : 흡연량이 많을수록 BP level이 높은가
83
가설 : 세 군(흡연량)간 BP level 비율이 다르다.
Chi-square test, Fisher’s Exact test
84
-> 기대돗수 check If expected count less than 5, Fisher’s Exact test
85
분석 절차 가중치 부여하기 Fisher’s Exact test 수행
86
Fisher’s exact test: Step1
분석 > 기술통계량 > 교차분석
87
Fisher’s exact test: Step2
클릭 !!! 87
88
Fisher’s exact test: Step3
89
Fisher’s exact test: Step4
클릭 !!! 89
90
Fisher’s exact test: Step5
91
Fisher’s exact test: Step6
클릭 !!! 91
92
Fisher’s exact test: Step7
93
Output 93
94
Output 94
95
가설 : 흡연량이 많을수록 BP level이 높은가
Spearman’s correlation analysis
96
분석 절차 가중치 부여하기 Spearman’s correlation analysis 수행
97
Spearman’s correlation analysis: Step1
분석 > 상관분석 > 이변량 상관계수 97
98
Spearman’s correlation analysis: Step2
클릭 !!! 98
99
Spearman’s correlation analysis: 결과
99
100
Example 1-4 Ex) Venography와 Thermography간 진단결과 비교 (Paired design)
양성비율이 다르다.
101
……………………
102
-> McNemar’s test 적용
103
McNemar’s Test: Step1 분석 > 기술통계량 > 교차분석
104
McNemar’s Test: Step2 클릭 !!! 104
105
McNemar’s Test: Step3 클릭 !!! 105
106
McNemar’s Test: 분석결과 106
107
Example 2-1(1) Ex) 폐암 발생 여부와 하루 흡연량(개피/day)간 연관성
가설 : 폐암 환자군과 정상군간 하루 흡연량이 다른가
109
Two sample t-test, Mann-Whitney test
정규성 체크! - If yes, Two-sample t-test 적용 - If no, Mann-Whitney test 적용
110
정규성 check/ 기술통계: Step1 분석 > 기술통계량 > 데이터 탐색
111
정규성 check / 기술통계: Step2 클릭 !!!
112
정규성 check / 기술통계: Step3
113
정규성 check / 기술통계: Step4 클릭 !!!
114
정규성 check / 기술통계: Step5
115
정규성 check / 기술통계: 분석결과
116
정규성 check / 기술통계: 분석결과
117
모수적 방법인 Two Sample t-test 적용
각 군에서 자료값들이 정규 분포를 따르는가 -> yes 모수적 방법인 Two Sample t-test 적용
118
T-test: Step1 분석 > 평균 비교 > 독립 표본 T 검정
119
T-test: Step2
120
T-test: Step3
121
T-test: 분석결과
122
Example 2-1(2) Ex) 폐암 발생 여부와 하루 흡연량(개피/day)간 연관성
가설 : 폐암 환자군과 정상군간 하루 흡연량이 다른가
124
Two sample t-test, Mann-Whitney test
정규성 체크! -> If no, Mann-Whitney test 적용
125
Mann-Whitney test: Step1
분석 > 분산분석 > 비모수적 검정 > 독립 2 표본 125
126
Mann-Whitney test: Step2
Error !!! 문자 속성을 가진 Group변수는 활성화 되지 않음 -> 숫자로 변환
127
Data 변환: Step1 변환 > 다른 변수로 코딩변경
128
Data 변환: Step2 클릭 !!!
129
Data 변환: Step3 클릭 !!!
131
Mann-Whitney test: Step2
132
Mann-Whitney test: Step3
133
Mann-Whitney test: 분석 결과
134
Example 2-2 Ex) 해열제 투여 여부(투여전, 투여후)와 체온간 연관성 (Paired design)
가설 : 투여 전후 간 체온이 다르다.
136
투여전후간 차이값들이 정규분포를 따르는지 check
-> If yes, Paired t-test -> If no, Wilcoxon’s signed rank test
137
Diff(=before-after)계산: Step1
변환 > 변수 계산
138
Diff(=before-after)계산: Step2
140
정규성 check/ 기술통계: Step1 분석 > 기술통계량 > 데이터 탐색
141
정규성 check / 기술통계: Step2 클릭 !!!
142
Diff에 대한 정규성 check/기술통계: Step3
143
Diff에 대한 정규성 check/기술통계: 분석결과
144
Diff에 대한 정규성 check/기술통계: 분석결과
145
각 쌍의 차이값들이 정규 분포를 따르는가 -> yes Paired t-test 적용
146
Paired t-test: Step1 분석 > 평균 비교 > 대응 표본 T 검정
147
Paired t-test: Step2
148
Paired t-test: Step3
149
Paired t-test: 분석결과
150
Example 2-3(1) Ex) BP level(<130, 130<= <150, >=150)과 하루 흡연량 (개피/day)간 연관성 가설 : 세 군(BP level)간 하루 흡연량이 다르다
152
-> One-way ANOVA or Kruskal-Wallis test
정규성 check 등분산성 check
153
정규성 및 등분산성 check / 기술통계 : Step1 분석 > 기술통계량 > 데이터 탐색 153
154
정규성 및 등분산성 check / 기술통계 : Step2 클릭 !!! 154
155
정규성 및 등분산성 check / 기술통계 : Step3 155
156
정규성 및 등분산성 check / 기술통계 : 분석 결과 ……………….. 156
157
정규성 및 등분산성 check / 기술통계 : 분석 결과 157
158
정규성 및 등분산성 check / 기술통계 : 분석 결과
159
각 군에서 자료값들이 정규 분포를 따르는가 : Yes
네 군의 분산들이 모두 같은가 : No Kruskal-Wallis test
160
Kruskal –Wallis Test: Step1
160
161
Kruskal –Wallis Test: Step2
161
162
Kruskal –Wallis Test: Step3
클릭 !!! 162
163
Kruskal –Wallis Test: 분석결과
163
164
비모수적 다중비교: Step1 (순위를 이용한 최소유의차 검정:
The least significant difference test using ranks) 변환 > 순위변수 생성 164
165
비모수적 다중비교: Step2 (순위를 이용한 최소유의차 검정:
The least significant difference test using ranks) 165
166
166
167
………… 167
168
비모수적 다중비교: Step3 (순위를 이용한 최소유의차 검정:
The least significant difference test using ranks) 분석 > 평균 비교 > 일원배치 분산분석 168
169
비모수적 다중비교: Step4 (순위를 이용한 최소유의차 검정:
The least significant difference test using ranks) 169
170
비모수적 다중비교: Step5 (순위를 이용한 최소유의차 검정:
The least significant difference test using ranks) 클릭 !!! 170
171
비모수적 다중비교: Step6 (순위를 이용한 최소유의차 검정:
The least significant difference test using ranks) 171
172
비모수적 다중비교: 분석결과 (순위를 이용한 최소유의차 검정:
The least significant difference test using ranks) 172
173
Example 2-3(2) Ex) BP level(<130, 130<= <150, >=150)과 하루 흡연량 (개피/day)간 연관성 가설 : 하루 흡연량이 많을수록 BP level이 높다.
174
순서형 변수와 연속형 변수간 상관성 분석 Spearman’s correlation analysis
175
Spearman’s correlation analysis: Step1
분석 > 상관분석 > 이변량 상관계수 175
176
Spearman’s correlation analysis: Step2
176
177
Spearman’s correlation analysis: Step3
178
Spearman’s correlation analysis: 분석결과
179
Example 2-4 Ex) 다이어트제 종류와 체중간 연관성; 세군간 체중 비교 (Matched design)
- Control (No diet) - Diet제 A - Diet제 B 가설 : 그룹 간에 6개월 후 체중이 다르다.
181
정규성 check -> If yes, Two-way ANOVA
182
Two way ANOVA: Step1 분석 > 일반선형모형 > 일변량 182
183
Two way ANOVA: Step2 183
184
Two way ANOVA: Step2 클릭 !!! 184
185
Two way ANOVA: Step3 185
186
Two way ANOVA: Step3 186
187
Two way ANOVA: Step4 클릭 !!! 각 그룹 당 10명씩 같기 때문에 lameans 이거나 means은 같은 결과를 준다 187
188
Two way ANOVA: Step5 188
189
Two way ANOVA: Step6 189
190
Two way ANOVA: 분석결과 3 군간에 평균 체중이 모두 같다고 할 수 없다. 190
191
Two way ANOVA: 분석결과 다중비교 결과 191
192
Example 3-1 Ex) 하루 흡연량과 SBP간 상관성이 있다. 가설 : 하루 흡연량과 SBP간 상관성이 있다.
194
자료 탐색 - 산점도 정규성 가정 check -> If yes, Pearson’s correlation analysis -> If no, Spearman’s correlation analysis
195
산점도: Step1 그래프 > 레거시 대화 상자 > 산점도/점도표 195
196
산점도: Step2 196
197
산점도: Step3 197
198
산점도: 분석결과 198
199
정규성 check: Step1 분석 > 기술통계량 > 데이터 탐색 199
200
정규성 check: Step2 클릭 !!! 200
201
정규성 check: Step3 201
202
정규성 check: 분석결과 202
203
Spearman correlation analysis:Step1
분석 > 상관분석 > 이변량 상관계수 203
204
Spearman correlation analysis:Step2
204
205
Spearman correlation analysis: 분석결과
205
206
Example 4-1 Ex) 종속변수(y) : SBP of infants
독립변수(x) : birthweight of infants, age in days of infants, sex
208
Multiple linear regression (다중선형회귀) analysis
209
Multiple linear regression: Step1
분석 > 일반선형모형 > 일변량 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 209
210
Multiple linear regression: Step2
선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 210
211
Multiple linear regression: Step2
클릭 !!! 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 211
212
Multiple linear regression: Step3
선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 212
213
Multiple linear regression: 분석결과
선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 213
214
Example 5-1 Ex) 종속변수(y) : CHD (1, 0) 독립변수(x) : 연령, 흡연유무
218
Logistic regression model
219
Logistic regression model: Step1
분석 > 회귀분석 > 이분형 로지스틱 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 219
220
Logistic regression model : Step2
선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 220
221
Logistic regression model : Step2
선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 221
222
Logistic regression model : Step3
클릭 !!! 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 222
223
Logistic regression model : Step4
선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 223
224
Logistic regression model : Step5
클릭 !!!
225
Logistic regression model : Step6
226
Logistic regression model : 분석결과
선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 226
227
Example 6-1 Ex) 우울증 환자들을 대상 으로 특정 치료제의 효 과를 알아보기 위해 동 일한 환자들을 대상으
로 투약전과 투약후 2 주, 4주 등의 간격으로 HAMD를 측정 id age HAMD (baseline) HAMD(week2) HAMD(week4) 1 39 16 13 12 2 72 18 10 3 56 21 4 52 20 14 5 58 17 8 6 41 …
229
가설1: HAMD 점수가 시간에 따라 변화가 있다.
양상이 다르다 가설3: 각 시점에서 50세 미만 군과 50세 이상 군간 HAMD 점수가 다르다.
230
가설1: HAMD 점수가 시간에 따라 변화가 있다.
Repeated Measures ANOVA(반복측정자료의 분산분석법) 에서 HAMD에 대한 time effect 검정
231
Repeated measures ANOVA: Step1
분석 > 일반선형 모형 > 반복측정
232
Repeated measures ANOVA: Step2
233
Repeated measures ANOVA: Step2
234
Repeated measures ANOVA: Step2
클릭 !!!
235
Repeated measures ANOVA: Step2
236
Repeated measures ANOVA: Step3
클릭 !!!
237
Repeated measures ANOVA: Step4
클릭 !!!
238
Repeated measures ANOVA: Step5
239
Repeated measures ANOVA: Step6
240
Repeated measures ANOVA: Step7
241
Repeated measures ANOVA: Step8
클릭 !!!
242
Repeated measures ANOVA: Step9
243
Repeated measures ANOVA: 분석결과
244
Repeated measures ANOVA: 분석결과
(time_1 =1 -> baseline, time_1 =2 -> Week2, time_1 =3 ->Week4)
245
Bonferroni’s correction
Week2 vs baseline : P = < *2 = < Week4 vs baseline : P = < *2 = <
246
Tip. 구형성 가정
248
가설2: 50세 미만과 50세 이상군간에 HAMD 점수 변화
양상이 다르다 Repeated Measures ANOVA(반복측정자료의 분산분석 법)에서 HAMD에 대한 age 군과 time간 교호작용 효과 - (Interaction effect) 검정
249
Data 변환: Step1 변환 > 다른 변수로 코딩변겅
250
Data 변환: Step2
251
Data 변환: Step3
252
Data 변환: Output
253
Data 변환: Output
254
Repeated measures ANOVA - Interaction effect: Step1
분석 > 일반선형 모형 > 반복측정
255
Repeated measures ANOVA - Interaction effect: Step2
256
Repeated measures ANOVA - Interaction effect: Step2
257
Repeated measures ANOVA - Interaction effect: Step3
클릭 !!!
258
Repeated measures ANOVA - Interaction effect: Step4
259
Repeated measures ANOVA - Interaction effect: Step5
260
Repeated measures ANOVA - Interaction effect: 분석결과
261
가설3: 각 시점에서 50세 미만 군과 50세 이상 군간 HAMD
점수가 다르다. 각 시점에서 두 군간 연속형 변수 비교 검정
262
At baseline: 각 연령군에서 HAMD가 정규분포를 따르는지 check > yes, Two-sample t-test At week2, Week4에서도 동일한 절차 적용
263
T-test: Step1 분석 > 평균 비교 > 독립 표본 T-검정
264
T-test: Step2
265
분석결과
266
분석결과
267
Bonferroni’s correction
At baseline : P = *3 = 1.000 At week2 : P = *3 = 0.972 At week4 : P = *3 = 1.000
268
Example 6-2 Ex) Outcome (normal, abnormal) repeated outcome; 범주형
270
Data transpose: Step1 데이터 > 구조변환
271
Data transpose: Step2
272
Data transpose: Step3
273
Data transpose: Step4
274
Data transpose: Step5
275
Data transpose: Step6
276
Data transpose: Step7
277
Data transpose: Step8
278
Data transpose: Step9
279
Data transpose: 분석결과 ………
280
GEE (Generalized Estimating Equation): Step1
분석 > 일반화 선형 모형 > 일반화 추정 방정식
281
GEE: Step2
282
GEE: Step3
283
GEE: Step4
284
GEE: Step5 클릭 !!!
285
GEE: Step6
286
GEE: Step7 클릭 !!!
287
GEE: Step8
288
GEE: Step9
289
GEE: 분석결과
290
Bonferroni’s correction
농도(5) – 농도(10) ; p = *2 = 농도(5) – 농도(15) ; p = *2 = 0.006
291
Example 7-1 Ex) 만성 간염환자 44명을 확률화에 의해 프레드니솔론 투여군과 비투여군으로 할당
가설 : 두 군간 생존곡선이 다르다
293
-> 생존율 및 생존곡선 추정 : Kaplan-Meier estimation 방법 이용 -> 두 생존곡선 비교 : 로그순위 검정법
294
생존율 추정/생존곡선 비교: Step1 분석 > 생존분석 > 생명표 분석 294
295
생존율 추정/생존곡선 비교: Step2 295
296
생존율 추정/생존곡선 비교: Step3 클릭 !!! 296
297
생존율 추정/생존곡선 비교: Step4 한 개의 도표에 각 계층 중첩에 클릭해야 두 그룹이 겹쳐서 그래프를 그릴 수 있음
297
298
생존율 추정/생존곡선 비교: Step5 클릭 !!! 298
299
생존율 추정/생존곡선 비교: Step6
300
K-M 생존율 추정: 분석결과 시연을 통해 결과를 살펴봄 ……………………….. 300
301
생존곡선: 분석결과 301
302
생존곡선 비교: 분석결과 302
303
Example 7-2 Ex) Data on 43 bone marrow transplants for HD and NHL
Event = death or relapse 독립변수 : Graft type, Disease type Karnofsky score, Waiting time to transplat
306
-> Cox의 비례위험 모형 ( Cox’s proportional hazards model)
307
Cox의 비례위험모형: Step1 분석 > 생존확률 > Cox 회귀모형 307
308
Cox의 비례위험모형: Step2 308
309
Cox의 비례위험모형: Step3 클릭 !!! 309
310
Cox의 비례위험모형: Step4 클릭 !!!
311
Cox의 비례위험모형: Step5 클릭 !!! 311
312
Cox의 비례위험모형: Step6
313
Cox의 비례위험모형: 분석결과 313
314
참고 문헌 김선우 저(2004). 간호연구를 위한 기초통계 방법론, 자유아카데미
김선우 저(2005). 의학연구를 위한 기초통계 방법론,교우사
Similar presentations