PASW 17.0 활용하기 일시 : 2009.07.15, (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
내용 자료 입력하기, 저장하기 엑셀로 입력된 자료 불러오기 실제 분석 절차 및 결과 제시 S/W : PASW (Predictive Analytics Software) 17.0
초기 화면
자료 입력 및 저장하기 PASW에서 Data 직접 입력하기 입력한 변수 정보 확인하기 Data 저장하기
자료 입력 하기 PASW에서 Data 직접 입력하기
Step1
Step2
Step2
Step2 클릭 !!!
Step2
Step2
Step2
Tip. 문자형 자료 입력하기 클릭 !!!
Tip. 문자형 자료 입력하기
Tip. 문자형 자료 입력하기
Tip. 문자형 자료 입력하기
입력한 변수 정보 확인하기
파일 > 데이터 파일 정보 표시 > 작업 파일
Data 저장하기 -> ***.sav
Step1 파일 > 저장
Step2: 경로 지정
Step3 : 파일 이름 입력
Tip. Excel로 저장하기 저장 유형을 (*.xls)로 바꿔 준다
자료 불러오기 엑셀로 입력된 자료 불러오기
엑셀 자료
Step1 파일 > 열기 > 데이터
Step2 : 파일 유형 지정
Step3 : 불러올 파일 이름 지정 -> 열기
Step4 : 워크시트 지정 -> 확인
연관성 분석
Example 1-1 Ex) 흡연상태(C, P, N)와 폐암 발생간 연관성 환자군 정상군 total C 28 (80%) (53%) 7 (20%) (22%) 35 P 20 (67%) (38%) 10 (33%) (31%) 30 N 5 (25%) (9%) 15 (75%) (47%) 53 32 85
가설 : 흡연 상태간 폐암 발생 비율이 차이가 있다. 가설 : 폐암군과 정상군간 흡연상태 비율이 차이가 있다.
-> Chi-square test, Fisher’s exact test 수행
분석할 자료 불러오기
분석 절차 가중치 부여하기 Chi-Square test or Fisher’s Exact test 수행
가중치 부여 :Step1 데이터 > 가중 케이스 39
가중치 부여 :Step2 40
가중치 부여 :Step2 41
Output
Chi-square test, Fisher’s exact test :Step1 분석 > 기술통계량 > 교차분석 43
Chi-square test, Fisher’s exact test :Step2 44
Chi-square test, Fisher’s exact test :Step2 클릭 !!! 45
Chi-square test, Fisher’s exact test :Step3 46
Chi-square test, Fisher’s exact test :Step4 클릭 !!! 47
Chi-square test, Fisher’s exact test :Step4 48
Output : 빈도분포표
Output : 카이제곱 검정 결과
Example 1-2 Ex) 하루 흡연량(0, <=10/day, >10/day)과 폐암 발생 여부간 연관성
Example 1-2 가설 : 세 군(흡연량)간 폐암 발생 비율이 다르다. 가설 : 폐암군과 정상군간 흡연량 비율이 다르다. 가설 : 하루 흡연량이 많을수록 폐암 발생 비율이 높다. 가설 : 폐암군은 정상군보다 흡연량이 많다.
가설 : 세 군(흡연량)간 폐암 발생 비율이 다르다. 가설 : 폐암군과 정상군간 흡연량 비율이 다르다. Chi-square test, Fisher’s exact test
가설 : 하루 흡연량이 많을수록 폐암 발생 비율이 높다. Cochran-Armitage test
분석 절차 문자형 변수 Group(정상군, 환자군)을 숫자형 변수로 바꾸기 가중치 부여하기 Cochran-Armitage test 수행
데이터 변환 - 문자 -> 숫자: Step1 변환 > 다른 변수로 코딩변경
데이터 변환 - 문자 -> 숫자 : Step2
데이터 변환 - 문자 -> 숫자 : Step2
데이터 변환 - 문자 -> 숫자 : Step3
데이터 변환 - 문자 -> 숫자 : Step3
Data 변환 결과
가중치 부여:Step1 데이터 > 가중 케이스 62
가중치 부여:Step2 63
가중치 부여:Step2 64
Output
Cochran-Armitage test: Step1 분석 > 기술통계량 > 교차분석 66
Cochran-Armitage test: Step2 67
Cochran-Armitage test: Step2 클릭 !!! 68
Cochran-Armitage test: Step3 69
Cochran-Armitage test: Step4 클릭 !!! 70
Cochran-Armitage test: Step5 71
Output : 빈도분포표
Output : 분석결과
가설 : 폐암군은 정상군보다 흡연량이 많다. Mann-Whitney test
분석 절차 가중치 부여하기 Mann-Whitney test 수행
Mann-Whitney test: Step1 분석 > 분산분석 > 비모수적 검정 > 독립 2 표본 76
Mann-Whitney test: Step2
Mann-Whitney test: Step2
Mann-Whitney test: Step3 클릭 !!!
Output
Example 1-3 Ex) 하루 흡연량(0, <=10/day, >10/day)과 BP level (SBP; <130, 130<= < 150, >=150)간 연관성 가설 : 세 군(흡연량)간 BP level 비율이 다르다 가설 : 흡연량이 많을수록 BP level이 높은가
가설 : 세 군(흡연량)간 BP level 비율이 다르다. Chi-square test, Fisher’s Exact test
-> 기대돗수 check If expected count less than 5, Fisher’s Exact test
분석 절차 가중치 부여하기 Fisher’s Exact test 수행
Fisher’s exact test: Step1 분석 > 기술통계량 > 교차분석
Fisher’s exact test: Step2 클릭 !!! 87
Fisher’s exact test: Step3
Fisher’s exact test: Step4 클릭 !!! 89
Fisher’s exact test: Step5
Fisher’s exact test: Step6 클릭 !!! 91
Fisher’s exact test: Step7
Output 93
Output 94
가설 : 흡연량이 많을수록 BP level이 높은가 Spearman’s correlation analysis
분석 절차 가중치 부여하기 Spearman’s correlation analysis 수행
Spearman’s correlation analysis: Step1 분석 > 상관분석 > 이변량 상관계수 97
Spearman’s correlation analysis: Step2 클릭 !!! 98
Spearman’s correlation analysis: 결과 99
Example 1-4 Ex) Venography와 Thermography간 진단결과 비교 (Paired design) 양성비율이 다르다.
……………………
-> McNemar’s test 적용
McNemar’s Test: Step1 분석 > 기술통계량 > 교차분석
McNemar’s Test: Step2 클릭 !!! 104
McNemar’s Test: Step3 클릭 !!! 105
McNemar’s Test: 분석결과 106
Example 2-1(1) Ex) 폐암 발생 여부와 하루 흡연량(개피/day)간 연관성 가설 : 폐암 환자군과 정상군간 하루 흡연량이 다른가
Two sample t-test, Mann-Whitney test 정규성 체크! - If yes, Two-sample t-test 적용 - If no, Mann-Whitney test 적용
정규성 check/ 기술통계: Step1 분석 > 기술통계량 > 데이터 탐색
정규성 check / 기술통계: Step2 클릭 !!!
정규성 check / 기술통계: Step3
정규성 check / 기술통계: Step4 클릭 !!!
정규성 check / 기술통계: Step5
정규성 check / 기술통계: 분석결과
정규성 check / 기술통계: 분석결과
모수적 방법인 Two Sample t-test 적용 각 군에서 자료값들이 정규 분포를 따르는가 -> yes 모수적 방법인 Two Sample t-test 적용
T-test: Step1 분석 > 평균 비교 > 독립 표본 T 검정
T-test: Step2
T-test: Step3
T-test: 분석결과
Example 2-1(2) Ex) 폐암 발생 여부와 하루 흡연량(개피/day)간 연관성 가설 : 폐암 환자군과 정상군간 하루 흡연량이 다른가
Two sample t-test, Mann-Whitney test 정규성 체크! -> If no, Mann-Whitney test 적용
Mann-Whitney test: Step1 분석 > 분산분석 > 비모수적 검정 > 독립 2 표본 125
Mann-Whitney test: Step2 Error !!! 문자 속성을 가진 Group변수는 활성화 되지 않음 -> 숫자로 변환
Data 변환: Step1 변환 > 다른 변수로 코딩변경
Data 변환: Step2 클릭 !!!
Data 변환: Step3 클릭 !!!
Mann-Whitney test: Step2
Mann-Whitney test: Step3
Mann-Whitney test: 분석 결과
Example 2-2 Ex) 해열제 투여 여부(투여전, 투여후)와 체온간 연관성 (Paired design) 가설 : 투여 전후 간 체온이 다르다.
투여전후간 차이값들이 정규분포를 따르는지 check -> If yes, Paired t-test -> If no, Wilcoxon’s signed rank test
Diff(=before-after)계산: Step1 변환 > 변수 계산
Diff(=before-after)계산: Step2
정규성 check/ 기술통계: Step1 분석 > 기술통계량 > 데이터 탐색
정규성 check / 기술통계: Step2 클릭 !!!
Diff에 대한 정규성 check/기술통계: Step3
Diff에 대한 정규성 check/기술통계: 분석결과
Diff에 대한 정규성 check/기술통계: 분석결과
각 쌍의 차이값들이 정규 분포를 따르는가 -> yes Paired t-test 적용
Paired t-test: Step1 분석 > 평균 비교 > 대응 표본 T 검정
Paired t-test: Step2
Paired t-test: Step3
Paired t-test: 분석결과
Example 2-3(1) Ex) BP level(<130, 130<= <150, >=150)과 하루 흡연량 (개피/day)간 연관성 가설 : 세 군(BP level)간 하루 흡연량이 다르다
-> One-way ANOVA or Kruskal-Wallis test 정규성 check 등분산성 check
정규성 및 등분산성 check / 기술통계 : Step1 분석 > 기술통계량 > 데이터 탐색 153
정규성 및 등분산성 check / 기술통계 : Step2 클릭 !!! 154
정규성 및 등분산성 check / 기술통계 : Step3 155
정규성 및 등분산성 check / 기술통계 : 분석 결과 ……………….. 156
정규성 및 등분산성 check / 기술통계 : 분석 결과 157
정규성 및 등분산성 check / 기술통계 : 분석 결과
각 군에서 자료값들이 정규 분포를 따르는가 : Yes 네 군의 분산들이 모두 같은가 : No Kruskal-Wallis test
Kruskal –Wallis Test: Step1 160
Kruskal –Wallis Test: Step2 161
Kruskal –Wallis Test: Step3 클릭 !!! 162
Kruskal –Wallis Test: 분석결과 163
비모수적 다중비교: Step1 (순위를 이용한 최소유의차 검정: The least significant difference test using ranks) 변환 > 순위변수 생성 164
비모수적 다중비교: Step2 (순위를 이용한 최소유의차 검정: The least significant difference test using ranks) 165
166
………… 167
비모수적 다중비교: Step3 (순위를 이용한 최소유의차 검정: The least significant difference test using ranks) 분석 > 평균 비교 > 일원배치 분산분석 168
비모수적 다중비교: Step4 (순위를 이용한 최소유의차 검정: The least significant difference test using ranks) 169
비모수적 다중비교: Step5 (순위를 이용한 최소유의차 검정: The least significant difference test using ranks) 클릭 !!! 170
비모수적 다중비교: Step6 (순위를 이용한 최소유의차 검정: The least significant difference test using ranks) 171
비모수적 다중비교: 분석결과 (순위를 이용한 최소유의차 검정: The least significant difference test using ranks) 172
Example 2-3(2) Ex) BP level(<130, 130<= <150, >=150)과 하루 흡연량 (개피/day)간 연관성 가설 : 하루 흡연량이 많을수록 BP level이 높다.
순서형 변수와 연속형 변수간 상관성 분석 Spearman’s correlation analysis
Spearman’s correlation analysis: Step1 분석 > 상관분석 > 이변량 상관계수 175
Spearman’s correlation analysis: Step2 176
Spearman’s correlation analysis: Step3
Spearman’s correlation analysis: 분석결과
Example 2-4 Ex) 다이어트제 종류와 체중간 연관성; 세군간 체중 비교 (Matched design) - Control (No diet) - Diet제 A - Diet제 B 가설 : 그룹 간에 6개월 후 체중이 다르다.
정규성 check -> If yes, Two-way ANOVA
Two way ANOVA: Step1 분석 > 일반선형모형 > 일변량 182
Two way ANOVA: Step2 183
Two way ANOVA: Step2 클릭 !!! 184
Two way ANOVA: Step3 185
Two way ANOVA: Step3 186
Two way ANOVA: Step4 클릭 !!! 각 그룹 당 10명씩 같기 때문에 lameans 이거나 means은 같은 결과를 준다 187
Two way ANOVA: Step5 188
Two way ANOVA: Step6 189
Two way ANOVA: 분석결과 3 군간에 평균 체중이 모두 같다고 할 수 없다. 190
Two way ANOVA: 분석결과 다중비교 결과 191
Example 3-1 Ex) 하루 흡연량과 SBP간 상관성이 있다. 가설 : 하루 흡연량과 SBP간 상관성이 있다.
자료 탐색 - 산점도 정규성 가정 check -> If yes, Pearson’s correlation analysis -> If no, Spearman’s correlation analysis
산점도: Step1 그래프 > 레거시 대화 상자 > 산점도/점도표 195
산점도: Step2 196
산점도: Step3 197
산점도: 분석결과 198
정규성 check: Step1 분석 > 기술통계량 > 데이터 탐색 199
정규성 check: Step2 클릭 !!! 200
정규성 check: Step3 201
정규성 check: 분석결과 202
Spearman correlation analysis:Step1 분석 > 상관분석 > 이변량 상관계수 203
Spearman correlation analysis:Step2 204
Spearman correlation analysis: 분석결과 205
Example 4-1 Ex) 종속변수(y) : SBP of infants 독립변수(x) : birthweight of infants, age in days of infants, sex
Multiple linear regression (다중선형회귀) analysis
Multiple linear regression: Step1 분석 > 일반선형모형 > 일변량 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 209
Multiple linear regression: Step2 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 210
Multiple linear regression: Step2 클릭 !!! 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 211
Multiple linear regression: Step3 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 212
Multiple linear regression: 분석결과 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 213
Example 5-1 Ex) 종속변수(y) : CHD (1, 0) 독립변수(x) : 연령, 흡연유무
Logistic regression model
Logistic regression model: Step1 분석 > 회귀분석 > 이분형 로지스틱 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 219
Logistic regression model : Step2 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 220
Logistic regression model : Step2 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 221
Logistic regression model : Step3 클릭 !!! 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 222
Logistic regression model : Step4 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 223
Logistic regression model : Step5 클릭 !!!
Logistic regression model : Step6
Logistic regression model : 분석결과 선형-> 다중회귀해도 되지만 설명변수가 범주형일 땐 사용할 수 없다. 따라서 여기서는 분산분석 > 선형모형(GLM)을 사용.(SPSS에서 general linear model과 같다.) 226
Example 6-1 Ex) 우울증 환자들을 대상 으로 특정 치료제의 효 과를 알아보기 위해 동 일한 환자들을 대상으 로 투약전과 투약후 2 주, 4주 등의 간격으로 HAMD를 측정 id age HAMD (baseline) HAMD(week2) HAMD(week4) 1 39 16 13 12 2 72 18 10 3 56 21 4 52 20 14 5 58 17 8 6 41 …
가설1: HAMD 점수가 시간에 따라 변화가 있다. 양상이 다르다 가설3: 각 시점에서 50세 미만 군과 50세 이상 군간 HAMD 점수가 다르다.
가설1: HAMD 점수가 시간에 따라 변화가 있다. Repeated Measures ANOVA(반복측정자료의 분산분석법) 에서 HAMD에 대한 time effect 검정
Repeated measures ANOVA: Step1 분석 > 일반선형 모형 > 반복측정
Repeated measures ANOVA: Step2
Repeated measures ANOVA: Step2
Repeated measures ANOVA: Step2 클릭 !!!
Repeated measures ANOVA: Step2
Repeated measures ANOVA: Step3 클릭 !!!
Repeated measures ANOVA: Step4 클릭 !!!
Repeated measures ANOVA: Step5
Repeated measures ANOVA: Step6
Repeated measures ANOVA: Step7
Repeated measures ANOVA: Step8 클릭 !!!
Repeated measures ANOVA: Step9
Repeated measures ANOVA: 분석결과
Repeated measures ANOVA: 분석결과 (time_1 =1 -> baseline, time_1 =2 -> Week2, time_1 =3 ->Week4)
Bonferroni’s correction Week2 vs baseline : P = < 0.0001 *2 = < 0.0001 Week4 vs baseline : P = < 0.0001 *2 = < 0.0001
Tip. 구형성 가정
가설2: 50세 미만과 50세 이상군간에 HAMD 점수 변화 양상이 다르다 Repeated Measures ANOVA(반복측정자료의 분산분석 법)에서 HAMD에 대한 age 군과 time간 교호작용 효과 - (Interaction effect) 검정
Data 변환: Step1 변환 > 다른 변수로 코딩변겅
Data 변환: Step2
Data 변환: Step3
Data 변환: Output
Data 변환: Output
Repeated measures ANOVA - Interaction effect: Step1 분석 > 일반선형 모형 > 반복측정
Repeated measures ANOVA - Interaction effect: Step2
Repeated measures ANOVA - Interaction effect: Step2
Repeated measures ANOVA - Interaction effect: Step3 클릭 !!!
Repeated measures ANOVA - Interaction effect: Step4
Repeated measures ANOVA - Interaction effect: Step5
Repeated measures ANOVA - Interaction effect: 분석결과
가설3: 각 시점에서 50세 미만 군과 50세 이상 군간 HAMD 점수가 다르다. 각 시점에서 두 군간 연속형 변수 비교 검정
At baseline: 각 연령군에서 HAMD가 정규분포를 따르는지 check > yes, Two-sample t-test At week2, Week4에서도 동일한 절차 적용
T-test: Step1 분석 > 평균 비교 > 독립 표본 T-검정
T-test: Step2
분석결과
분석결과
Bonferroni’s correction At baseline : P = 0.481 *3 = 1.000 At week2 : P = 0.324 *3 = 0.972 At week4 : P = 1.000 *3 = 1.000
Example 6-2 Ex) Outcome (normal, abnormal) repeated outcome; 범주형
Data transpose: Step1 데이터 > 구조변환
Data transpose: Step2
Data transpose: Step3
Data transpose: Step4
Data transpose: Step5
Data transpose: Step6
Data transpose: Step7
Data transpose: Step8
Data transpose: Step9
Data transpose: 분석결과 ………
GEE (Generalized Estimating Equation): Step1 분석 > 일반화 선형 모형 > 일반화 추정 방정식
GEE: Step2
GEE: Step3
GEE: Step4
GEE: Step5 클릭 !!!
GEE: Step6
GEE: Step7 클릭 !!!
GEE: Step8
GEE: Step9
GEE: 분석결과
Bonferroni’s correction 농도(5) – 농도(10) ; p = 0.056 *2 = 0.1114 농도(5) – 농도(15) ; p = 0.003 *2 = 0.006
Example 7-1 Ex) 만성 간염환자 44명을 확률화에 의해 프레드니솔론 투여군과 비투여군으로 할당 가설 : 두 군간 생존곡선이 다르다
-> 생존율 및 생존곡선 추정 : Kaplan-Meier estimation 방법 이용 -> 두 생존곡선 비교 : 로그순위 검정법
생존율 추정/생존곡선 비교: Step1 분석 > 생존분석 > 생명표 분석 294
생존율 추정/생존곡선 비교: Step2 295
생존율 추정/생존곡선 비교: Step3 클릭 !!! 296
생존율 추정/생존곡선 비교: Step4 한 개의 도표에 각 계층 중첩에 클릭해야 두 그룹이 겹쳐서 그래프를 그릴 수 있음 297
생존율 추정/생존곡선 비교: Step5 클릭 !!! 298
생존율 추정/생존곡선 비교: Step6
K-M 생존율 추정: 분석결과 시연을 통해 결과를 살펴봄 ……………………….. 300
생존곡선: 분석결과 301
생존곡선 비교: 분석결과 302
Example 7-2 Ex) Data on 43 bone marrow transplants for HD and NHL Event = death or relapse 독립변수 : Graft type, Disease type Karnofsky score, Waiting time to transplat
-> Cox의 비례위험 모형 ( Cox’s proportional hazards model)
Cox의 비례위험모형: Step1 분석 > 생존확률 > Cox 회귀모형 307
Cox의 비례위험모형: Step2 308
Cox의 비례위험모형: Step3 클릭 !!! 309
Cox의 비례위험모형: Step4 클릭 !!!
Cox의 비례위험모형: Step5 클릭 !!! 311
Cox의 비례위험모형: Step6
Cox의 비례위험모형: 분석결과 313
참고 문헌 김선우 저(2004). 간호연구를 위한 기초통계 방법론, 자유아카데미 김선우 저(2005). 의학연구를 위한 기초통계 방법론,교우사