실습 (using SPSS) Department of Biostatistics, Samsung Biomedical Research Institute Samsung Medical Center.

Slides:



Advertisements
Similar presentations
2014 한국사회정책연합 공동학술대회 - 방법론 강의 패널 자료를 이용한 연구 방법 김 희 삼 (KDI 연구위원 ) October 17, 2015
Advertisements

EMLAB Modeling of Digital Communication Systems using Simulink Chap2. Sinusoidal Simulink Model Chap3. Digital Communications BER Performance in AWGN (BPSK.
정보 사회의 역기 능과 대처 01 인터넷 중독, 어떻게 예방할까
“할배들의 수다” 전통시장 최고의 집을 찾아라
Background  In the Helsinki policemen Study Hyperinsulinemia was associated with increased all-cause and CV mortality independent of other risk factors.
R commander an introduction user-friendly and absolutely free
세종대학교 항공우주공학과 유도항법제어연구실
14주차 1교시 강화계획 [학습목표] 1. 강화계획의 정의를 안다 [학습내용] 1. 단순한 강화계획 2. 간헐적 강화 3. 복합 계획 4. 선택과 대응법칙 [사전학습] 강화계획이 일어날 수 있는 사례를 생각해본다.
Ⅳ. Improve Ⅳ. 개선(Improve) (1) 실험계획법 핵심요약 (2) 22 실험계획법 (3) 23 실험계획법
4장. 마케팅 정보 시스템과 마케팅 조사 마케팅정보시스템 마케팅조사.
PASW 17.0 활용하기 일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
연장근로와 야간·휴일근로 김영호 노무사 나눔 노사관계연구소 소장 연세대 일반대학원 박사 수료 고려사이버대 법학과 외래교수
판별분석의 개념과 적용(→ 추계통계적 성격)
비모수 통계분석 목 적 비모수 통계분석은 t검정이나 분산분석을 사용할 수 있는 등간척도 이상으로 구성된 종속변수가 아닌 서열척도로 종속변수가 구성되어 있을 경우, 또는 등간성이 의심되거나 정규분포성을 얻지 못할 경우에 순위(Rank)를 통하여 변수간의 차이를 비교할 때.
의료의 질 평가 분석 기법 김 민 경.
제 6장 분산분석(ANOVA) 분산분석 이란? 여러 개의 모집단의 모평균을 비교하는 분석방법
사회복지조사론 Research Method for Social Welfare
4-4 Comparison of Standard Deviations with the F test
논문을 위한 통계 집단간 평균 차이: t-test, ANOVA 하성욱 한성대학교 대학원.
일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
제1장 과학과 사회조사방법 과학적 지식(scientific knowledge): 과학적 방법에 의해 얻어진 지식, 즉 논리적, 체계적, 경험적, 객관적 절차를 통해 얻어진 지식 과학적 지식의 특성 1) 재생가능성(reproducibility) 2) 경험가능성(empiricism)
선형회귀분석.
9.확률 분포 정규 분포 형태 : 평균을 중심으로 좌우대칭의 종 모양을 가진 분포이다.
Medical Instrumentation
비모수 분석 및 복습.
CHAPTER 21 UNIVARIATE STATISTICS
관능검사 기법.
Current clinical practice for cholecystectomy after ERCP
Cluster Analysis (군집 분석)
SPSS를 활용한 통계분석 김 덕 기 충북대학교 정보통계학과
2007 겨울 통계강좌 중급과정 제6강 다변량 분석에 대한 이해.
ANOVA.
로지스틱 회귀분석.
MINITAB for Six Sigma.
Medical Instrumentation
4-1 Gaussian Distribution
서울아산병원 의학통계학과 울산의대 예방의학교실 이무송
1. Log in WCMS에서 사용하는 ID와 PW를 동일하게 사용.
합리적‧동태적 정원모형 설계 Wisdom21 Management Consulting.
제 15 장 거시경제의 측정 PowerPoint® Slides by Can Erbil
국립공원 추가·확대 지정 설문조사 유기준 (상지대학교)
기초통계학 Chapter 5: 회귀분석 (Regression analysis)
Other ANOVA designs Two-way ANOVA
과학 탐구 토론 대회 1학년 2반 박승원 1학년 5반 권민성.
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
국제개발협력 분야 관련 우리 기업의 역할 확대 삼성물산 주식회사
회귀분석.
제왕절개 분만율의 위험도 보정 -방법과 활용을 중심으로 송정국
Inferences concerning two populations and paired comparisons
역학적 연구설계 (Epidemiologic Study Designs)
Association between two measurement variables Correlation
: Two Sample Test - paired t-test - t-test - modified t-test
Keller: Stats for Mgmt & Econ, 7th Ed 다중회귀분석 Multiple Regression
Statistical inference I (통계적 추론)
영어 원어민 한국어 학습자의 초분절음 특징 연구 이 문서는 나눔글꼴로 작성되었습니다. 설치하기.
독립성금증(χ2)-교차표 분석 수집된 자료가 명목척도로 측정된 경우 두 변수의 관계를 조사하는 통계기법으로 χ2독립성 검증(chi-square independence test)이 있다. 예를 들어, 특정 속성에 대하여 집단별로 어떤 차이가 있는지를 알아보기 위해서 사용하는.
Multiple regression analysis
The normal distribution (정규분포)
사용자 경험 측정 (Measuring User Experience)
Ⅲ. 세계의 자연환경 -열대기후와 주민생활.
장애인단체 간담회 마스터 제목 스타일 편집 마스터 제목 스타일 편집 장애인 단체 간담회 마스터 부제목 스타일 편집
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
Definitions (정의) Statistics란?
제3장 사회조사방법의 기본개념 변수(variable): 사람, 물건, 사건 등의 특성이나 속성이 두 가지 이상의 가치(value)를 가질 때 변수라고 함. 즉 상호배타적인 속성들의 집합 1) 속성에 따른 분류 -. 명목변수(Nominal Variable): 분류에 기초를.
Statistics (First Term/2009)
CH 5. 반복이 있는 이원 배치법 랜덤化 vs 분할법 (Split-Plot design) 교호작용 (AⅹB) A x B
Progress Seminar 신희안.
Progress Seminar 권순빈.
Progress Seminar 이준녕.
Progress Seminar 이준녕.
Presentation transcript:

실습 (using SPSS) Department of Biostatistics, Samsung Biomedical Research Institute Samsung Medical Center

Contents Chi-square test/ Fisher’s exact test One-way ANOVA/ Kruskal-Wallis test (Post-hoc test) Multiple linear regression analysis Multiple logistic regression analysis Repeated measurements analysis Survival analysis ← with artificial data (STELLAR TRIAL, JUPITER TRIAL)

Chi-square test For gender,

step1 분석 – 기술통계량 - 교차분석

step2 행, 열에 변수 지정 – 통계량 버튼 click

step3 통계량 : 카이제곱 check – 계속 click

step4 셀 button click

step5 셀 : 빈도 및 퍼센트 check – 계속 click

step6 확인 click

Output

Fisher‘s exact test For atherosclerosis,

step1 분석 – 기술통계량 - 교차분석

step2 행, 열에 변수 지정 – 통계량 버튼 click

step3 통계량 : 카이제곱 check – 계속 click

step4 셀 button click

step5 셀 : 빈도 및 퍼센트 check – 계속 click

step6 정확 button click

step7 정확한 검정 check – 계속 click

step8 확인 click

Output

(참고) For BMI group (>30) step1 연속형 변수 -> 범주형 변수 step3 카이제곱 검정 / Fisher’s exact test

연속형 변수 -> 범주형 변수

Step1 변환 – 다른 변수로 코딩 변경

Step2 BMI를 출력변수 박스에 넘김 – 출력변수이름 입력 – 바꾸기 click

Step3 기존값 및 새로운 값 click

Step4 최저값에서 다음 값까지 범위 check – 30 입력 – 새로운 값에 0 입력

Step5 추가 click

Step6 기타 모든 값 check – 새로운 값에 1 입력

Step7 추가 click – 계속 click

Step8 확인 click

Output

One-way ANOVA Comparison of percent change in LDL cholesterol from baseline to 6 weeks among 4 groups <- Assumption for normality ; satisfied Equal variance assumption; satisfied

Assumption for normality Normality of percent change in LDL cholesterol for each drug group

Step1 분석 – 기술통계량 – 데이터 탐색

Step2 종속변수에 “연속형 변수(percent)”, 요인에 “범주형 변수(drug)를 넘김 – 도표 click

Step3 검정과 함께 정규성 도표 check – 계속 click

Step4 확인 click

Output

Equal variance assumption Equal variance of percent change in LDL cholesterol among drug groups

Step1 분석 – 기술통계량 – 데이터 탐색

Step2 종속변수에 “연속형 변수(percent)”, 요인에 “범주형 변수(drug)를 넘김 – 도표 click

Step3 Levene 검정이 있는 평균 산포 : 제곱갑 추정 check - 계속 click

Step4 확인 click

Output

Assumption for normality ; satisfied Equal variance assumption; satisfied

One-way ANOVA Comparison of percent change in LDL cholesterol from baseline to 6 weeks among 4 groups

Step1 분석 – 평균 비교 – 일원배치 분산분석

Step2 종속변수에 “연속형 변수(percent)”, 요인에 “범주형 변수(drug)” 넘김 BUT, 문자로 coding된 “drug” 변수는 일원배치 분산분석-변수 목록에 활성화 되지 않음 -> 숫자로 다시 recording 필요

(참고) 문자 -> 숫자 record Step1 : 변환 – 다른 변수로 코딩 변경

(참고) 문자 -> 숫자 record Step2 : 기존값 및 새로운 값 click

(참고) 문자 -> 숫자 record Step3 : 기존값 및 새로운 값 입력 – 추가 click – 계속 click

(참고) 문자 -> 숫자 record Step3 : 확인 click ………

Step2 종속변수에 “연속형 변수(percent)”, 요인에 “범주형 변수(drug_1)” 넘김

Step3 확인 click

Output

Post-hoc test Tukey’s test

Step1 일원배치 분산분석: 사후분석 click

Step2 Tukey 방법 check – 계속 click

Step3 확인 click

Output (1:R, 2:A, 3:S, P:4)

(참고) Kruskal-Wallis test Comparison of percent change in LDL cholesterol from baseline to 6 weeks among 4 groups

Step1 분석 – 비모수 검정 – 독립 K 표본

Step2 검정변수에 “연속형변수(percent)”, 집단 변수에 “범주형변수(drug_1)” 를 넘김

Step3 집단정의 click – 집단변수의 범위 지정

Step4 확인 click

Output

Post-hoc test Tukey’s test using ranks

Step1 Rank 부여: 변환 – 순위변수 생성

Step2 “연속형 변수(percent)”를 변수 box에 넘김 - 확인 click

Step3 분석 – 평균비교 – 일원배치 분산분석 – “생성된 순위 변수(Rpercent)”를 종속변수에 넘김

Step4 사후분석 click – Tukey 방법 check – 계속 click

Step5 확인 click

Output

(참고) Dunnett’s test 분석 – 평균비교 – 일원배치 분산분석 – 사후분석 – Dunnett check

Multiple linear regression Comparison of percent change in LDL cholesterol adjusting for age

Step1 분석 – 일반선형모형 - 일변량

Step2 종속변수에 “percent(연속형 변수)”, 모수 요인에 “drug(범주형 변수)”, 공변량에 “age(연속형 변수)”를 넘김

Step3 모형 click – 사용자 정의 check

Step4 항 설정: “주효과”로 바꿈 – drug, age 변수 넘김

Step5 확인 click

Output

어느 그룹간 차이가 있는가? Reference category :R ← Step1: recording (A:1, P:2, S:3, R:4)하여 drug_gr 변수 생성 Step2: 분석 – 일반선형 모형 – 일변량 – 옵션 click

Step3 : drug_gr을 평균 출력기준에 넘김-모수 추정값 check – 계속 click

Step4 : 확인 click

Output (A:1, P:2, S:3, R:4) A(1) vs R(4); p=0.034*3=0.102 P(2) vs R(4); p=<0.001*3=0.001 S(3) vs R(4); p=<0.001*3=0.001

Multiple logistic regression Hypothesis: There is a difference of the proportion of percent change (>30%) between between rosuvastatin and each of other groups adjusting for covariates (Multivariable analysis)

Step1 분석 – 회귀분석 – 이분형 로지스틱

Step2 종속변수에 percent_1(if >30 : 1, else 0), 공변량에 drug_gr(A:1, P:2, S:3, R:4), age(연속형 변수)를 넘김

Step3 범주형 click – drug_gr변수를 범주형 공변량에 넘김 – 계속 click

Step4 옵션 click – exp(B)에 대한 신뢰구간 check - 98.3(=1-0.05/3) 입력 – 계속 click

Output

Output Group 1 vs 4 (A vs R); p=0.699*3=1.000 Group 2 vs 4 (P vs R); p<0.001*3=0.003 Group 3 vs 4 (S vs R); p=0.001*3=0.003 adjusted 95% CI for OR  (1-0.05/3)*100% CI로 수정되었음

Repeated measures ANOVA Ex1) 복압성 요실금 환자(≤55, >55)를 대상으로 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의 스트레스 설문지를 이용하여 스트레스 점수를 측정

가설: 시간에 따른 스트레스 점수 변화 양상은 연령 두 군간에 (55세 이하, 초과) 다르다. (교호작용 효과 검정) 연령군이 일정할 때, 시간에 따라 스트레스 점수가 다르다. 시간이 일정할 때, 연령 두 군간에 스트레스 점수가 다르다.

N=16 (complete data without missing) Outcome variable (Continuous type) : 스트레스 점수 Independent variable : age(55세 이하, 초과), time(개월)

Method : Repeated measures ANOVA

Step1 분석 > 일반선형모형 > 반복측정

Step2 수준의 수에 반복측정회수를 입력함 – 추가 click

Step3 반복측정 변수를 개체 내 변수에, 범주형 변수인 age_1(≤55, >55)를 개체 간 요인에 넘김

Step4 모형 click – 사용자 정의 check – 개체 내 모형에 “요인1”, 개체간 모형에 “age_1”

Step5 도표 click – “요인1”을 수평축 변수에, age_1을 선구분 변수에 넘김 – 추가 click

Output

Output 구형성 가정 test P-value > 0.05 ; 구형성 가정 만족

Output-> 일변량 분석 연령군이 일정할 때, 시간에 따라 스트레스 점수는 다르다고 할 수 있음 (P-value = 0.021) Interaction effect(교호작용 효과) : 시간에 따른 스트레스 점수 변화 양상은 연령 두 군간 (55세 이하, 초과) 다르다고 할 수 없다. (P-value = 0.506)

시간이 일정할 때, 연령 두 군간(55세 이하, 초과) 스트레스 점수는 다르다고 할 수 있다. (P-value= 0.048)

Mixed model Ex1) 복압성 요실금 환자를(≤55, >55) 대상으로 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의 스트레스 설문지를 이용하여 스트레스 점수를 측정

N=21 (data with missing) Outcome variable : 스트레스 점수 Independent variable : age(55세 이하, 초과), time(개월)

시간에 따른 스트레스 점수 변화 양상은 연령 두 군간에 (55세 이하, 초과) 다르다. 분석 가설 시간에 따른 스트레스 점수 변화 양상은 연령 두 군간에 (55세 이하, 초과) 다르다. (Interaction effect(교호작용 효과) 검정) → Analysis using Mixed model Random effect : patient effect : due to Much variability between patients Fixed effect : age(55세 초과, 이하), time correlation structure : Ar(1)

Step1 자료 구조 변환

Step2 분석 - 혼합 모형 – 선형 – id를 개체에, visit(time을 나타내는 변수)를 반복에 넘김

Step3 상관구조(AR(1)) 선택 – 계속 click

Step4 “Stress_score”를 종속변수에 age_1(55세 이하, 초과), visit(time 변수)를 요인분석에 넘김

Step5 고정 click – age_1, visit 변수를 Ctrl키를 이용하여 지정 – “추가” 버튼을 이용하여 모형 box에 넘김

Step6 임의 click – 절편 포함 check - 개체 집단: id 변수를 개체에 넘김

Output

GEE(Generalized Estimating Equation) Ex2) 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의스트레스 설문지를 이용하여 스트레스 완화 여부를 측정 가설: 시간에 따른 스트레스 완화 가능성 변화 양상은 연령 두 군간 (55세 이하,초과) 다르다 Outcome variable : 1개월, 3개월, 6개월, 9개월, 12개월 마다 스트레스 완화 여부 측정 Independent variable : 연령 (55세 이하, 초과), time

→ Analysis using Generalized estimating equation (GEE)

Step1 분석 - 일반화 선형 모형 - 일반화 추정 방정식

Step2 개체변수 box에 “Id” 변수를, 개체내 변수에 “visit(time변수)”를 넘김 – 상관행렬(AR(1)) 지정

Step3 모형 유형: 이분형 로지스틱 check

Step4 응답: 종속변수에 “stress(유:1, 무:0)”를 넘김 – 참조범주 click – “처음” check

Step5 예측: 요인분석에 age_1, visit변수를 넘김

Step6 모형: 항 설정을 요인으로 바꿈 - age_1, visit변수를 Ctrl키를 이용하여 block 지정 후 모형에 넘김

Output

Survival analysis Kaplan-Meier 방법: 생존율 추정 Log rank test : 생존 curves간 비교 Cox regression analysis Time dependent Cox regression analysis

(Artificial) Data (JUPITER) fx time event BMI group 1 7 23 placebo 21 8 22 10 28 30 2 46 27 50 53 63 24 59 60 5 20 18 9 rosuvastatin 25 34 35 33 6

Kaplan-Meier method ← 생존율 추정

Step1 분석 – 생존 확률 – Kaplan Meier 생존분석

Step2 Time을 시간변수에, event를 상태 변수에 넘김 – 사건 정의 click

Step3 단일값에 event를 코딩한 값(=1)을 입력- 계속 click

Step4 요인에 group 변수 넘김

Step5 옵션 click – 도표: 생존 click – 계속 click

Output

Log rank test ← 그룹 간 survival curve 비교

Step1 분석 – 생존 확률 – Kaplan Meier 생존분석

Step2 Time을 시간변수에, event를 상태 변수에 넘김 – 사건 정의 click

Step3 단일값에 event를 코딩한 값(=1)을 입력- 계속 click

Step4 요인에 group 변수 넘김

Step5 요인비교 click – Log 순위 check

Step6 옵션 click – 도표: 생존 check – 계속 click

Step7 확인 click

Output

Cox regression analysis First occurrence of a major event에 대한 위험인자 분석 Rosuvastatin의 효과를 다른 인자 (fx, BMI, …)를 보정 후 분석

Step1 분석 – 생존 확률 – Cox 회귀 모형

Step2 시간에 time, 상태 변수에 event, 공변량에 BMI, group, fx변수를 넘김 – 범주형 click

Step3 fx(숫자로 코딩된 범주형 변수)를 범주형 공변량 box에 넘김 – 계속 click (참고) 문자형으로 coding되어 있는 group 변수는 자동으로 범주형 공변량으로 지정됨

Step4 옵션 click

Step5 Exp(B)의 CI check – 계속 click

Step6 확인 click

Output

PH 가정 check Graphical approach Survival curve Log(-log(survival)) curve Statistical test

Step1 : Graphical approach 분석 – 생존 확률 – Cox 회귀 모형

Step2 : Graphical approach 시간에 time, 상태 변수에 event, 공변량에 BMI, group, fx변수를 넘김 – 도표 click

Step3 : Graphical approach 생존 확률, 로그-로그 check – 계속 click - Group을 선구분 집단변수에 넘김

Step4 : Graphical approach 확인 click

Log(-log(survival)) curve Output Survival curves Log(-log(survival)) curve

Step1 : Statistical approach 분석 – 생존 확률 – Cox 회귀 모형

Step2 : Statistical approach 시간에 time, 상태 변수에 event, 공변량에 BMI, group, fx변수를 넘김 – 저장 click

Step3 : Statistical approach 편잔차 check – 계속 click

Step4 : Statistical approach 확인 click Data view variable view

Step5 : Statistical approach 분석 – 상관분석 – 이변량 상관계수

Step6 : Statistical approach Time, 편잔차 fx, 편잔차 BMI, 편잔차 group 변수를 변수 box에 넘김 – Spearman check – 확인 click

Output

(참고) Time dependent Cox regression analysis

Step1 T_를 T_cov의 표현식 box에 넘김

Step2 T_를 T_cov의 표현식 box에 넘김 – 모형 click

Step3 시간에 time, 상태변수에 event, 공변량에 fx, BMI, group, T_cov*group를 넘김 -> T_cov와 group변수를 Ctrl키를 이용하여 block지정 후, a*b 버튼을 이용하여 넘김

Step4 범주형 click

Step5 범주형 click – fx(숫자로 코딩된 범주형 변수) 넘김 - 계속

Step6 옵션 click – exp(B)의 CI 체크 - 계속

Step7 확인 click

Output