로지스틱 회귀분석.

Slides:



Advertisements
Similar presentations
파이썬 (Python). 1 일 : 파이썬 프로그래밍 기초 2 일 : 객체, 문자열 3 일 : 문자인코딩, 정규표현식, 옛한글 4 일 : 파일 입출력 5 일 : 함수와 모듈 6 일 : 원시 말뭉치 다루기 실습 7 일 : 주석 말뭉치 다루기 실습 8 일 : 웹 데이터로.
Advertisements

출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
제13장 로지스틱회귀분석.
SPSS를 활용한 통계분석 김 덕 기 충북대학교 정보통계학과
R commander an introduction user-friendly and absolutely free
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
PASW 17.0 활용하기 일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
3일차 - 가설검정.
판별분석의 개념과 적용(→ 추계통계적 성격)
각 행 (row) 에서 같은 첨자가 있는 곳은 비워두고, 그 밖에 cell에 수준수 (level) 또는 반복수를 기입
비모수 통계분석 목 적 비모수 통계분석은 t검정이나 분산분석을 사용할 수 있는 등간척도 이상으로 구성된 종속변수가 아닌 서열척도로 종속변수가 구성되어 있을 경우, 또는 등간성이 의심되거나 정규분포성을 얻지 못할 경우에 순위(Rank)를 통하여 변수간의 차이를 비교할 때.
의료의 질 평가 분석 기법 김 민 경.
추론통계.
Ⅱ. 측정(Measure) (2) Gage R&R (Crossed) – ANOVA 방법 [1] Data 입력
자료분석 및 통계활용.
비모수통계.
논문을 위한 통계 집단간 평균 차이: t-test, ANOVA 하성욱 한성대학교 대학원.
일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
실습 (using SPSS) Department of Biostatistics, Samsung Biomedical Research Institute Samsung Medical Center.
통계분석 특강(속성) 서구원 한양사이버대학교 미디어MBA.
제12주 회귀분석 Regression Analysis
선형회귀분석.
모수 통계학과 비모수 통계학 Parametric Statistics, NonParametric Statistics
9.확률 분포 정규 분포 형태 : 평균을 중심으로 좌우대칭의 종 모양을 가진 분포이다.
비모수 분석 및 복습.
통계적 분석을 통한 Insulin의 정상참고치 설정
논문을 위한 통계 이변량 단순 관계 분석 하성욱 한성대학교 대학원.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
SPSS 이용한 논문 통계 강좌 우송대학교 IT 경영학과 하임숙
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
ANOVA.
상관분석 (p , p ).
상관관계 양윤권.
생존 분석 [Survival analysis]
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
자료처리 및 통계분석(2) 통계분석의 이해(2) - 가설검증 - 변수유형에 따른 통계분석방법 통계분석방법
Linear Mixed Model을 이용한 분석 결과
SPSS 강원대학교 생물학과 석사 과정생 김자경.
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
(independent variable)
Association between two measurement variables Correlation
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
SPSS - Statistics - AMOS
생활 습관과 학교 성적의 통계분석 조장: 이태훈 조원: 이진원.
연속변수간의 관계 검증 :상관분석 과 목 명 : 간호연구 및 통계 담당교수: 홍윤경.
두 모집단에 대한 검정.
Frequency distributions and Graphic presentation of data
단순회귀분석 (Simple Linear Regression Analysis)
Multiple regression analysis
제 11장 인자분석(Factor Analysis)
논문작성을 위한 연구모형 설정 양동훈.
Keller: Stats for Mgmt & Econ, 7th Ed 회귀모형의 정형화 Model Building
Intelligent Systems and Control Lab. Dept. of EE, Yeungnam Univ.
Evacuation 진동해석 결과 보고서 (사) 전북대 TIC R&D사업단 선행기술팀
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
자녀의 심리적 안정도에 미치는 부모요인 분석.
비열.
Support Vector Machine
심리적 반응 ★불안 스트레스의 가장 흔한 반응 중 하나가 불안이다. 스트레스 상황에서 경험되는 불안의 증상으로는 이전의 활동에 전혀 관심을 보이지 않고 타인을 회피하거나 세상일에 무관심해 지는 것이다. 심한 고통을 유발하는 사건을 경험한 사람들은 외상 후 스트레스 장애.
중년여성의 국선도 참여 동기와 수련만족도에 대한 연구 지도교수 김 현 문
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
11장 배열 1. 배열이란? 1.1 배열의 개요 1.2 배열의 선언과 사용.
의학전문대학원 신경생물학교실 원무호.
비교분석 보고서 Template 2015.
Week 4: 다변수(2변수) 데이터분석 5장_1(산포도: scatter plot) 동영상 1,2,3,4,5
제 8장 일반화 선형모형 회귀분석, 분산분석, 다변량분산분석 및 부분 상관분석이 가능 GLM 절차
CH4. 반복이 없는 이원배치법 ( Two-way ANOVA)
(Analysis of Variation, ANOVA)
알렌 인지 수준 판별검사와 한국판 간이 정신상태 판별검사의 상관관계
Presentation transcript:

로지스틱 회귀분석

강의 준비 확인 R과 R commander 시작 작업 디렉토리 바꾸기 메뉴를 이용하여 본인의 데이터가 있는 폴더 지정 데이터 셋(psych.RData)탑재

생명표(life table), Kaplan-Meier 알고 싶은 내용 모수적 방법 (정규성) 비모수적 방법 (정규성아님) 독립된 두 집단의 평균 비교 t-test Wilcoxon test 짝지은 두 집단의 평균 비교 Paired t-test Paired-samples Wilcoxon test 세 집단 이상 평균 비교 ANOVA (Analysis of Variance) Kruskal-Wallis test 반복 측정된 세 집단 이상의 평균 비교 Repeated measured ANOVA Friedman rank-sum test 두 변수간의 상관관계 Pearson’s correlation Spearman’s correlation Kendall’s tau 독립(설명)변수와 연속형 종속(반응)변수와의 관계 회귀분석 (Linear regression analysis) 독립(설명)변수와 이분형 종속(반응)변수와의 관계 로지스틱 회귀분석 (Logistic regression analysis) 두 집단 이상의 frequency(율) 비교 Chi-square test (χ2 test) Fisher’s exact test 시간에 따른 event 발생 위험도 산출 생명표(life table), Kaplan-Meier Weibull model, exponential model, Gaussian model, logistic model, lognormal model, log-logistic model Cox proportional hazard model

강의 진행 로지스틱 회귀분석이란? 주요 노출변수(x, exposure)가 범주형인 경우 X의 참고범주에 비해 해당범주에서 y가 발생할 위험도가 OR배만큼 높다 (낮다) 주요 노출변수(x, exposure)가 연속형인 경우 X가 1단위 증가할 때마다 y가 발생할 위험도가 OR배만큼 증가 (감소)

로지스틱 회귀분석이란? x(노출변수, 연속형과 범주형 모두 가능)  y (이분형 outcome, 질병발생 유무) 회귀분석의 확장형태(일반적인 모델) 오즈비 (OR, Odds Ratio) 교차비 노출군에서 질병발생률 비노출군에서 질병발생률 odds= p/(1-p) 이길 확률/질 확률 도박 승산비

R에서의 로지스틱 회귀분석 종속변수(y) 반드시 이분형(0 또는 1) 숫자변수이어야 함 epicalc 패키지 설치

library(epicalc) 로지스틱 회귀분석을 할 때마다 써줘야 함

OR 구하기 설명변수(x)가 하나이면서, 이 변수가 연속형이거나 범주가 두 개 (성별, 노출유무)인 경우 library(epicalc) logistic.display(모델이름) 설명변수(x)가 하나이면서 이 변수 범주가 셋 이상(사는지역(live1), 학력, 종교…)인 경우 또는 설명변수(x)가 둘 이상 logistic.display(모델이름, simplified=T)

주요 노출변수(x, exposure)가 범주형인 경우: 방제작업 참여는 외상후 스트레스 증후에 영향을 미치는가? 귀무가설: 방제작업에 참여하지 않은 군과 방제작업에 참여한 군은 외상후 스트레스 증후를 나타낼 확률이 같다. 대립가설: 방제작업에 참여하지 않은 군과 방제작업에 참여한 군은 외상후 스트레스 증후를 나타낼 확률이 다르다.

β 우리의 관심사는 OR

그럼 OR을 구해보자. OR은 몇 배, 즉 곱의 개념이므로 1이 기준 유의수준 0.05하에서 95%신뢰구간이 1을 포함하지 않으므로 귀무가설을 기각할 수 있다. 즉, 방제작업 참여하지 않은 군에 비해 방제작업 참여한 군의 외상후 스트레스 증후를 나타낼 위험이 3.08배 (95% CI: 1.94-4.90) 유의하게 높았다.

cOR and 95% CI estimated using logistic regression model Table 6. Odds ratio and 95% CI for posttraumatic stress disorder (PTSD) according to clean-up work PTSD N Case cOR 95% CI aOR Clean-up work No 216 22 1.00 Ref. Yes 962 249 3.08 1.94-4.90 cOR and 95% CI estimated using logistic regression model aOR and 95% CI estimated using logistic regression model adjusted for age, gender, and living area 두 숫자 사이를 콤마(,)로 표기하기도 함

다변량 로지스틱

방제작업 참여는 나이, 성별, 사는 지역을 보정한 후에도 외상 후 스트레스 증후에 영향을 미치는가? 방제작업 참여는 나이, 성별, 사는 지역을 보정한 후에도 외상 후 스트레스 증후에 영향을 미치는가?

유의수준 0.05하에서 95%신뢰구간이 1을 포함하지 않으므로 귀무가설을 기각할 수 있다. 연령, 성별, 사는 지역을 보정하였을 때, 방제작업 참여하지 않은 군에 비해 방제작업 참여한 군의 외상후 스트레스 증후를 나타낼 위험도가 2.41배 (95% CI: 1.48-3.94) 유의하게 높았다.

Table 6. Odds ratio and 95% CI for posttraumatic stress disorder (PTSD) according to clean-up work Case cOR 95% CI aOR Clean-up work No 216 22 1.00 Ref. Yes 962 249 3.08 1.94-4.90 2.41 1.48-3.94 cOR and 95% CI estimated using logistic regression model aOR and 95% CI estimated using logistic regression model adjusted for age, gender, and living area

주요 노출변수(x, exposure)가 연속형인 경우: 연령이 증가할수록 외상후 스트레스 증후 위험도가 증가할까? 귀무가설: 연령은 외상후 스트레스 증후 위험도에 영향을 미치지 않는다. (관련이 없다.) 대립가설: 연령은 외상후 스트레스 증후 위험도에 영향을 미친다. (관련이 있다.)

유의수준 0.05하에서 95%신뢰구간이 1을 포함하지 않으므로 귀무가설을 기각할 수 있다. 즉, 연령이 1세 증가할 때마다 외상후 스트레스 증후가 1.03배 (95% CI: 1.02-1.04) 유의하게 높았다.

그렇다면 성별을 보정한 후에도 연령이 증가할수록 외상 후 스트레스 증후 위험도가 증가할까? 그렇다면 성별을 보정한 후에도 연령이 증가할수록 외상 후 스트레스 증후 위험도가 증가할까?

유의수준 0.05하에서 95%신뢰구간이 1을 포함하지 않으므로 귀무가설을 기각할 수 있다. 즉, 성별을 보정하였을 때, 연령이 1세 증가할 때마다 외상후 스트레스 증후가 1.03배 (95% CI: 1.02-1.04) 유의하게 높았다.

Table 7. Odds ratio and 95% CI for posttraumatic stress disorder (PTSD) according to age Case cOR 95% CI aOR Age 1197 276 1.03 1.02-1.04 cOR and 95% CI estimated using logistic regression model aOR and 95% CI estimated using logistic regression model adjusted for gender

과 제 비만도가 고혈압(hbp_cog_yn)에 어떤 영향을 미치는지 분석하시오. 보정 안하고 과 제 비만도가 고혈압(hbp_cog_yn)에 어떤 영향을 미치는지 분석하시오. 보정 안하고 나이(생애주기연령군), 성별 보정하고 N, case, OR, 95% CI 구하여 표로 나타내고 결과 해석

감사합니다.