회귀분석.

Slides:



Advertisements
Similar presentations
10장. 시기별 학급경영 11조 염지수 이 슬 권용민 신해식.
Advertisements

일본 근세사. (1) 에도막부의 개창 ( ㄱ ) 세키가하라의 전투 (1600) - 히데요시의 사후 다섯 명의 다이로 ( 大老 ) 가운데 최대 영지 (250 만석 ) 를 보유하고 있던 도쿠가와 이에야스가 급부상. 이에 이에야스와 반목해 온 이시다 미쓰나리 ( 石田三成 ),
아니마 / 아니무스 송문주 조아라. 아니마 아니마란 ? 남성의 마음속에 있는 여성적 심리 경향이 인격화 한 것. 막연한 느낌이나 기분, 예견적인 육감, 비합리적인 것에 대 한 감수성, 개인적인 사랑의 능력, 자연에 대한 감정, 그리.
대구가톨릭대학교 체육교육과 06 학번 영안중학교 체육교사 신웅섭 반갑습니다. 반야월초등학교 축구부 대륜중학교 축구부 대륜고등학교 대구가톨릭대학교 차석 입학 대구가톨릭대학교 수석 졸업 2014 년 경북중등임용 체육 차석 합격 영안중학교 체육교사 근무 소개.
일장 - 1 일 24 시간 중의 명기 ( 낮 ) 의 길이 ( 밤은 암기, 낮은 명기 ) 광주기성 - 하루 중 낮의 길이의 장단에 따라 식물의 꽃눈 형성이 달라지는 현상 일장이 식물의 개화현상을 조절하는 중요한 요인 단일식물 - 단일조건에서 개화가 촉진되는 식물 장일식물.
Ch.4 수요관리와 수요예측 Ch.2 수요예측생산 ∙ 운영관리 1. 제 1 절 수요관리의 개념과 중요성 1. 수요관리의 필요성 정확한 수요예측은 사업의 성과를 좌우하는 매우 중요한 과제이다. – 수요는 판매량과 다르다. – 하지만 온갖 불확실성 요소가 난무하는 사업환경에서.
1990 년 대의 중국 대중 음악. (1) 배경 (2) 1990 년대 대중 음악 (3) 중국, 1990 년대의 분위기는 ? - 가사를 중심으로.
2 학년 6 반 1 조 고은수 구성현 권오제 김강서.  해당 언어에 본디부터 있던 말이나 그것에 기초하여 새로 만들어진 말  어떤 고장 고유의 독특한 말  Ex) 아버지, 어머니, 하늘, 땅.
2014년도 교원 및 기간제교사 성과상여금 전달교육 개 회 국기에 대한 경례 - 인사말
2. 문학의 활동 방법 [1] 문학의 수용 01 소설가 구보 씨의 일일 작가 소개 작품 정리 읽기 중 활동 학습 활동.
선진 고양교육 “유아교육 행정 업무 연수” 유치원 회계실무 및 유아학비 연수 경기도고양교육청.
제 목 : [LG U+] `14년 하반기 영업전문인재 채용 인재추천 협조 요청
묵자 겸애, 비명, 비공, 상현, 상동, 천지, 명귀, 삼표 법.
Neural Network - Perceptron
An Empirical Study on the Effectiveness Elements of Six Sigma
내 아이를 위한 구강관리.
제16장 원무통계 • 분석 ☞ 통계란 특정의 사실을 일정한 기준에 의하여 숫자로 표시한 것을 말한다.통계로서 활용할 수 있는 조건으로는 ① 동질성을 지녀야 하고 ② 기준이 명확하고 ③ 계속성이 지속되어야 하며 ④ 숫자로 표시하여야 한다 경영실적의.
판별분석의 개념과 적용(→ 추계통계적 성격)
서울지방세무사회 부가세 교육 사진클릭-자료 다운 세무사 김재우.
치매의 예방 김 은민 윤금 노인요양원 치매의.
의료의 질 평가 분석 기법 김 민 경.
상관분석(Correlation Analysis)
4-4 Comparison of Standard Deviations with the F test
일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
실습 (using SPSS) Department of Biostatistics, Samsung Biomedical Research Institute Samsung Medical Center.
제 7장 회귀분석 회귀분석의 목적 여러변수사이의 관계를 알아본기 위함 단순회귀모형과 다항회귀모형
선형회귀분석.
단순(선형)회귀분석.
품질경영 시스템에 적용 가능한 통계적 기법 ISO/TS
9.확률 분포 정규 분포 형태 : 평균을 중심으로 좌우대칭의 종 모양을 가진 분포이다.
학부모 설명회 학부모 설명회를 시작하겠습니다. 먼저, 설명회를 찾아주신 여러분께 감사의 말씀을 드립니다. 금일 강의를 하게 된 저는 우공비, 쎈이라는 교재를 만드는 좋은책신사고 본사 교육팀에서 근무하고 있는 이영호입니다. 강의는 총 1시간 정도 소요될 예정이며, 강의 종료.
Method validation.
학업 성취도에 영향을 미치는 요인.
2007 겨울 통계강좌 중급과정 제7강 중다회귀분석에 대한 이해.
2007 겨울 통계강좌 중급과정 제6강 다변량 분석에 대한 이해.
반도체 신입 Operator 채용 안내 ㈜ 하이닉스반도체에서는 2011년도 신입 Operator 사원을 모집합니다.
마산에 대하여 만든이 : 2204 김신우, 2202 권성헌.
기 초 통 계 인하대학교 통계학과.
합리적‧동태적 정원모형 설계 Wisdom21 Management Consulting.
국립공원 추가·확대 지정 설문조사 유기준 (상지대학교)
월 정례조회.
기초통계학 Chapter 5: 회귀분석 (Regression analysis)
Other ANOVA designs Two-way ANOVA
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
(independent variable)
제 7장 회귀분석 강 사 : 김 효 창.
동물의 특징을 음악적 요소로 표현 하기 음악 3학년 2학기 20. 동물의 사육제(1 / 2) 수업계획 수업활동 [제작 의도]
Keller: Stats for Mgmt & Econ, 7th Ed 다중회귀분석 Multiple Regression
독립성금증(χ2)-교차표 분석 수집된 자료가 명목척도로 측정된 경우 두 변수의 관계를 조사하는 통계기법으로 χ2독립성 검증(chi-square independence test)이 있다. 예를 들어, 특정 속성에 대하여 집단별로 어떤 차이가 있는지를 알아보기 위해서 사용하는.
4장. 기능적 행동사정과 행동중재계획 Functional Behavioral Assessments and Behavior Intervention Plans Assessment = Evaluation-Program=Diagnosis =Test 목 홍 숙.
6장 마케팅 조사 박소현, 김중호, 박기찬.
한밭대학교 창업경영대학원 회계정보학과 장 광 식
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
음양오행과 물리학 조 원 : 김용훈, 양범길, 박수진, 윤진희, 이경남, 박미옥, 박지선 (11조)
천국 가는 길 천국 가는 길 ♧ 천국 가는 길 ♧ 1. 죄와 사망(지옥) 1) 사람의 3가지 공통점 - 죄인, 죽음, 심판
한양인 주차정기권 신청 안내 2018년 2학기 관리처 관재팀.
상황별/유형별 고객응대법.
이야기 치료에 대하여 <8조 학문적 글쓰기 발표> 주희록 최은지
Linear Model.
2007 겨울 통계강좌 중급과정 제7강 중다회귀분석에 대한 이해.
Week 4: 다변수(2변수) 데이터분석 5장_1(산포도: scatter plot) 동영상 1,2,3,4,5
산점도 (Scatter Diagram) (1) 개요
제 20장 중재연구 정신전문 4학기 강미라, 이혜숙, 임현정.
SEOUL NATIONAL UNIVERSITY OF SCIENCE & TECHNOLOGY
Excel 2007을 이용한 통계학 제 2 장 자료의 정리.
CH 5. 반복이 있는 이원 배치법 랜덤化 vs 분할법 (Split-Plot design) 교호작용 (AⅹB) A x B
동 행 코 칭 결 과 방문 상황 BEST WORST 김형* PRO 총평 목 / 디지털 평촌 센터
Progress Seminar 양승만.
중국문학개론 한부와 겅건안문학 중어중국학과 ㅇ이진원 한부와 건안문학.
Progress Seminar 권순빈.
Presentation transcript:

회귀분석

학습목표 회귀분석을 적절하게 사용되는 상황 설명 회귀분석과정에서 나타나는 통계값 이해 예측방정식을 설정하고 해결 R2의 유의성 검정과 회귀계수 B의 유의성 검정에 대한 차이 설명 범주형 변수를 부호화 회귀분석을 사용한 연구결과 해석

상관분석과 회귀분석 상관분석(相關分析, correlation analysis) 두 변수 사이의 관계 유무 또는 관계의 강도(선형관계)에 대한 통계적 분석 방법 회귀분석(回歸分析, regression analysis) 두 변수 사이의 함수관계에 대한 통계적 분석 방법

1. 회귀분석 1) 회귀분석이 필요한 경우 몇 가지 알려진 증거를 바탕으로 변수들간의 상호관계 설명 이것을 이용하여 알고 있는 한 변수의 점수를 바탕으로 다른 변수의 점수 예측 R2 = .25 A ß1=.32 ß2=.14 ß3=.45 ß4=.28 D B C D

최소제곱법(The Method of Lease Square) 회귀(Regress)란 평균을 향하여 모아진다는 의미 어떤 독립변수(X)도 Y를 완전히 예측할 수 없다. 최소제곱법(The Method of Lease Square) 각각의 X와 Y의 상관도를 기준으로 Y를 예측하기위한 가장 최적합선(line of best fit)을 만들게 되는데, 이것이 최소제곱법에 의한 방법 잔차(residual) Y 개별점수와 최적합선간의 차이 잔차가 작으면 예측선은 최적합선으로 확인됨.

최적합선을 위한 scatter plot

2) 회귀분석의 두 가지 유의성 검정 예측모형이 유의한가? 어떤 변수가 유의한 예측변수인가? 주어진 독립변수들이 함께 어느 정도 예측변수의 변량을 설명(예측)하는가? R2 의 크기에 대해 F분포로 결정 자유도 (k/n-k-1: 독립변수수/대상자수-독립변수수-1) 어떤 변수가 유의한 예측변수인가? 각 독립변수(X)의 회귀계수 (b)가 유의한가? t-검정 Beta 값으로 서로 비교가능

3) 자료의 유형 독립변수: 명목, 서열, 등간, 비율척도 종속변수: 등간, 비율척도 명목, 서열척도로 측정된 경우 재부호화 한 경우 가능 종속변수: 등간, 비율척도

4) 가정 선택된 표본은 결과를 추론하기 위한 모집단을 대표하여야 한다 관련되는 변수들, 즉 X와 Y는 반드시 정규분포 하여야 한다 X의 모든 값에 대해 Y값의 잔차 분포는 동일한 분포를 보여야 한다. 등분산성 homoscedasticity 독립성 independent X와 Y의 관계는 선형이어야 한다.

2. 단순회귀분석 1) 단순회귀방정식 2) 연구문제(예제 13-1) 3) 가설 𝑦= 𝛽 0 + 𝛽 1 𝑥+e y= 종속변수, x=독립변수 𝛽 1 = 회귀계수, 𝛽 0 =절편, e=오차항 2) 연구문제(예제 13-1) 청소년의 자기효능감이 건강증진행위에 영향을 미치는가? 독립변수: 종속변수: 3) 가설 H0: 𝛽 1 = 0 H1: 𝛽 1 ≠ 0

4) 단순회귀분석 결과표 회귀모형의 적합도 판단 제곱합 SST = SSR + SSE 총 자승합 = 설명된 자승합 + 설명되지 않은 자승합 SSE SST SSR

자유도 평균제곱합 F값, p값 SSR: K(독립변수의 수) SSE: N-K-1 MSR = SSR/K MSE = SSE/N-K-1 F값, p값 자유도에서 F값의 한계치 확인 통계적인 유의성 확인

5) 회귀모델의 설명력(R2) 𝑅2= 𝑆𝑆𝑅 𝑆𝑆𝑇 𝐴𝑑𝑗. 𝑅2=𝑅2− 𝑘(1−𝑅2) 𝑛−𝑘−1 K=독립변수의 수 N=표본수

5) 회귀계수의 추정 𝛽 1 = ( 𝑥 𝑖 − 𝑥 )( 𝑦 𝑖 − 𝑦 ) ( 𝑥 𝑖 − 𝑥 ) 2 𝛽 0 = 𝑦 − 𝛽 1 𝑥 𝛽 1 = ( 𝑥 𝑖 − 𝑥 )( 𝑦 𝑖 − 𝑦 ) ( 𝑥 𝑖 − 𝑥 ) 2 𝛽 0 = 𝑦 − 𝛽 1 𝑥 검정통계량 t=회귀계수(b)/표준오차 자유도=n-2

5) 회귀계수의 유의성 회귀방정식 𝑦 =73.553+1.645𝑥 표 1. 자기효능이 건강증진행위에 미치는 영향 B0 B1 회귀방정식 𝑦 =73.553+1.645𝑥 표 1. 자기효능이 건강증진행위에 미치는 영향 자기효능감이 건강증진행위에 미치는 영향을 분석하기 위해 단순회귀분석을 실시한 결과 분석모형은 (유의수준 0.05에서) 통계적으로 유의하였고 설명력(Adj. R2)은 40.9%로 나타났다. 자기효능감이 건강증진에 긍정적인 영향을 미치는 것으로 나타났고 유의수준 0.05에서 통계적으로 유의하였다(B=1.645 p<0.05). 자기효능감이 한 단위 증가할수록 건강증진행위가 1.645 증가하는 것으로 나타났고 (유의수준 0.05에서) 통계적으로 유의하였다. 건강증진행위 ß SE 상수 73.553 8.655 자기효능 1.645* .188 Adj. R2=.409 F=76.494* * p<.05

6) 잔차분석

잔차그림(residual plot) 대략 0에 관하여 대칭적으로 나타남 설명변수(독립변수)의 값에 따른 잔차의 산포가 크게 다르지 않음 점들이 특정한 형태를 따르지 않음 모든 점들이 ±2의 범위 내에 나타남 표준정규분포에서 ±2 이내의 확률이 약 95% 모든 관측값이 ±2이내에 나타날 것임

3. 다중회귀분석 (multiple regression) 1) 다중회귀방정식 y= 종속변수, x=독립변수 a= 회귀계수, b=절편 2) 연구문제 우울, 재활행위실천, 사회적 지지가 중풍환자의 삶의 질에 미치는 영향 독립변수: 종속변수: 3) 가설 H0: ß1 = ß2 = ß3 = …… = 0 H1: ß1 = ß2 = ß3 = …… ≠ 0

3) 최적 모형(best model) 기준 순서 회귀모델의 유의성 + 회귀계수가 유의한 독립변수가 많음 모델의 설명력이 큰 경우 순서 종속변수에 유의한 독립변수 찾기 t-test, ANOVA, correlation 투입할 독립변수 선정 범주형 변수의 경우 가변수 생성 투입방법 결정(enter, stepwise) 회귀진단 독립변수들간의 상관관계 파악(다중공선성) 공차, VIF(분산팽창지수)

4) 다중회귀분석 결과표(예제 13-2) 상관관계 비교

설명력 모델의 유의성

회귀계수의 유의성 다중공선성 확인 𝑦=3.156−0.569우울+.114행위실천+.188 사회지지

잔차분석

잔차의 독립성 Durbin-Watson test : 오차간에 심각한 관련성이 있는지 평가함 (0-4의 분포) > 2.0 = 음적 상관 2 = 무상관 < 2.0 = 양적 상관 독립변수의 수에 영향을 받음. 1보다 작거나 3보다 큰 경우 우려.

다중공선성 독립변수들이 서로 지나치게 높은 상관도를 보이면 안 됨. 공차 분산팽창지수(VIF) 독립변수에 의해 설명되지 않은 종속변수의 변인 비율 각 독립변수들을 종속변수로 취급하여 다른 독립변수를 기준으로 회귀 0에 가까우면 우려 (<.02) 분산팽창지수(VIF) VIF=1/공차 공차가 높으면 VIF는 작아짐 >10 면 우려

Ex) 연령, 임상경력, 부서경력, 임파워먼트, 스트레스, 조직몰입 중 간호사의 직무만족에 영향을 미치는 주요요인을 파악하시오. 최적 모형설정 가장 유의한 요인 파악

표 . 간호사 직무만족에 영향을 미치는 요인 B SE 상수 6.093 2.319 임상경력 -.046 .042 임파워먼트 .092 .067 스트레스 .015 .037 조직몰입 .767* .085 Adj R2=.431 F=29.268* * p<.05 간호사 직무만족에 영향을 미치는 요인을 분석한 결과 조직몰입이 (유의수준 0.05에서 통계적으로 유의한: 생략가능) 긍정적인 영향을 미치는 것으로 나타났다(B=.767 p<.05). 임상경력, 임파워먼트, 스트레스는 통계적으로 유의한 영향을 미치지 않았다.

* 부호화 명목변수를 회귀분석에 투입할 수 있으나 부호화(coding)를 하여야 함 가변수(dummy) 처리 예: 결혼상태 미혼=1, 결혼=2, 이혼=3 범주수-1의 가변수 필요 Vectors 결혼상태 Dummy 1 Dummy 2 미혼 1 결혼 이혼( Reference) recoding 1=1, else=0 2=1, else=0

* 독립변수 투입방법 1) enter 2) Hierarchical 위계적 3) Stepwise 단계적 모든 변수들을 동시에 투입 2) Hierarchical 위계적 변수의 순서를 연구자가 설정 인구학적 특성, 임상적 특성, 인구학적 특성+임상적 특성 3) Stepwise 단계적 Forward 전진형: 상관관계가 높은 변수부터 투입. R2 증가에 기여하지 않는 변수는 투입 안됨 Backward 후진형: R2에 영향을 미치지 않는 변수 제거 Stepwise 단계형: Forward 전진형+ Backward 후진형 전진형의 방식으로 입력된 뒤 후진형의 방식으로 효과를 고려하여 설명력이 유의한 변수만 투입