제 7장 회귀분석 회귀분석의 목적 여러변수사이의 관계를 알아본기 위함 단순회귀모형과 다항회귀모형

Slides:



Advertisements
Similar presentations
Ch.4 수요관리와 수요예측 Ch.2 수요예측생산 ∙ 운영관리 1. 제 1 절 수요관리의 개념과 중요성 1. 수요관리의 필요성 정확한 수요예측은 사업의 성과를 좌우하는 매우 중요한 과제이다. – 수요는 판매량과 다르다. – 하지만 온갖 불확실성 요소가 난무하는 사업환경에서.
Advertisements

EMLAB Modeling of Digital Communication Systems using Simulink Chap2. Sinusoidal Simulink Model Chap3. Digital Communications BER Performance in AWGN (BPSK.
CRM에서의 고객 세분화를 통한 이탈방지 마케팅 전략
2. 문학의 활동 방법 [1] 문학의 수용 01 소설가 구보 씨의 일일 작가 소개 작품 정리 읽기 중 활동 학습 활동.
5장, 마케팅조사의 종류와 마케팅자료 마케팅 조사원론.
제 3장 SAS를 이용하여 그래프 그리기 자료를 그림으로 표현 - 자료의 성질 파악 Base SAS와 SAS/STAT
Ⅳ. Improve Ⅳ. 개선(Improve) (1) 실험계획법 핵심요약 (2) 22 실험계획법 (3) 23 실험계획법
8. 시계열 자료 분석 기법의 1장의 1절부터 6절에 대한 내용을 요약하고, 예제 및 표에 대한 문제를 Excel을 이용하여 풀어서 제출하라. 환경공학과 정호준.
판별분석의 개념과 적용(→ 추계통계적 성격)
2장. 데이터의 시각적 묘사.
1. 활동 목적의 비교 Six Sigma의 목적은 산포를 줄여 제품 및 서비스의 결과가 완벽하게 고객의 요구에 부응하는 것임
Chapter 5. Q-LEARNING & DEEP SARSA
알기 쉽게 해설한 Java 8th edition
상관분석(Correlation Analysis)
운영리스크 고급측정법 모형의 적합성 검증방안에 대한 연구
제 6장 분산분석(ANOVA) 분산분석 이란? 여러 개의 모집단의 모평균을 비교하는 분석방법
일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
Lecture # 어셈블러 설계.
최소 자승 오차법 (Least Squares Method)
선형회귀분석.
HEC-HMS HEC-HMS를 이용한 강우-유출해석 담당교수명 : 서 영 민
롯데마트 CRM 데이터 분석 교육 2014년 12월 > RE::VISION 전용준 리비젼컨설팅 대표
롯데마트 CRM 데이터 분석 교육 2014년 12월 > RE::VISION 전용준 리비젼컨설팅 대표
9.확률 분포 정규 분포 형태 : 평균을 중심으로 좌우대칭의 종 모양을 가진 분포이다.
2.4 정규 분포의 개념 우리 주변에서 한 학교의 학생 100명을 표본으로 추출해서 각
2조 통계학교 Report 서경대학교 산업대학원 경영학과 2조 ▷ 유 성 우 김 성 환 권 석 권 혁 범 박 재 득 김 영 순.
실험계획법 및 최적설계 Lab 김석민
공차 설계와 통계 제목 발생 확률을 고려한 설계 통계적 설계법 공차해석의 개요와 목적
Technological Forecasting & social change(2014)
IS lab. 김건영 Awk, Posting list IS lab. 김건영
제 6 장 8086 어셈블러 설계.
누적 직행률(RTY) 개념 SET내 어떤 부품도 공장내 전공정에서 불량이 발생하지 않아 수리, 재작업, 폐기 없이
제 10장 주성분 분석(PCA) 주성분 분석(PCA)이란? 여러 개의 양적변수들 사이의 분산-공분산 관계를
제 2장 SAS 프로그램의 구성 DATA 단계와 PROC(EDURE) 단계
제주닷컴 매뉴얼 (실시간 예약시스템) 2013년 10월.
합리적‧동태적 정원모형 설계 Wisdom21 Management Consulting.
악보 전문 제작은 Finale에게 맡겨라!.
나이스 진로정보 초‧중‧고 연계 서비스 안내 (수) 한국교육학술정보원 교육행정부 김지광 선임연구원
기초통계학 Chapter 5: 회귀분석 (Regression analysis)
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
제 7장 회귀분석 강 사 : 김 효 창.
Electronic Engineering 2
회귀분석.
5장, 마케팅조사의 종류와 마케팅자료 마케팅 조사원론.
기업생존의 5S 실천과정.
기업생존의 5S 실천과정.
Progress Seminar 신희안.
Keller: Stats for Mgmt & Econ, 7th Ed 다중회귀분석 Multiple Regression
인공지능 소개 및 1장.
영상 기획의 개념 영상 기획은 다수의 사람들에게 보여지는 내용물을 언제 어디에서 누가 어떻게 촬영하여
제 11장 인자분석(Factor Analysis)
Electronic Engineering 2
Chapter 4: 통계적 추정과 검정 Pilsung Kang
제 9장 범주형 자료분석 범주형 자료분석 반응변수가 범주형인 경우 사용 분할표분석 (1) 동질성 검정 (2) 독립성 검정
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
제9장 인재관리 제3부 교육훈련 및 개발.
세계영화사 입문 3강 소련영화의 혁명 소비에트 몽타주.
원가 관리 교육 1.기업가치와 원가관리 2.원가구성 3.전통적 원가계산의 절차와 이해 3-1)원가계산 및 관리의 필요성
Linear Model.
기업경쟁력 강화를 위한 직원 역량개발과 육성전략
▶서류관리 프로그램 1. 로그인….2 2. 서류등록 … 서류도착 서류스티커발행
9장. 프로그램 평가.
내 마음 다해 내마음다해 주이름찬양해- 주사랑 깊어 말로다못하 네 주앞서 1-4.
매물장 로그인 직원을 미리 생성하시면 직원 ID로 로그인 가능.
Excel 2007을 이용한 통계학 제 2 장 자료의 정리.
Progress Seminar 양승만.
[ 딥러닝 기초 입문 ] 2. 통계적이 아니라 시행착오적 회귀분석 by Tensorflow - Tensorflow를 사용하는 이유, 신경망 구조 -
Progress Seminar 선석규.
Progress Seminar 권순빈.
체력 운동과 건강.
Presentation transcript:

제 7장 회귀분석 회귀분석의 목적 여러변수사이의 관계를 알아본기 위함 단순회귀모형과 다항회귀모형 한 변수의 값으로 부터 다른변수를 예측 예) 아버지의 키와 아들의 키의 관계 반응변수(종속변수), 설명변수(독립변수) 설명변수는 연속형이거나 범주형변수도 가능 예제 7.1) 진통제의 투여량과 진통지속시간에 관한 분석 변수의 변환이 필요하면 변환을 이용 단순회귀모형과 다항회귀모형

단순회귀모형(simple regression model) 단순선형회귀모형 반응변수와 설명변수가 각각 하나 반응변수와 설명변수의 변환을 통해 직선에 가까운 형태 단순선형회귀모형식 및 가정 최소제곱법을 이용 최소제곱추정량(LSE)을 계산 분산분석 회귀계수의 추론 잔차분석 1. 독립성 검정 2. 등분산성 검정 3. 정규성 검정

REG 절차 예제 7.1) DATA SIMPLE ; INPUT DOSE HR @@ ; LDOSE=LOG(DOSE) ; CARDS ; 2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73 ; RUN ; SYMBOL I=NONE V=DOT H=0.2; PROC GPLOT DATA=SIMPLE ; PLOT HR*DOSE=‘x’ ; PLOT HR*LDOSE=‘x’ ; RUN ; QUIT ; PROC REG ; MODEL HR=DOSE ; OUTPUT OUT=NEW P=PRED R=RESID ; RUN; PROC GPLOT DATA=NEW ; PLOT HR*DOSE=‘X’ PRED*DOSE=‘P’ / OVERLAY LEGEND ; PLOT RESID*DOSE=‘R’ / VREF=0 ; RUN; QUIT ;

중회귀모형 중회귀모형 설명변수가 두개이상인 모형 중회귀의 분산분석표 다항회귀 설명변수 x가 반응변수 y 사이의 관계가 직선관계가 아닌경우 즉, k차 모형인 경우 REG절차 PROC REG<options. ; <label> : MODEL dependents=<regressors> </options> ; ID variable ; VAR variables ; WEIGHTS variables ; ADD variables ; DELETE variables ;

예제 6.2) DATA LOSS ; INPUT OBS AIR TEMP ACID LOSS @@ ; CARDS ; 1 80 27 89 42 2 80 27 88 37 3 75 25 90 37 ; RUN ; PROC REG ; MODEL LOSS=AIR TEMP ACID / R DW ; RUN ; PROC REG ; MODEL LOSS=AIR TEMP / R DW ; RUN ; PAINT OBS.=21 / SYMBOL =‘H’ ; PLOT R.*P. ; PLOT R.*OBS. ; RUN;

회귀진단 회귀진단이란? 중회귀모형에서 회귀계수의 유의성을 검토하고, 이상점, 영향관측점, 다중공선성등의 존재 여부를 검토 잔차분석 회귀모수의 유의성 다중공선성(multicollinearity) 설명변수들간의 선형관계 또는 선형관계에 가까운 관계가 존재하는 경우

1) VIF>10 다중공선성 존재 2) 고유값이 1보다 심하게 작은 경우 다중공선성 존재 3) 상태지수가 크면 다중공선성 존재 4) Cook의 통계량 예제 7.2) PROC REG ; MODEL LOSS=AIR TEMP / VIF COLLIN INFLUENCE PARTIAL ; RUN ;

변수 선택법 이론적 배경 1. 반응변수를 설명하는 설명변수가 많으면 다중공선성의 문제가 발생 2. 반응변수를 설명해주지 못 하는 설명변수도 존재 3. 설명변수가 많으면 해석의 어려움이 존재 해결 방법 1. 모든 가능한 회귀 2. 변수 추가법 또는 전진 선택법(forward selection) 3. 변수 제거법 또는 후진 선택법(backward elimination) 4. 변수 증감법 또는 단계적 선택법(stepwise selection)

PROC REG<opyions> ; 변수 선택 기준 1. R-square(결정계수) 2. MSE 3. adjusted R-square(수정 결정계수) 4. Malows의 Cp 5. Akaike Information Criterion(AIC) 6. Bayesian Information Criterion(BIC) REG 절차 PROC REG<opyions> ; MODEL dependents = <regressors> </options> ;

예제 7.3) DATA HALD ; INPUT OBS X1 X2 X3 X4 Y @@ ; CARDS ; 1 7 26 6 60 78.5 2 1 29 15 52 74.3 ….. ; RUN ; PROC REG CORR ; MODEL Y=X1 X2 X3 X4 / SELECTION=FORWARD ; MODEL Y=X1 X2 X3 X4 / SELECTION=BACKWARD ; MODEL Y=X1 X2 X3 X4 / SELECTION=STEPWISE ; MODEL Y=X1 X2 X3 X4 / SELECTION=RSQUARE CP ;