제12주 회귀분석 Regression Analysis 중급에서 고급 통계분석으로
<회귀분석의 장점> 가장 강력한 통계분석방법임. 인과관계를 분석함. 회귀식으로 가설검증이 가능함 . 회귀식으로 예측이 가능함. BLUE: Best Least Unbiased Estimate
1. 회귀식의 표현 Y= a + bX+ e (ex) Y=-44056 + 0.106994X+e 종속변수 Y: 정부예산액
2. 회귀분석의 해석법 1) 종속변수의 확인 2) 독립변수를 확인: 회귀계수(b), t값, 신뢰도 sig t가 0.1이하(90%신뢰도), 0.5이하(95%신뢰도), 0.01이하(99%신뢰도)에서 통계적 유의성이 있음 b는 0.106994(단위 1,000,000원에서) 공무원 1인 증가시 106,994원의 예산이 증가
3. 회귀식의 설명력 R2=0.8848 회귀식이 현실적 오차를 설명하는 정도 (0%에서 100%사이) (예) 회귀식은 88.48%의 설명력이 있다.
4. 회귀식의 통계적 유의성 F값으로 통계적 유의성을 확인함
5. 결론 99%의 신뢰도 수준에서 공무원의 수(독립변수)가 정부예산규모(종속변수)에게 미치는 영향을 나타내는 회귀식은 통계적 유의성이 있고, 독립변수의 회귀계수(0.106994)도 통계적 유의성이 있으므로 이 회귀식을 믿을 수 있음. 따라서 99%의 신뢰도 수준에서 공무원수 한 사람씩 늘어날 때마다 정부예산은 0.106994씩 늘어남. 그리고 R2가 0.8848이므로 이 회귀식은 현실설명력이 88.48%이다고 해석함.
6. 회귀분석의 기본가정 1) 誤差는 평균이 0 이고 正規分布를 이룬다. 2) 誤差의 分散은 일정하다. (Homeoscedasticity: 동질적 분산) (Heteroscedasticity: 이질적 분산) 3) 誤差는 서로 獨立的이다.(Independence) (Autocorrelation:자동상관관계, t-1-->t) 4) 독립변수와 종속변수는 선형관계이다. (logit model, 이차곡선관계, 3차곡선관계) 5) 독립변수와 종속변수는 연속변수이다. 독립변수가 명목변수->가변수모델 종속변수가 명목변수->probit 모델