Download presentation
Presentation is loading. Please wait.
1
(independent variable)
독립변수 (independent variable) 종속변수 (dependent variable) 8.1 상관 분석 (Correlation Analysis) 2개의 확률변수 (Random Variable, X, Y) 의 상관 관계를 분석 산점도 (or 산포도, Scatter Analysis) 랜덤 샘플 (xi , yi) i = 1,2, ···, n 에 대해서 그림 8.1 양의 상관, 음의 상관, 곡선, 이상점 (outlier), 층별 모집단 상관 계수 (Population Correlation Coefficient) 여기서 X Y y = f ( x )
2
표본 상관계수 (Sample Correlation Coefficient) : (xi , yi)
여기서 ρ와 r 의 관계
3
r의 성질 -1 ≤ r ≤ 1 r = ± 1 이면 모든 점이 일직선 상에 놓인다 (예제 8.1) y x
4
8.1 단순회귀분석 (Simple linear Regression Analysis)
변수들간의 관련성을 수학식으로 모델링 한 후 분산 분석 단순 회귀분석 : 독립변수 (X) 관계를 1차 함수, 직선(linear) 으로 종속변수 (Y) 모델링 중 회귀분석 (multiple linear regression analysis) 독립변수가 2개 이상이고 (X1, X2, · · ·) 1차 함수로 모델링 단순 회귀 모형 (Simple linear regression model)
5
최소 제곱법 (method of least squares) :
오차의 제곱합을 최소로 하는 을 구함 (예제 8.4)
6
8.2.3 분산 분석 \ y x 잔차(residual)
7
잔차 (residual) 잔차제곱합 총변동 (total variation) TSS 회귀제곱합 (regression sum
of square) SSR 잔차제곱합 (residual sum SSE
8
F 검정 회귀평균제곱 (regression mean square, , MSR) (단순회귀에서 ) 잔차 평균 제곱 (residual mean square, , MSE) 가설 (Hypothesis) 만약 이면, reject H0 and 회귀직선 유의함 <표 8.2>
9
결정계수 (confficient of determination, r2) 또는 회귀선의 기여율
총 변동 중에서 회귀선에 의해서 설명되는 변동이 차지하는 비율 은 모든 측정값이 회귀선상에 있을때, 은 일때 상관계수 r 은 가 양이면 가 음이면 예제 8.5 상관계수
Similar presentations