기 초 통 계 인하대학교 통계학과
목 차 ❖ 1 장. 서 론 ❖ 2 장. 표와 그림을 통한 자료의 요약 ❖ 3 장. 수치를 통한 연속형 자료의 요약 목 차 ❖ 1 장. 서 론 ❖ 2 장. 표와 그림을 통한 자료의 요약 ❖ 3 장. 수치를 통한 연속형 자료의 요약 ❖ 4 장. 두 변수 자료의 요약 ❖ 5 장. 확 률 ❖ 6 장. 확률분포 ❖ 7 장. 이항분포와 그에 관련된 분포들 ❖ 8 장. 정규분포 ❖ 9 장. 표집분포 ❖ 10 장. 통계적 추론 ❖ 11 장. 정규모집단에서의 추론 ❖ 12 장. 두 모집단의 비교 ❖ 13 장. 회귀분석 ❖ 14 장. 분산분석 ❖ 15 장. 범주형 자료 분석
회귀분석 소개 : 독립변수 : 원인 : 조정가능 : 종속변수 : 결과 : 관측가능 F. Galton : 아버지의 키, 아들의 키, Regression 용어 유래 Examples : 공장 – 상품의 개수, 소요되는 경비 농장 – 비료의 양, 수확량 교육 – 공부시간, 지식습득 용어 : 독립변수 : 원인 : 조정가능 : 종속변수 : 결과 : 관측가능
회귀분석 예 복용량에 따른 효과의 지속시간의 관계 : 약품의 복용량 : 효과가 지속되는 기간 1
단순선형 회귀모형 자료 : 예 제 독립
최소 제곱 추정법 (Least Squares Estimation) - 1 : 와 의 관계를 설명하는 하나의 직선식. 이와 같은 직선식 중에서 세로거리 제곱합을 최소로 하는 직선을 찾는다.
최소 제곱 추정법 (Least Squares Estimation) - 2 추정회귀직선 : 잔차( ) : residual
(Sum of Squares due to error : 잔차제곱합) 의 추정량 cf. 기존의 의 계산식 : 예 제 : (Sum of Squares due to error : 잔차제곱합)
최소 제곱 추정량의 분포 모델 : Note: 자료가 축으로 넓게 퍼져 있을수록 (즉, 가 클수록) 추론이 정밀해진다. 자료가 축으로 넓게 퍼져 있을수록 (즉, 가 클수록) 추론이 정밀해진다. 자료가 =0의 좌우에 고르게 퍼져 있을수록 (즉, ) 에 대한 추론이 정확해진다.
표준화된 통계량 ( 가 미지수일 때)
에 대한 신뢰구간 예 제
에 대한 검정통계량 예 제
일 때 의 기대값에 대한 추론 가 로부터 멀수록 정밀한 추론이 어렵다. (variance 커짐)
에 대한 신뢰구간 Note : 가 로부터 떨어져 있을수록 신뢰구간의 길이가 길어진다
에 대한 검정 검정통계량 :
연습문제 #3.10 - 1
연습문제 #3.10 - 2
연습문제 #3.10 - 3
연습문제 #4.8
연습문제 #4.8 - 2
연습문제 #4.8 - 3
선형 관계의 강도 y의 편차. 선형관계로 설명되는 부분. 잔차. 선형관계로 설명되지 않는 부분. SST 총변동 SSR 설명되는 변동 SSE 설명되지 않는 변동
결정계수 ( ) 예 제 (표본 상관계수의 제곱)
과 의 관계 ( 과 은 같은 부호를 갖는다.)
선형회귀 모형에서의 가정 검토 - 1 가정 : 선형성 : 등분산성 ~독립 : 독립성 : 정규성 : 선형성 : 등분산성 ~독립 : 독립성 : 정규성 1)선형성 : Plot 등으로부터 판단. 변환을 시도. 2차항 추가.
선형회귀 모형에서의 가정 검토 - 2 3)등분산성 : Plot 등으로부터 판단. 변환 고려. 4)독립성 : Plot 양의 상관관계 음의 상관관계
선형회귀 모형에서의 가정 검토 - 3 5)정규성 : 정규확률그림
Thank You!