(Analysis of Variation, ANOVA)

Slides:



Advertisements
Similar presentations
Statistics 상지대학교 1 / 22 추정 개요 점추정과 구간추정 표본크기 두 모집단의 비교.
Advertisements

제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
울산의대 이무송 1 다중 수준 분석 Multi-Level Analysis 울산의대 예방의학교실 이무송 2004 년 7 월 9 일.
제13장 로지스틱회귀분석.
SPSS를 활용한 통계분석 김 덕 기 충북대학교 정보통계학과
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
3일차 - 가설검정.
4.3 난괴법 (Randomized Block Design)
각 행 (row) 에서 같은 첨자가 있는 곳은 비워두고, 그 밖에 cell에 수준수 (level) 또는 반복수를 기입
추론통계.
Ⅱ. 측정(Measure) (2) Gage R&R (Crossed) – ANOVA 방법 [1] Data 입력
제 12 장 직교배열표에 의한 실험계획(1).
ANOVA-test.
자료분석 및 통계활용.
비모수통계.
통계분석 특강(속성) 서구원 한양사이버대학교 미디어MBA.
제12주 회귀분석 Regression Analysis
제 19 장 유의성 검정 가설검정의 원리 귀무가설과 대립가설 검정통계량과 유의수준 제1종 오류와 제2종 오류 유의성 검정절차
비모수 분석 및 복습.
· 제 14 장 상관관계분석과 회귀분석 상관관계분석
가설검정 9 1 가설검정 2 모평균의 검정 3 모비율의 검정 4 c2-검정과 모분산의 검정.
비선형 방정식 김영광.
제1강 변량분석이란 무엇이며 일원변량분석은 어떻게 하는가?
SPSS 이용한 논문 통계 강좌 우송대학교 IT 경영학과 하임숙
ANOVA.
상관분석 (p , p ).
18F-FDG 생산 효율 증가 및 안정화 30 th May 2009 화순전남대학교병원 핵의학과 *이지웅,장화연,신상민,김명준
자료처리 및 통계분석(2) 통계분석의 이해(2) - 가설검증 - 변수유형에 따른 통계분석방법 통계분석방법
SPSS - Statistics - AMOS
Keller: Stats for Mgmt & Econ, 7th Ed
마케팅 조사론 Marketing Research.
11장 세 개 이상의 모집단 평균에 대한 추론(분산분석)
제 7장. 분할법 (split-plot design).
(independent variable)
10장 두 개의 모집단에 대한 추론 2019년 4월 5일 오후 4시 22분2019년 4월 5일 오후 4시 22분
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
일원분산분석(one-way ANOVA)
회귀분석(Regression).
생산 분석을 위한 확률 및 통계 현대로템 직무능력 향상 교육 - 1주차
생활 습관과 학교 성적의 통계분석 조장: 이태훈 조원: 이진원.
두 모집단에 대한 검정.
단순회귀분석 (Simple Linear Regression Analysis)
하이스코 기업문화 실행 프로그램의 실태조사 2조- 노라조.
Multiple regression analysis
논문작성을 위한 연구모형 설정 양동훈.
6.4 삼원배치 (혼합모형, no replication)
Keller: Stats for Mgmt & Econ, 7th Ed 회귀모형의 정형화 Model Building
검정 개요 모평균의 검정 모비율의 검정.
Sampling Distributions
Intelligent Systems and Control Lab. Dept. of EE, Yeungnam Univ.
자녀의 심리적 안정도에 미치는 부모요인 분석.
행성을 움직이는 힘은 무엇일까?(2) 만유인력과 구심력 만유인력과 케플러 제3법칙.
교육통계 공분산분석 발표자 : 김 성 순(석사2학기) 발표일 : (수) ANCOVA.
계량경제학 1.관광수요의 결정요인 2.관광수입과 환율의 상관 관계..
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
제 12장  원가추정 강사: 정재을 과목: 원가회계.
제 8장 일반화 선형모형 회귀분석, 분산분석, 다변량분산분석 및 부분 상관분석이 가능 GLM 절차
추리통계학의 기본개념.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
CH4. 반복이 없는 이원배치법 ( Two-way ANOVA)
주택 공시가격과 실거래가격의 차이에 관한 연구
제4장 다중회귀분석 1절 다중회귀모형과 기본가정 다중회귀모형 기본가정 2절 추정방법 최소제곱추정량과 가우스-마르코프 정리
문제의 답안 잘 생각해 보시기 바랍니다..
Survey Sampling Sangji University.
이 은 Tyler 교육과정 개발 모형 이 은
Presentation transcript:

(Analysis of Variation, ANOVA) 통계학 분산분석 (Analysis of Variation, ANOVA)

분산분석 목적 : 일반적으로 셋 이상의 모집단에 대해 모평균의 차이가 있는지 여부를 알아보기 위한 검정 -> 독립변수의 효과를 분석 예) 온도변화에 대한 작물성장 요인 : 결과에 영향을 주는 실제 인자 (온도) 수준 : 요인의 조건 (10℃, 20℃) 처리조합 : 요인의 수준조합 단일요인과 생산량의 관계를 분석하는 것을 일원분산분석이라 함

일원배치법 (일원분산분석) 하나의 종속변수에 대해 하나의 요인의 영향을 분석 요인 (A)의 (k)개의 수준 A1, A2,…Ak에서 (m)번씩 반복하여 실험한 결과 수준 A1 A2 ….. Ak 1 y11 y21 yk1 2 y12 y22 yk2 3 y13 y23 yk3 m y1m y2m ykm 합계 y1 y2 yk 평균

j번째 모집단의 평균은 전체 평균과 그 모집단의 성분인 요인수준 효과 αj의 합과 같다고 볼 수 있으므로 일원분산분석모형 yij : j번째 처리에 대한 i번째 관찰치 μj : j번째 처리의 모수 평균 εij : 오차항 j번째 모집단의 평균은 전체 평균과 그 모집단의 성분인 요인수준 효과 αj의 합과 같다고 볼 수 있으므로 관찰치 전체 표본평균 추정된 요인수준효과 잔차

(총편차) (처리효과편차) (잔차) 기계 (I) 기계 (II) 기계 (III) 총편차 y y1 y2 y3 처리효과 편차 잔차

SST (총제곱합) = SSA (요인 A의 제곱합) + SSE (오차제곱합) 두 변동 중 요인에 의한 변동이 총 변동을 상대적으로 더 많이 설명할 수 있다면 수준에 따라 평균차이가 있음을 뜻하고, 반대로 오차에 의한 변동이 상대적으로 크다면 총 변동의 원인은 요인의 수준차이에 기인한다고 보기 어려움

평균제곱=제곱합/자유도 일원배치법의 분산분석표 가설 : Ho : μ1=μ2=…=μk Ha : 적어도 하나 이상의 평균이 다름 임계치 : f (α, k-1, n-k) 분산분석표의 검정통계량 f가 f(α, k-1, n-k)보다 크다면 귀무가설 기각 -> 평균이 다름 평균제곱=제곱합/자유도 요인 제곱합 자유도 평균제곱 A SSA k-1 MSA=SSA/(k-1) 잔차(오차) SSE n-k MSE=SSE/(n-k) 합계 SST n-1 F=MSA/MSE

예제 한 공장에서 세 종류의 기계 (기계I, 기계II, 기계III)의 일일 생산량을 조사하였다. 분산분석을 통해 평균차이를 여부를 조사하라 (유의수준,0.05) 기계(I) 기계(II) 기계(III) 생산량 25 21 22 20 16 26 15

기계(I) 기계(II) 기계(III) 총계 생산량 25 21 22 20 16 26 15 합계 96 72 63 231 평균 24 18 표본계수 4 3 11 SST =(25-21)2 + (20-21)2+…+(21-21)2=122 SSA = 4(24-21)2 +4(18-21)2+3(21-21)2=72 SSE = SST-SSA = 50

검정 분산분석표 임계치 : f (0.05, 2, 8) = 비교, 해석 요인 제곱합 자유도 평균제곱 A 잔차(오차) 합계 F= 2 36 8 6.25 122 10 5.76 4.46 대립가설 채택->평균 다름->영향 있음

SPSS 실행 입력 -> 분석->평균비교->일원배치분산분석

이원배치법 (이원분산분석) 요인이 둘 있는 경우로 확장 (예, 기계종류+작업자의 경력) 반복이 있는 경우와 반복이 없는 경우로 구분

반복이 없는 이원분산분석 반복이 없는 경우의 모형 αi = 요인 1의 고정된 효과 βj = 요인 2의 고정된 효과 각 관찰치는 다음과 같은 네 개의 성분으로 분리 g : 요인 1의 수준 (기계종류) c : 요인 2의 수준 (경력)

SST = SSA + SSB + SSE 반복이 없는 경우의 이원분산분석표 요인 제곱합 자유도 평균제곱 F 요인 1 SSA g-1 MSA=SSA/(g-1) MSA/MSE 요인 2 SSB c-1 MSB=SSB/(c-1) MSB/MSE 잔차(오차) SSE (g-1)(c-1) MSE=SSE/(g-1)(c-1) 합계 SST gc-1

예제 앞의 예제에서 세 종류의 기계와 작업자의 경력 (1년, 4년, 8년)의 일일 생산량을 조사하였다. 분산분석을 통해 기계나 경력이 생산량에 영향을 미치는지 여부를 조사하라 (유의수준,0.05) 기계(I) 기계(II) 기계(III) 1년 25 20 21 4년 28 22 19 8년 18 23

SST = (25-22)2+(28-22) 2+…+(23-22) 2=76 SSA = 기계(I) 기계(II) 기계(III) 합계 평균 1년 25 20 21 66 22 4년 28 19 69 23 8년 18 63 75 60 198 SST = SSA = SSB = SSE = (25-22)2+(28-22) 2+…+(23-22) 2=76 3{(25-22)2+(20-22)2+(21-22)2}=42 3{(22-22)2+(23-22)2+(21-22)2}=6 SST-SSA-SSB=28

요인 제곱합 자유도 평균제곱 f F(0.05) 기계 경력 잔차(오차) 합계 42 2 21 3.0 6.94 6 2 3 0.43 6.94 28 4 7 76 8 기계 = 경력 = 귀무가설 채택->영향 없음

SPSS 실행 입력->분석->일반선형모형->일변량

반복이 있는 이원분산분석 두 요인의 조합 총 개수 g * c에 각각 h 의 반복적 관찰치 반복이 있는 경우의 모형 αi = 요인 1의 고정된 효과 βj = 요인 2의 고정된 효과 αβij = 요인 1과 요인 2의 상호작용효과

상호작용 없음->αβ제거 상호작용 있음->αβ고려 요인 2의 수준 1 요인 2의 수준 2 요인 1의 수준

SST = SSA + SSB + SSAB + SSE 각 관찰치를 네 개의 성분으로 분리하면 따라서 SST = SSA + SSB + SSAB + SSE

SST = SSA + SSB +SSAB + SSE 반복이 있는 경우의 이원분산분석표 요인 제곱합 자유도 평균제곱 F 요인 1 SSA g-1 MSA=SSA/(g-1) MSA/MSE 요인 2 SSB c-1 MSB=SSB/(c-1) MSB/MSE 상호작용 SSAB (g-1)(c-1) MSAB=SSAB/(g-1)(c-1) MSAB/MSE 잔차(오차) SSE gc(h-1) MSE=SSE/gc(h-1) 합계 SST gch-1

예제 화학공장에서 압력에 3개의 요인수준, 온도에 2개의 요인수준에 대해 각 3회의 수율실험을 하였다.각 요인의 영향을 분석하여라 (유의수준, 0.05) 200 250 300 저온 98 108 104 89 99 111 86 114 100 고온 115 106 102 109 121 92

200 250 300 합계 저온 98 108 104 89 99 111 86 114 100 계 273 321 315 909 평균 91 107 105 101 고온 115 106 102 109 121 92 303 345 297 945 총계 576 666 612 1854 총평균 96 103

SST = {(98-103)2+(89-103)2+…+(92-103)2}=1414 SSA = 2*3{(96-103)2+(111-103)2+(102-103)2}=684 SSB = 3*3{(101-103)2+(105-103)2}=72 SSAB = 3*{(91-96-101+103)2+(101-96-105+103)2 +…+ (99-102-105+103)2}=228 SSE = SST-SSA-SSB-SSAB=430

요인 제곱합 자유도 평균제곱 f F(0.05) 압력 온도 상호작용 잔차(오차) 합계 684 2 342 9.55 3.89 72 1 72 2.01 4.75 228 2 114 3.18 3.89 430 12 35.83 1414 17 압력 : 온도 : 상호작용 : 대립가설 채택->수율에 영향 줌 귀무가설 채택->수율에 영향 없음 귀무가설 채택-> 상호작용 없음

SPSS 실행 입력->분석->일반선형모형->일변량