Other ANOVA designs Two-way ANOVA

Slides:



Advertisements
Similar presentations
EMLAB Modeling of Digital Communication Systems using Simulink Chap2. Sinusoidal Simulink Model Chap3. Digital Communications BER Performance in AWGN (BPSK.
Advertisements

1 통계를 왜 공부해야 하나 ? Dept. of Public Administration Chungnam National University.
보험의 본질과 생명보험 학기 전주대학교.
Development and Initial Validation of Quality-of-Life Questionnaires for Intermittent Exotropia Ophthalmology 2010;117:163–168 Pf. 임혜빈 / R2 정병주.
(주)금성정공 Single PPM 테마활동 추진사례
14주차 1교시 강화계획 [학습목표] 1. 강화계획의 정의를 안다 [학습내용] 1. 단순한 강화계획 2. 간헐적 강화 3. 복합 계획 4. 선택과 대응법칙 [사전학습] 강화계획이 일어날 수 있는 사례를 생각해본다.
Ⅳ. Improve Ⅳ. 개선(Improve) (1) 실험계획법 핵심요약 (2) 22 실험계획법 (3) 23 실험계획법
SAP QUERY SAP R/3 4.6C.
연장근로와 야간·휴일근로 김영호 노무사 나눔 노사관계연구소 소장 연세대 일반대학원 박사 수료 고려사이버대 법학과 외래교수
제 13 장 직교배열표에 의한 실험계획(Ⅱ).
모형설계제작 2015학년도 2학기 서강대학교 기계공학과 2nd O.T
비모수 통계분석 목 적 비모수 통계분석은 t검정이나 분산분석을 사용할 수 있는 등간척도 이상으로 구성된 종속변수가 아닌 서열척도로 종속변수가 구성되어 있을 경우, 또는 등간성이 의심되거나 정규분포성을 얻지 못할 경우에 순위(Rank)를 통하여 변수간의 차이를 비교할 때.
의료의 질 평가 분석 기법 김 민 경.
상관분석(Correlation Analysis)
제 6장 분산분석(ANOVA) 분산분석 이란? 여러 개의 모집단의 모평균을 비교하는 분석방법
논문을 위한 통계 집단간 평균 차이: t-test, ANOVA 하성욱 한성대학교 대학원.
일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
실습 (using SPSS) Department of Biostatistics, Samsung Biomedical Research Institute Samsung Medical Center.
제1장 과학과 사회조사방법 과학적 지식(scientific knowledge): 과학적 방법에 의해 얻어진 지식, 즉 논리적, 체계적, 경험적, 객관적 절차를 통해 얻어진 지식 과학적 지식의 특성 1) 재생가능성(reproducibility) 2) 경험가능성(empiricism)
선형회귀분석.
9.확률 분포 정규 분포 형태 : 평균을 중심으로 좌우대칭의 종 모양을 가진 분포이다.
CHAPTER 21 UNIVARIATE STATISTICS
8차시: 측정시스템 분석(MSA) 학 습 목 표 학 습 내 용 1. 측정시스템 분석(MSA) 개념 이해
Cluster Analysis (군집 분석)
SPSS를 활용한 통계분석 김 덕 기 충북대학교 정보통계학과
Chapter 10. 파일 시스템 인터페이스(File System Interface)
MINITAB for Six Sigma.
Fault Diagnosis for Embedded Read-Only Memories
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
제7장 추정과 가설 검정.
Inferences concerning multiple populations ANOVA
GPU Gems 3 Chapter 13. Volumetric Light Scattering as a Post-Process
4-1 Gaussian Distribution
서울아산병원 의학통계학과 울산의대 예방의학교실 이무송
기 초 통 계 인하대학교 통계학과.
국립공원 추가·확대 지정 설문조사 유기준 (상지대학교)
Hypothesis Testing 가설 검정
은행연합회 비시장성지분증권 시스템 사원은행 담당자용 사용설명서
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
한밭대학교 산업경영공학과 강진규 ( jkkang.com.ne.kr)
Association between two measurement variables Correlation
회귀분석.
Inferences concerning two populations and paired comparisons
Association between two measurement variables Correlation
: Two Sample Test - paired t-test - t-test - modified t-test
Keller: Stats for Mgmt & Econ, 7th Ed 다중회귀분석 Multiple Regression
Statistical inference I (통계적 추론)
영어 원어민 한국어 학습자의 초분절음 특징 연구 이 문서는 나눔글꼴로 작성되었습니다. 설치하기.
독립성금증(χ2)-교차표 분석 수집된 자료가 명목척도로 측정된 경우 두 변수의 관계를 조사하는 통계기법으로 χ2독립성 검증(chi-square independence test)이 있다. 예를 들어, 특정 속성에 대하여 집단별로 어떤 차이가 있는지를 알아보기 위해서 사용하는.
The normal distribution (정규분포)
사용자 경험 측정 (Measuring User Experience)
기업회생 절차.
2. 윤리학의 원리와 적용 가. 상대주의와 절대주의.
Chapter Ⅱ. 연구 설계.
통계방법의 이해.
SEOUL NATIONAL UNIVERSITY OF SCIENCE & TECHNOLOGY
교육방법 및 평가방법 안내.
Chapter 4: 통계적 추정과 검정 Pilsung Kang
Eliminating noise and other sources of error
제2장 통계학의 기초 1절 확률 기본정의 확률의 기본 공리와 법칙 2절 확률변수와 확률분포 3절 정규분포와 관련 분포 정규분포
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
Week 13:가설검정(Hypothesis Testing)
1. 관계 데이터 모델 (1) 관계 데이터 모델 정의 ① 논리적인 데이터 모델에서 데이터간의 관계를 기본키(primary key) 와 이를 참조하는 외래키(foreign key)로 표현하는 데이터 모델 ② 개체 집합에 대한 속성 관계를 표현하기 위해 개체를 테이블(table)
이산수학(Discrete Mathematics)
4.1 실험연구/관측연구 기초 4.2 좋은 실험연구란? 4.3 좋은 관측연구란?
제3장 사회조사방법의 기본개념 변수(variable): 사람, 물건, 사건 등의 특성이나 속성이 두 가지 이상의 가치(value)를 가질 때 변수라고 함. 즉 상호배타적인 속성들의 집합 1) 속성에 따른 분류 -. 명목변수(Nominal Variable): 분류에 기초를.
제 20장 중재연구 정신전문 4학기 강미라, 이혜숙, 임현정.
CH4. 반복이 없는 이원배치법 ( Two-way ANOVA)
Body weight and fat mass decreases in leucine-deprived mice.
CH 5. 반복이 있는 이원 배치법 랜덤化 vs 분할법 (Split-Plot design) 교호작용 (AⅹB) A x B
Presentation transcript:

Other ANOVA designs Two-way ANOVA Chapter 11

Two-way ANOVA In this chapter Randomized block design Factorial design

The randomized block design Ex. 10.1 (diet experiment)에서 inbred mice를 사용함으로써 유전적 차이에 의한 error를 제거함 야생 쥐에 관심이 있을 경우 inbred 개체들을 실험에 사용하는 것은 불가능하며 실험 개체들 사이에 유전적 변이가 존재함 야생 쥐로 Fixed-effect one-way ANOVA를 사용할 경우 이러한 genetic and age 차이에 의해서 error variance가 커지고 따라서 null hypothesis를 reject하기 힘들어짐 Type II error가 커진다 Randomized block design을 사용하면 이러한 문제를 해결할 수 있다

The randomized block design Error variance를 분리해내기를 원하는 특성에 따라 실험개체들을 grouping (blocked) 한다 Ex. 야생 쥐의 경우 litters (한배의 새끼)에 따라 grouping 한다 Same litter의 경우 유전적으로 유사하고 same age 이므로 따라서 이 실험의 경우 실험대상 쥐들은 두 기준 (criteria)에 의해 분류됨 Diet and litter 각 diet and litter combination에 하나의 실험 개체가 존재 (no replication) Two-way ANOVA without replication이라 부른다 Mixed effects model Diet: fixed factor; Litter: random factor

The randomized block design Ex. 11.1 거의 같은 나이의 야생 쥐 10 litters를 실험 개체로 선택 Litter: 한배새끼 각 litter에서 3마리를 3 groups으로 배당한 후 다른 diet (control, junk food, health food) 처리를 함 체중 증가를 기록함 Null hypothesis?? 2개의 귀무가설 H0: groups (diets)사이에 차이가 없다 H0: litters (blocks) 사이에 차이가 없다

The randomized block design Calculation steps 1. 각 행 (row)의 값을 합함 (Σxr) 2. 각 열 (column)의 값을 합함 (Σxc) 3. column total 이나 row total을 계산, 두 값이 동일 함 (Σxt) 4. 각 행의 합을 제곱 {(Σxr)2}; 제곱한 값을 다 합한 후 treatments (columns)의 수로 나눔 Σ(Σxr)2 / c In this case: Σ(Σxr)2 / c = (1197.16 + 1296.0 + …+ 1232.01)/3 = 3553.27 5. 각 열의 합을 제곱: {(Σxc)2}; 제곱한 값을 다 합한 후 rows (blocks)의 수로 나눔: Σ(Σxc)2 / r In this case: Σ(Σxc)2 / r = (11384.89 + 16358.41 + 8226.49)/10 = 3596.98

The randomized block design Calculation steps 6. 모든 observations을 제곱한 후 합함: Σx2t (11.8)2 + (12)2 + …..+ (10.1)2 = 3631.47 7. grand total을 제곱한 후 total observations으로 나눔: (Σxt)2 / nt (325.30)2 / 30 = 3527.336 Correction term

The randomized block design Variance (분산): -1. Total variance -2. Black (little)에 의한 분산 -3. Treatments (diets)에 의한 분산 -4. Error variance (오차분산)

The randomized block design Total sum of square (SSt: 6 – 7) Σx2t - (Σxt)2 / nt 3631.47 – 3527.336 = 104.134 Sum of square for treatments (columns) (SSc: 5 – 7) Σ(Σxc)2 / r - (Σxt)2 / nt 3596.98 – 3527.336 = 69.643 Sum of square for blocks (rows) (SSr: 4 – 7) Σ(Σxr)2 / c - (Σxt)2 / nt 3553.27 – 3527.336 = 25.934 Error sum of square SSe = SSt - SSc - SSr 104.134 – 69.643 – 25.934 = 8.557

The randomized block design Total degree of freedom (dft: nt – 1) 30 - 1 = 29 Treatments (columns) 자유도 (dfc: columns – 1) 3 – 1 = 2 Blocks (rows) 자유도 (dfr: rows – 1) 10 – 1 = 9 Error degree of freedom (dfe = dft - dfc - dfr) 29 – 2 – 9 = 18

The randomized block design ANOVA table For diet treatments Critical F value in table A.6 (α=0.05, df = 2, 18) F (df = 2, 15) = 3.68 Calculated F (73.25)가 critical F value보다 훨씬 크다 따라서 null hypothesis를 reject 결론: diets 가 체중증가에 유의하게 영향을 미친다

The randomized block design For blocks Critical F value in table A.6 (α=0.05, df = 9, 18) F (df = 9, 15) = 2.59 Calculated F (6.06)가 critical F value보다 훨씬 크다 따라서 second null hypothesis를 reject 결론: litters에 따라 차이가 있음 litters에 의한 error variance가 randomized block design을 사용함으로써 분리되어짐 Randomized block ANOVA로는 treatments와 blocks 사이의 interaction (교호작용)을 알 수 없다 Interaction: treatments가 blocks 에 따라 따르게 영향을 미칠 경우, 또는 combined effects of the treatments and blocks 이 개개의 treatments와 blocks effects의 합과 다를 경우 Two-way factorial design으로 interaction 을 알 수 있다

Exercise 3종류의 diets가 mangrove toads의 혈압에 미치는 영향을 알고자 함. 이 두꺼비는 희귀하여 한 장소에서 여러 마리가 발견되지 않음 따라서 5장소에서 3마리씩을 채집하여 random하게 grouping한 후 다른 먹이를 주고 혈압을 측정함 혈압의 차이가 diets와 관련이 있는가? Location Diet A Diet B Diet C 1 65 75 80 2 60 69 79 3 55 50 70 4 53 54 5 64 85

The randomized block design Location Diet A Diet B Diet C 1 65 75 80 2 60 69 79 3 55 50 70 4 53 54 5 64 85 각행의 합 220, 208, 175, 187, 218 합의 제곱의 합 48400+43264+30625+34969+47524 = 204782 각열의 합 297, 317, 394 88209+100489+155236 = 343934 Correction term (Σxt)2 / nt = 1016064/15 = 67737.6 Σx2t 69484

The randomized block design Location Diet A Diet B Diet C sum 1 65 75 80 220 2 60 69 79 208 3 55 50 70 175 4 53 54 187 5 64 85 218 297 317 394 Total sum of square (SSt) Σx2t - (Σxt)2 / nt 69484 – 67737.6 = 1746.4 Sum of square for treatments (columns) (SSc) Σ(Σxc)2 / r - (Σxt)2 / nt 17641.8+20097.8+31047.2 – 67737.6 = 1049.2 Sum of square for blocks (rows) (SSr) Σ(Σxr)2 / c - (Σxt)2 / nt 68260.67 – 67737.6 = 523.07 Error sum of square SSe = SSt - SSc - SSr 1746.4 – 1049.2 – 523.07 = 174.13

The randomized block design Total degree of freedom (dft: nt – 1) 15 - 1 = 14 Treatments (columns) 자유도 (dfc: columns – 1) 3 – 1 = 2 Blocks (rows) 자유도 (dfr: rows – 1) 5 – 1 = 4 Error degree of freedom (dfe = dft - dfc - dfr) 14 – 2 – 4 = 8

The randomized block design ANOVA table For diet treatments Critical F value in table A.6 (α=0.05, df = 2, 8) F (df = 2, 8) = 4.46 Calculated F (24.1)가 critical F value보다 훨씬 크다 따라서 null hypothesis를 reject 결론: diets 가 두꺼비의 혈압에 유의하게 영향을 미친다 Source SS df MS F Diets 1049.2 2 524.6 24.1 Blocks (location) 523.07 4 130.77 6.01 Error 174.13 8 21.77 Total 1746.4 14

The randomized block design ANOVA table For locations Critical F value in table A.6 (α=0.05, df = 4, 8) F (df = 4, 8) = 3.84 Calculated F (6.01)가 critical F value보다 크다 따라서 null hypothesis를 reject 결론: location에 따라 차이가 있다 Source SS df MS F Diets 1049.2 2 524.6 24.1 Blocks (location) 523.07 4 130.77 6.01 Error 174.13 8 21.77 Total 1746.4 14

The factorial design 많은 경우 두 factors (treatments)가 서로 상호작용하여 각각의 factors의 합과 다른 effects를 줄 수 있다 In other word, treatments 들은 synergistically or antagonistically 영향을 미칠 수 있다 Ex. 여러 종류의 약을 동시에 먹을 경우 유해한 영향이 나타날 수 있다 Treatments 사이에 interaction이 예견될 경우 factorial design을 사용

The factorial design Both factors가 treatments로 고려됨 Both treatments가 fixed effects 임 Treatments 사이에 interaction이 있음 각 treatments의 combinations 은 replicated observations을 가짐 Two-way ANOVA with replication이라 불림

The factorial design Ex. 11.2: a factorial design ANOVA Diets 와 stress가 생쥐의 체중증가에 미치는 영향을 알고자 함 Interaction effects도 알고자 함 32마리의 inbred mice를 실험동물로 사용 Random 하게 4 groups으로 나눔 (8마리 씩) Treatments Diet: 2 treatments: junk food and control food Stress: 2 treatments: High stress and low stress Group 1: junk food + low stress Group 2: junk food + high stress Group 3: control food + low stress Group 4: control food + high stress

The factorial design Ex. 11.2: a factorial design ANOVA High stress: 매일 8시간 rap music Low stress: 매일 8시간 classical music Null hypothesis 1. Effect of stress H0: Low = High vs Ha: Low ≠ High 2. Effect of diet H0: Control = Junk food vs Ha: Control ≠ Junk food 3. Interaction effect H0: no interaction vs Ha: interaction

The factorial design Variance (분산): -1. Total variance -2. Diet에 의한 분산 -3. Stress에 의한 분산 -4. Interaction에 의한 분산 -5. Error variance (오차분산)

The factorial design Preliminary calculations as shown in Table 7.11

The factorial design Total sum of square (SSt) Σx2t - (Σxt)2 / nt 591136 – (4332)2/32 = 4691.5 Sum of square for stress (SSs) (ΣxL)2 / nL + (ΣxH)2 / nH - (Σxt)2 / nt (2058)2/16 + (2274)2/16 - (4332)2/32 = 1458 Sum of square for diet (SSd) (ΣxJ)2 / nJ + (ΣxR)2 / nR - (Σxt)2 / nt (2278)2/16 + (2054)2/16 - (4332)2/32 = 1568

The factorial design Sum of square for interaction (SSi) (ΣxHR)2 / nHR + (ΣxLR)2 / nLR + (ΣxHJ)2 / nHJ + (ΣxLJ)2 / nLJ - (Σxt)2 / nt – SSs – SSd (1060)2/8 + (998)2/8 + (1218)2/8 + (1056)2/8 - (4332)2/32 – 1458 – 1568 = 312.5 Error sum of square SSe = SSt - (SSs + SSd + SSi) 4561 – (1458 + 1568 + 312.5) = 1222.5

The factorial design Degree of freedom for each main effect Groups – 1 = 2 – 1 = 1 Degree of freedom for interaction dfstress * dfdiet = 1 * 1 = 1 Total degree of freedom nt – 1 = 32 – 1 = 31 Error degree of freedom dfe = dft - dfs - dfd - dfi = 31 – 1 – 1 – 1 = 28

The factorial design Fstress = 1458 / 48.32 = 30.18 (df = 1, 28) Fdiet = 1568 / 48.32 = 32.46 (df = 1, 28) Finter = 312.5 / 48.32 = 6.47 (df = 1, 28) Critical F value in Table A.6 (α=0.05, df = 1,25): 4.24 Calculated F value가 critical F value보다 크다 따라서 귀무가설을 reject Stress 와 diet가 체중증가에 영향을 미치며 두 factors 사이에 interaction이 있다

The factorial design No interaction의 경우 두 직선이 평행하다 두 직선이 평행하지 않으므로 두 treatments 사이에 interaction이 있다 Junk food의 경우 high stress에 의해 체중증가 효과가 향상된다

The Friedman test The Friedman two-way ANOVA Ex. 11.5 Randomized block design의 nonparametric test Related samples Ex. 11.5 뱀은 연속적인 자극에 반응이 점점 약화된다 Habituation (습관화) 된다 6마리의 뱀을 random하게 선택하여 chamber에 넣어 약 30분간 순화시킴 빨리 움직이는 물체를 뱀 머리위로 10초 간격으로 연속적으로 지나가게 함 뱀의 반응 정도를 3 (즉시 반응) – 0 (no response)로 기록

The Friedman test Measurement scale?? Ordinal scale 따라서 nonparametric test를 사용해야 함 각 개체들은 연속적으로 test 되었으므로 observations들은 independent 하지 않음: related sample

The Friedman test 각 행 (row)의 값을 ranked: 각각의 행을 독립적으로 rank 함(각 행 내에서만 비교하므로) Logic of this test Treatments에 따라 차이가 없다면 각 columns의 rank의 합은 거의 같을 것이다 Test statistic: χ2 (chi-square)

The Friedman test k columns (8) and n rows (6) ΣRi: sum of rank of a column = 12/6×8×9 {(45.5)2 + (35.5)2 + (23)2 + (26.5)2 + (27)2 + (23.5)2 + (19)2 + (16)2} – (3×6×9) = 17.44 Degree of freedom: k – 1 = 8 – 1 = 7 Critical chi-square value from Table A.3: 14.07 Calculated chi-square value가 critical value보다 크다 자극시간에 따른 차이가 없다는 귀무가설을 reject 결론: 뱀은 연속적인 자극에 약화되는 반응을 보인다

Homework 45마리의 guppy 암컷을 9 groups으로 random하게 나눔 물의 온도 3가지 (70ºF, 75ºF, 80ºF), 3 가지 feeding 횟수 (1, 2, 3회)로 two-way factorial design Offspring (새끼)의 수가 수온이나 feeding 횟수에 영향을 받는가? 이 두 factors의 interaction이 있는가? Both by hand and using computer software

Number of daily feedings Homework Temperature Number of daily feedings 1 2 3 70°F 18 25 28 20 30 36 15 19 29 27 37 75°F 33 39 32 42 17 38 47 80°F 35 51 48 40 55