비모수통계.

Slides:



Advertisements
Similar presentations
6σ 관련 기초 통계 (1) -. 통계적사고 -. 모집단과 표본. 통계적 사고 모든 작업은 상호연관된 프로세스의 시스템 예 ) 열처리 작업 공정 원료 투입 공정가열 공정 냉각 공정 모든 프로세스에는 산포가 존재 가피원인 불가피원인 동일 원료동일 생산공정 동일 작업자동일.
Advertisements

제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
Proc freq data = "c:/test/hsb2"; /* c 디렉토리의 test 폴더에 hsb2 데이터를 이용하여 freq 라는 sas 의 procedure 를 실행한다 tables female / binomial(p=.5); /* tables 는 freq 의 대상.
제13장 로지스틱회귀분석.
SPSS를 활용한 통계분석 김 덕 기 충북대학교 정보통계학과
재료수치해석 HW # 박재혁.
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
PASW 17.0 활용하기 일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
3일차 - 가설검정.
4.3 난괴법 (Randomized Block Design)
고장률 failure rate 어떤 시점까지 동작하여 온 품목이 계속되는 단위기간내에 고장을 일으키는 비율(횟수). 고장률은 확률이 아니며 따라서 1 보다 커도 상관없다. 고장이 발생하기 쉬운 정도를 표시하는 척도. 일반으로 고장률은 순간고장률과 평균고장률을 사용하고 있지만.
각 행 (row) 에서 같은 첨자가 있는 곳은 비워두고, 그 밖에 cell에 수준수 (level) 또는 반복수를 기입
비모수 통계분석 목 적 비모수 통계분석은 t검정이나 분산분석을 사용할 수 있는 등간척도 이상으로 구성된 종속변수가 아닌 서열척도로 종속변수가 구성되어 있을 경우, 또는 등간성이 의심되거나 정규분포성을 얻지 못할 경우에 순위(Rank)를 통하여 변수간의 차이를 비교할 때.
추론통계.
Ⅱ. 측정(Measure) (2) Gage R&R (Crossed) – ANOVA 방법 [1] Data 입력
자료분석 및 통계활용.
논문을 위한 통계 집단간 평균 차이: t-test, ANOVA 하성욱 한성대학교 대학원.
제12주 회귀분석 Regression Analysis
제 19 장 유의성 검정 가설검정의 원리 귀무가설과 대립가설 검정통계량과 유의수준 제1종 오류와 제2종 오류 유의성 검정절차
경영통계학 통계학은 어떤 학문인가? What is Statistics? 1.1.
모수 통계학과 비모수 통계학 Parametric Statistics, NonParametric Statistics
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
비모수 분석 및 복습.
22장 통계적 품질관리(SQC) 1. 품질의 통계적 관리 2. 통계적 공정관리 3. 샘플링검사
가설검정 9 1 가설검정 2 모평균의 검정 3 모비율의 검정 4 c2-검정과 모분산의 검정.
제1강 변량분석이란 무엇이며 일원변량분석은 어떻게 하는가?
SPSS 이용한 논문 통계 강좌 우송대학교 IT 경영학과 하임숙
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
ANOVA.
로지스틱 회귀분석.
상관분석 (p , p ).
제 7장 연관성분석 화장품과학과 홍보람.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
자료처리 및 통계분석(2) 통계분석의 이해(2) - 가설검증 - 변수유형에 따른 통계분석방법 통계분석방법
13장 카이제곱(χ2)분석 2019년 2월 24일 오전 3시 39분2019년 2월 24일 오전 3시 39분
제 11 장.
SPSS 강원대학교 생물학과 석사 과정생 김자경.
(independent variable)
10장 두 개의 모집단에 대한 추론 2019년 4월 5일 오후 4시 22분2019년 4월 5일 오후 4시 22분
9장 모집단이 한 개인 경우의 통계적 추론 2019년 4월 6일 오후 2시 22분2019년 4월 6일 오후 2시 22분
단일 모집단 평균검증(t) 모집단의 평균( μ)값을 일반적으로 이해(혹은 지금까지의 이해)와는 다르게 연구자가 생각하는 경우 사용. 단일모집단 평균검증에는 모집다의 구성요소들이 정규분포를 이룬다는 가정하에 t-test를 사용하며 다음의 검증통계량이 사용됨. 기초통계학에서.
Association between two measurement variables Correlation
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
SPSS - Statistics - AMOS
생산 분석을 위한 확률 및 통계 현대로템 직무능력 향상 교육 - 1주차
고체역학 2 - 기말고사 1. 단면이 정사각형이고 한번의 길이가 a 일 때, 최대굽힘응력과 최대전단응력의 비를 구하라(10).
생활 습관과 학교 성적의 통계분석 조장: 이태훈 조원: 이진원.
두 모집단에 대한 검정.
Multiple regression analysis
논문작성을 위한 연구모형 설정 양동훈.
6.4 삼원배치 (혼합모형, no replication)
검정 개요 모평균의 검정 모비율의 검정.
Sampling Distributions
Intelligent Systems and Control Lab. Dept. of EE, Yeungnam Univ.
척도의 속성 - 목 차- 자료수집과정 척도의 속성 -명목척도 -서열척도 -등간척도 -비율척도 -리커트척도 3.Data(자료)
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
추리통계학의 기본개념.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
CH4. 반복이 없는 이원배치법 ( Two-way ANOVA)
문제의 답안 잘 생각해 보시기 바랍니다..
(Analysis of Variation, ANOVA)
Survey Sampling Sangji University.
Presentation transcript:

비모수통계

비모수검정방법 모수 검정방법과 같이 가정들이 엄격하지 않다. 비모수검증은 이를 분포무관법(distribution-free method): 모수에 대한 언급x 2오류를 범할 가능성이 높다. 모수검정은 등간척도와 비율척도로 측정된 자료를 분석 비모수검정은 명목척도와 순서척도로 측정된 자료를 분석 비모수검증은 계산이 쉽다 모수검정의 가정을 충졳기키기 어렵고 수집된 자료의 수가 적을 때, 그리고 자료의 분포형태를 가정할 수 없을 때 적용된다. 모수검증이 더 적합할 때는 비모수검증보다 모수검증을 사용함.

비모수적 방법의 특징은 최소한의 가정을 전제로 하므로 가정이 만족하지 않음으로서 발생하는 오류를 줄일 수있다. 대부분의 경우 관측값보다는 상대적 순위를 이용하여 검정통계량을 유도하므로 순서척도로 관측된 자료의 검정에 유용하다. 계산과정이 단순하고 통계적 의미를 이해할 수 있으므로 통계에 대한 깊은 지식을 필요로 하지 않는다.

비모수 검정 방법 요약 표본특성 명목척도 서열척도 1표본(단일변수) 카이제곱검정 콜로고로프-스미르노프 2표본(두 변수) 맥니머 부호검정, 윌콕슨검정 K-표본 코크란검정 프리드만검정 2개 독립표본 크로스탭 중위수검정, 맨-휘트니검정 K 독립표본 크루스칼-왈리스검정

Overview SPSS 12.0 통계 패키지를 통해 비모수 검정과 모수 검정 절차와 결과를 비교하자 비교대상 집단수 관계 단일 표본 분석 Sign test (Binomial test 이용) T test Kolmogorov-Smirnov test 2표본 독립 Mann-Whitney 대응 자료 Wilcoxon 부호-서열 test Paired T test K표본 Kruskal-Wallis H test ANOVA test Friedman test

카이제곱검증 관찰치와 기대치간에 차이가 나는가를 검정하는 것으로 적합도 검증(goodness-of-fit)을 할 때, 명목척도와 서열척도로 이루어진 변수간의 독립성을 검정할 때 사용한다.

χ² 단일표본검정 범주의 기대치와 관찰치의 빈도수가 차이가 있는지를 검정하는 것이다.

비모수검정의 개요 및 LAB

Introduction Overview 모집단의 가정이 만족되지 않는다면 T-검정 대신 비모수적 방법인 Mann-Whitney 검정을 사용해야 됨 비모수검정은 일반적으로 모수검정보다 검정능력이 떨어짐 비모수검정은 데이터가 정규분포를 따르지 않을 때 이용하는 것이 좋음

Mann-Whitney test 독립인 두 집단의 평균의 차이를 비교할 때 모집단의 가정이 만족된다면, ( )검증을 사용해야 한다. 모집단의 가정이 만족하지 않는다면, ( )검증 대신에 비모수적인 방법인 ( )검정을 사용해야 한다. 이때 데이터를 순위 또는 구간으로 나타낼 수 있어야 한다. 모수검정이 적절치 못한 상황이란? 데이터가 명목 혹은 순서 데이터로 측정되었을 때 구간 데이터라 하더라도 정규분포를 따르지 않을 때

흡연자 28 53 39 27 41 68 45 48 65 78 비흡연자 32 35 61 43 82 44 38 85 63 46 30 47 57

Mann-Whitney test 정확한 유의확률의 p값이 0.232이므로 유의수준 0.05보다 크므로 H0가설을 수용함

독립 2표본 분석

독립 2표본 분석 Mann-Whitney 의 U통계량 값이 63.5 이다. 유의확률 P값이 0.297>0.05 이므로 귀무가설을 기각할 수 없다. 또한 근사 유의확률(양쪽)의 P값이 0.291>0.05 이므로 귀무가설을 기각할 수 없다. 따라서 흡연자와 비흡연자 집단사이의 운전기술의 차이가 없다.

대응표본에 대한 부호검정(sign test) 영가설: 두 생산 라인의 일별 생산량 중에서 불량품의 수의 분포는 동일하다. 대립가설: 두 생산 라인의 일별 생산량 중에서 불량품의 수의 분포는 동일하지 않다.

일자 생산라인 라인1 라인2 D(라인2-라인1) 1 170 201 29 2 179 164 -15 3 140 159 19 4 184 195 11 5 174 177 6 142 28 7 191 183 -8 8 169 10 9 161 200 212 12

차이 D는 단일표본을 이루게 되어, 거기에 부호 검정을 적용할 수 있다. 영가설은 처리가 하등 개선을 가져오지 못한다. 즉, H0: 중위수, v=0 이된다.

양수가 8개이고 음수가 2개, 그리고 동률이 0개이다. -가설이 양측검정이므로 p 값은 0.109로 유의수준 0.05보다 크므로 영가설을 채택 하게 된다. 즉, 두 생산라인의 일별 생산량 중에서 불량품의 수의 분포는 동일하다 는 결론을 내릴 수 있다.

Wilcoxon Signed Rank test 대응 2 표본 Wilcoxon Signed Rank test 대응되는 두 쌍의 데이터를 분석할때 쓰인다. 부호와 차이의 크기를 가지고 분석한다. 모수통계에서 Paired t-test 에 대응된다. Id pre post Diff 1 63.1 41.4 -21.7 2 46.5 55.3 8.8 3 40.1 49.7 9.6 4 48.5 51.6 3.1 5 33.2 37.3 4.1 6 38.8 39.6 0.8 7 48.3 50.1 1.8 8 40.5 43.8 3.3 9 36.9 37.6 0.7 10 50.8 10.3 11 42.2 43.6 1.4 12 34.9 37.4 2.5

대응 2 표본

대응 2 표본 부호 검정 결과 유의확률 0.006<0.05이므로 귀무가설을 기각할 수 있다. 또한 부호순위검정결과에서도 양측검정 유의확률이 0.034로써 유의수준 0.05에서 부호검정과 동일한 결론을 내릴 수 있다.

Kruskal-Wallis의 일원배치 분산분석 모수검정에서 T-검정이 분산분석으로 일반화 될 수 있듯이 비모수검정에서 Mann-Whitney 검정은 Kruskal-Wallis 검정으로 일반화 될 수 있다.

사료의 종류 1 2 3 4 257 201 248 202 205 237 265 276 206 197 187 207 164 185 220 204 190 212 230 214 215 227 228 281 203

카이제곱 통계량은 21.811이다. 유의확률 은 0.000으로 유의수준 0.05보다 작으므로 영가설을 기각하고 대립가설을 채택하게 된다. 5가지 질환의 종류에 의해 수행력에 차이가 난다고 결론을 내릴 수 있다.

Kruskal-Wallis test 독립 K 표본 검정 모수검정시 ANOVA 검정과 대응되는 비모수 검정 법 2표본의 Mann-Whitney test 를 다변량 분석으로 확장 예제 4종류의 사료를 사용하여 실험용 쥐를 사육하고 있다. 4종류의 사료에 따라서 성장에 차이가 있는지를 검정하기 위하여 4종류의 사료를 사용하여 12주동안 사육한후 체중을 측정하였다. 사료의 종류 1 2 3 4 257 201 248 202 205 237 265 276 206 197 187 207 164 185 220 204 190 212 230 214 215 227 228 281 203

독립 K 표본 검정

독립 K 표본 검정 결과 유의확률 0.239 < 0.05 이므로 귀무가설을 기각할 수 없다. 따라서 4종류의 사료에 의한 체중차이가 없다고 판단된다.

H1 : 4개의 시스템에 차이가 있다. (한 개라도 다를 수 있다) 대응 K 표본 Friedman Two-Way 테스트 측정치값들이 동일한 모집단에서 나왔는가를 검정하는 것으로 randomized-Block Design에서 모수통계 기법 ANOVA 에 대응된다. 예제 새로운 시스템을 도입하려는 회사가 있다. 이 회사는 6명의 관리자에게 4개의 시스템별 순위를 매기도록 하였다. 관리자들이 준 점수들로 인해 시스템 평가가 유의한 차이가 있는가? H0 : 4개의 시스템이 차이가 없다. H1 : 4개의 시스템에 차이가 있다. (한 개라도 다를 수 있다) 관리자 시스템A 시스템B 시스템C 시스템D 1 3 4 2 5 6

대응 K 표본

Kolmogorov-Smirnov 검증 K-S 검정은 샘플의 분포가 특정 분포(정규분포, 균일분포,포아송분포,지수분포 중의 하나) 를 따르는지에 대한 검정이다. 가설은 H0 : 모든 x 에 대하여 F(x)=F0(x) H1 : 적어도 한 x 에 대하여 F(x)≠F0(x) 예제 다음은 한 반의 시험 점수이다. 정규분포를 따르는지 검정하시오. 시험점수 496.6 488.4 514.27 491.28 495.53 482.15 484.76 510.13 507.35 505.84

Kolmogorov-Smirnov 검증 원하는 검정분포 체크

Kolmogorov-Smirnov 검증 검정 결과 유의확률 0.940 이므로 유의수준 0.05에서 정규분포를 따른다고 볼 수 있다.