제 19 장 유의성 검정 가설검정의 원리 귀무가설과 대립가설 검정통계량과 유의수준 제1종 오류와 제2종 오류 유의성 검정절차

Slides:



Advertisements
Similar presentations
학 습 목 표 1. 기체의 압력이 기체 분자의 운동 때문임을 알 수 있다. 2. 기체의 부피와 압력과의 관계를 설명할 수 있다. 3. 기체의 부피와 압력관계를 그리고 보일의 법칙을 이끌어 낼 수 있다.
Advertisements

2. 속력이 일정하게 증가하는 운동 Ⅲ.힘과 운동 2.여러 가지 운동. 도입 Ⅲ.힘과 운동 2. 여러 가지 운동 2. 속력이 일정하게 증가하는 운동.
Statistics 상지대학교 1 / 22 추정 개요 점추정과 구간추정 표본크기 두 모집단의 비교.
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
제13장 로지스틱회귀분석.
제 4 장 정규분포로의 근사 단위변환 정규분포곡선 표준정규분포곡선 아래의 영역 찾기 자료에 대한 정규 근사 백분위수
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
고장률 failure rate 어떤 시점까지 동작하여 온 품목이 계속되는 단위기간내에 고장을 일으키는 비율(횟수). 고장률은 확률이 아니며 따라서 1 보다 커도 상관없다. 고장이 발생하기 쉬운 정도를 표시하는 척도. 일반으로 고장률은 순간고장률과 평균고장률을 사용하고 있지만.
공차 및 끼워맞춤.
추론통계.
제9장 샘플링과 오차 표본: 시료, Sample 모집단 : 공정, Lot Sampling
비모수통계.
제12주 회귀분석 Regression Analysis
제18장 통계적 품질관리 1. 품질관리시스템의 설계 2. 샘플링검사 3. 공정통제 4. 계량형 관리도 5. 계수형 관리도.
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
비모수 분석 및 복습.
전기에 대해 알아보자 영화초등학교 조원석.
제 3장. 수치를 통한 연속형 자료의 요약.
가설검정 9 1 가설검정 2 모평균의 검정 3 모비율의 검정 4 c2-검정과 모분산의 검정.
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
제1장 통계의 기본개념.
ANOVA.
상관분석 (p , p ).
제4장 제어 시스템의 성능.
수학10-가 Ⅳ. 통 계 백암고등학교 수학교사 : 양상옥.
Keller: Stats for Mgmt & Econ, 7th Ed
13장 카이제곱(χ2)분석 2019년 2월 24일 오전 3시 39분2019년 2월 24일 오전 3시 39분
군집 분석.
제 11 장.
학습 주제 p 일률 측정하기.
10장 두 개의 모집단에 대한 추론 2019년 4월 5일 오후 4시 22분2019년 4월 5일 오후 4시 22분
9장 모집단이 한 개인 경우의 통계적 추론 2019년 4월 6일 오후 2시 22분2019년 4월 6일 오후 2시 22분
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
T-test.
생활 습관과 학교 성적의 통계분석 조장: 이태훈 조원: 이진원.
두 모집단에 대한 검정.
Decision Tree & Ensemble methods
논문작성을 위한 연구모형 설정 양동훈.
8장 무죄인가 유죄인가를 판단하는 가설의 검정 2019년 5월 1일 오전 8시 29분2019년 5월 1일 오전 8시 29분
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
제3장 함수와 배열수식 전진환
검정 개요 모평균의 검정 모비율의 검정.
Sampling Distributions
4장. 데이터 표현 방식의 이해. 4장. 데이터 표현 방식의 이해 4-1 컴퓨터의 데이터 표현 진법에 대한 이해 n 진수 표현 방식 : n개의 문자를 이용해서 데이터를 표현 그림 4-1.
통계해석 및 오차의 제거.
Chapter 3: 확률변수와 분포함수 Pilsung Kang
Chapter 1 단위, 물리량, 벡터.
행성을 움직이는 힘은 무엇일까?(2) 만유인력과 구심력 만유인력과 케플러 제3법칙.
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
7. 힘과 운동 속력이 변하지 않는 운동.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
추리통계학의 기본개념.
제 16장 비율의 정확성 머리말 신뢰구간 신뢰구간의 해석.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
제 4 장 Record.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
회로 전하 “펌핑”; 일, 에너지, 그리고 기전력 1. 기전력(electro-motive force: emf)과 기전력장치
CH4. 반복이 없는 이원배치법 ( Two-way ANOVA)
제4장 다중회귀분석 1절 다중회귀모형과 기본가정 다중회귀모형 기본가정 2절 추정방법 최소제곱추정량과 가우스-마르코프 정리
컴퓨터는 어떻게 덧셈, 뺄셈을 할까? 2011년 10월 5일 정동욱.
문제의 답안 잘 생각해 보시기 바랍니다..
(Analysis of Variation, ANOVA)
Survey Sampling Sangji University.
Presentation transcript:

제 19 장 유의성 검정 가설검정의 원리 귀무가설과 대립가설 검정통계량과 유의수준 제1종 오류와 제2종 오류 유의성 검정절차 제 19 장 유의성 검정 가설검정의 원리 귀무가설과 대립가설 검정통계량과 유의수준 제1종 오류와 제2종 오류 유의성 검정절차 0과 1의 숫자로만 이루어진 상자: 추출횟수가 많은 경우 0과 1의 숫자로만 이루어진 상자: 추출횟수가 적은 경우 t - 검정 부록 : 인터넷 연습문제 (야구 통계)

INDEX 1 가설검정의 원리 2 귀무가설과 대립가설 3 검정통계량과 유의수준 4 제1종 오류와 제2종 오류

? 가설검정의 원리 EX) 새로운 세법 하에서의 세금 ‘조세수입을 증가시키지도 감소시키지도 않을 것인가’ 유의성 검정 EX) 새로운 세법 하에서의 세금 ‘조세수입을 증가시키지도 감소시키지도 않을 것인가’ 모집단: 10만개의 납세자료 표본: 100개 자료 무작위 추출 새로운 세법 하에서의 세금과 종전의 세금 차이는? 표본평균:-21만9천원 표본표준편차:72만5천원 ? 이 차이는 우연일까 아니면 실질적인 것일까?

우연히 평균 –21만9천원의 차이가 나왔을 확률은 천분의 일에 불과! 가설검정의 원리 유의성 검정의 원리- 귀류법 10만장의 카드가 든 상자에서 100장 무작위 추출 각각의 카드에 적힌 숫자는 조세액의 차이 일단 상자 안의 평균이 “0” 이라고 치자 표본평균의 표준오차 -21만9천원-0원 7만3천원 우연히 평균 –21만9천원의 차이가 나왔을 확률은 천분의 일에 불과! = -3

INDEX 1 가설검정의 원리 2 귀무가설과 대립가설 3 검정통계량과 유의수준 4 제1종 오류와 제2종 오류

2. 귀무가설과 대립가설 귀무가설(H1) 차이는 우연이다 상자의 평균은 0이다 대립가설(H2) 차이는 우연이다 상자의 평균은 0이다 대립가설(H2) 차이는 실질적이다 상자의 평균은 음수이다 가설을 ‘상자모형에 대한 진술’ 형태로 표현

INDEX 1 가설검정의 원리 2 귀무가설과 대립가설 3 검정통계량과 유의수준 4 제1종 오류와 제2종 오류

3. 검정통계량과 유의 수준 관측치 – 기대값 관측치의 표준오차 z 또는 t = 검정통계량 자료의 관측치와 귀무가설 하에서의 기대값의 차이 측정 널리 쓰이는 z-통계량 또는 t-통계량 귀무가설 하에서 계산 관측치 – 기대값 관측치의 표준오차 z 또는 t = 표본표준편차를 이용하여 계산

3. 검정통계량과 유의 수준 이 확률을 ‘관측된 유의수준’ 또는 ‘p-값’이라 한다 -21만9천원 - 0원 7만3천원 앞의 예에서 계산한 z-값 = = -3 이 확률을 ‘관측된 유의수준’ 또는 ‘p-값’이라 한다 표준오차 단위로 -3보다 더 작을 확률 = 1/1000 p-값은 관측된 것 이상의 극단적인 검정통계량 값을 얻을 확률을 의미. 이 확률이 작아질수록 귀무가설에 대항하는 반대의 근거는 강해진다

3. 검정통계량과 유의 수준 귀무가설 기각! Z-검정은 모순에 의한 논증법 귀무가설(H0) p-값이  보다 작다 귀무가설의 기각 Z-검정은 모순에 의한 논증법 유의수준 (판정기준) 귀무가설(H0) p-값이  보다 작다 귀무가설 기각! p-값 <  : 유의수준  에서 H0 기각 (통계적으로 유의하다) p-값 >  : 유의수준  에서 H0 기각못함 (통계적으로 유의하지 않다)

3. 검정통계량과 유의 수준 귀무가설(H0) 대립가설(H1) 대립가설의 주장이 방향성을 가지면 ☞ 단측검정 단측검정과 양측검정 귀무가설(H0) 대립가설(H1) 대립가설의 주장이 방향성을 가지면 ☞ 단측검정 방향성을 갖지 않으면 ☞ 양측검정 EX) 단측검정 양측검정 대

INDEX 1 가설검정의 원리 2 귀무가설과 대립가설 3 검정통계량과 유의수준 4 제1종 오류와 제2종 오류

4. 제1종 오류와 제2종 오류 검정력(power) = 1- 제2종 오류의 가능성 실제상황 검정결과 귀무가설이 사실 대립가설이 사실 귀무가설을 기각 안 함 옳은 결정 제2종 오류 귀무가설을 기각함 제1종 오류 검정력(power) = 1- 제2종 오류의 가능성 귀무가설을 기각해야 하는 상황에서 제대로 기각하는 결정을 내릴 확률 (‘자를 때 자르는 힘’=power)

INDEX 유의성 검정절차 5 0과 1의 숫자로만 이루어진 상자: 추출횟수가 많은 경우 6 7 0과 1의 숫자로만 이루어진 상자: 추출횟수가 적은 경우 8 t-검정 부록 : 인터넷 연습문제 (야구 통계)

잠정적으로 귀무가설이 맞다고 치고 기대값을 계산한다 관측치와 기대값의 차이를 측정할 검정통계량을 정의한다 5. 유의성 검정절차 유의성 검정절차 상자모형을 만들고 귀무가설을 세운다 잠정적으로 귀무가설이 맞다고 치고 기대값을 계산한다 관측치와 기대값의 차이를 측정할 검정통계량을 정의한다 p-값과 유의 수준인 를 비교한다 관측된 유의수준인 p-값을 계산한다

INDEX 유의성 검정절차 5 0과 1의 숫자로만 이루어진 상자: 추출횟수가 많은 경우 6 7 0과 1의 숫자로만 이루어진 상자: 추출횟수가 적은 경우 8 t - 검정 부록 : 인터넷 연습문제 (야구 통계)

6. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 많은 경우 6. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 많은 경우 예 시 종합주가지수의 등락을 잘 맞춘다고 소문난 사람이 있었으니 그의 이름은 ‘칼’ 100거래일 동안 매일매일의 등락을 예측하게 함 100일 중 65일을 옳게 예측 절반보다 15일을 더 맞춘 것은 우연인가, 그의 능력인가?

6. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 많은 경우 6. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 많은 경우 Z-검정의 예시 H0 : 칼에게는 특별한 능력이 없다 관측치 – 기대값 관측치의 표준오차 Z 검정 1 상자의 표준편차= 개수의 표준오차= 0과1이 50% 이 상자에서 무작위 복원추출로 100장의 카드를 뽑는 것과 같다 p-값= =0.14% 3 우연에 의한 것이라 보기 힘들다

INDEX 유의성 검정절차 5 0과 1의 숫자로만 이루어진 상자: 추출횟수가 많은 경우 6 7 0과 1의 숫자로만 이루어진 상자: 추출횟수가 적은 경우 8 t-검정 부록 : 인터넷 연습문제 (야구 통계)

7. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 적은 경우 7. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 적은 경우 표본 크기가 작은 경우 (1) : Z-검정 EX) 세익이의 데이트 신청 이전에는 2 번 신청 시 한번 꼴로 만남 이제는 9 번에 한번 만나준다면  표본 크기가 작으므로 정규분포에 근거할 수 없다! ‘윤영이는 변심한 것일까?’ : 윤영이는 변심하지 않았다 1 값=1% 위의 상자로부터 9회 무작위 복원추출해서 얻은 합

7. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 적은 경우 7. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 적은 경우 표본 크기가 작은 경우 (2) : 부호검정 표본크기가 작을 때 0-1상자에서 추출한 질적인 자료에 대해선 부호검정을 적용 귀무가설 하에서 데이트에 성공한 횟수(X)는 이항분포를 따른다

INDEX 유의성 검정절차 5 0과 1의 숫자로만 이루어진 상자: 추출횟수가 많은 경우 6 7 0과 1의 숫자로만 이루어진 상자: 추출횟수가 적은 경우 8 t - 검정 부록 : 인터넷 연습문제 (야구 통계)

8. t - 검 정 EX) 과속을 단속하는 속도측정기의 정확성 5개 속도측정기 무작위 선택 예 시 예 시 EX) 과속을 단속하는 속도측정기의 정확성 5개 속도측정기 무작위 선택 시속100 km로 달리는 자동차의 속도 측정 108, 113, 98, 102, 118 측정치들의 평균 = 107.8 측정치들의 표준편차 = 7.22 표본합의 표준편차 = 표본평균의 표준오차 = H0 : 속도측정기에 편의가 없다

측정횟수가 적으므로 상자의 표준편차를 정확히 추정할 수 없다 따라서 정규분포곡선을 이용하기 어렵다  t-분포곡선을 이용 정규분포 곡선을 이용하면 p-값 < 1% 측정횟수가 적으므로 상자의 표준편차를 정확히 추정할 수 없다 따라서 정규분포곡선을 이용하기 어렵다  t-분포곡선을 이용 자유도 = ‘측정횟수-1’= 5-1= 4 자유도가 작을수록 꼬리부분이 두꺼워진다 값

INDEX 유의성 검정절차 5 0과 1의 숫자로만 이루어진 상자: 추출횟수가 많은 경우 6 7 0과 1의 숫자로만 이루어진 상자: 추출횟수가 적은 경우 8 t - 검정 부록 : 인터넷 연습문제 (야구 통계)

부록 : 인터넷 연습문제(야구 통계) 재미난 야구 통계 – 상식 vs 통계 - 일반적으로 ‘홈런타자’라고 하면, 거대한 체구와 그로부터 뿜어져 나오는 파워넘치는 풀스윙을 떠올린다. 자연스레 홈런타자는 삼진이 많고 발이 느려 도루가 적을 것이라는 인식이 일반적이다. 이에 대하여 실증적으로 검토해 보자. 재미난 야구 통계 – 상식 vs 통계 -