Presentation is loading. Please wait.

Presentation is loading. Please wait.

제 19 장 유의성 검정 가설검정의 원리 귀무가설과 대립가설 검정통계량과 유의수준 제1종 오류와 제2종 오류 유의성 검정절차

Similar presentations


Presentation on theme: "제 19 장 유의성 검정 가설검정의 원리 귀무가설과 대립가설 검정통계량과 유의수준 제1종 오류와 제2종 오류 유의성 검정절차"— Presentation transcript:

1 제 19 장 유의성 검정 가설검정의 원리 귀무가설과 대립가설 검정통계량과 유의수준 제1종 오류와 제2종 오류 유의성 검정절차
제 19 장 유의성 검정 가설검정의 원리 귀무가설과 대립가설 검정통계량과 유의수준 제1종 오류와 제2종 오류 유의성 검정절차 0과 1의 숫자로만 이루어진 상자: 추출횟수가 많은 경우 0과 1의 숫자로만 이루어진 상자: 추출횟수가 적은 경우 t - 검정 부록 : 인터넷 연습문제 (야구 통계)

2 INDEX 1 가설검정의 원리 2 귀무가설과 대립가설 3 검정통계량과 유의수준 4 제1종 오류와 제2종 오류

3 ? 가설검정의 원리 EX) 새로운 세법 하에서의 세금 ‘조세수입을 증가시키지도 감소시키지도 않을 것인가’
유의성 검정 EX) 새로운 세법 하에서의 세금 ‘조세수입을 증가시키지도 감소시키지도 않을 것인가’ 모집단: 10만개의 납세자료 표본: 100개 자료 무작위 추출 새로운 세법 하에서의 세금과 종전의 세금 차이는? 표본평균:-21만9천원 표본표준편차:72만5천원 ? 이 차이는 우연일까 아니면 실질적인 것일까?

4 우연히 평균 –21만9천원의 차이가 나왔을 확률은 천분의 일에 불과!
가설검정의 원리 유의성 검정의 원리- 귀류법 10만장의 카드가 든 상자에서 100장 무작위 추출 각각의 카드에 적힌 숫자는 조세액의 차이 일단 상자 안의 평균이 “0” 이라고 치자 표본평균의 표준오차 -21만9천원-0원 7만3천원 우연히 평균 –21만9천원의 차이가 나왔을 확률은 천분의 일에 불과! = -3

5 INDEX 1 가설검정의 원리 2 귀무가설과 대립가설 3 검정통계량과 유의수준 4 제1종 오류와 제2종 오류

6 2. 귀무가설과 대립가설 귀무가설(H1) 차이는 우연이다 상자의 평균은 0이다 대립가설(H2)
차이는 우연이다 상자의 평균은 0이다 대립가설(H2) 차이는 실질적이다 상자의 평균은 음수이다 가설을 ‘상자모형에 대한 진술’ 형태로 표현

7 INDEX 1 가설검정의 원리 2 귀무가설과 대립가설 3 검정통계량과 유의수준 4 제1종 오류와 제2종 오류

8 3. 검정통계량과 유의 수준 관측치 – 기대값 관측치의 표준오차 z 또는 t = 검정통계량
자료의 관측치와 귀무가설 하에서의 기대값의 차이 측정 널리 쓰이는 z-통계량 또는 t-통계량 귀무가설 하에서 계산 관측치 – 기대값 관측치의 표준오차 z 또는 t = 표본표준편차를 이용하여 계산

9 3. 검정통계량과 유의 수준 이 확률을 ‘관측된 유의수준’ 또는 ‘p-값’이라 한다
-21만9천원 - 0원 7만3천원 앞의 예에서 계산한 z-값 = = -3 이 확률을 ‘관측된 유의수준’ 또는 ‘p-값’이라 한다 표준오차 단위로 -3보다 더 작을 확률 = 1/1000 p-값은 관측된 것 이상의 극단적인 검정통계량 값을 얻을 확률을 의미. 이 확률이 작아질수록 귀무가설에 대항하는 반대의 근거는 강해진다

10 3. 검정통계량과 유의 수준 귀무가설 기각! Z-검정은 모순에 의한 논증법 귀무가설(H0) p-값이  보다 작다
귀무가설의 기각 Z-검정은 모순에 의한 논증법 유의수준 (판정기준) 귀무가설(H0) p-값이  보다 작다 귀무가설 기각! p-값 <  : 유의수준  에서 H0 기각 (통계적으로 유의하다) p-값 >  : 유의수준  에서 H0 기각못함 (통계적으로 유의하지 않다)

11 3. 검정통계량과 유의 수준 귀무가설(H0) 대립가설(H1) 대립가설의 주장이 방향성을 가지면 ☞ 단측검정
단측검정과 양측검정 귀무가설(H0) 대립가설(H1) 대립가설의 주장이 방향성을 가지면 ☞ 단측검정 방향성을 갖지 않으면 ☞ 양측검정 EX) 단측검정 양측검정

12 INDEX 1 가설검정의 원리 2 귀무가설과 대립가설 3 검정통계량과 유의수준 4 제1종 오류와 제2종 오류

13 4. 제1종 오류와 제2종 오류 검정력(power) = 1- 제2종 오류의 가능성 실제상황 검정결과 귀무가설이 사실
대립가설이 사실 귀무가설을 기각 안 함 옳은 결정 제2종 오류 귀무가설을 기각함 제1종 오류 검정력(power) = 1- 제2종 오류의 가능성 귀무가설을 기각해야 하는 상황에서 제대로 기각하는 결정을 내릴 확률 (‘자를 때 자르는 힘’=power)

14 INDEX 유의성 검정절차 5 0과 1의 숫자로만 이루어진 상자: 추출횟수가 많은 경우 6
7 0과 1의 숫자로만 이루어진 상자: 추출횟수가 적은 경우 8 t-검정 부록 : 인터넷 연습문제 (야구 통계)

15 잠정적으로 귀무가설이 맞다고 치고 기대값을 계산한다 관측치와 기대값의 차이를 측정할 검정통계량을 정의한다
5. 유의성 검정절차 유의성 검정절차 상자모형을 만들고 귀무가설을 세운다 잠정적으로 귀무가설이 맞다고 치고 기대값을 계산한다 관측치와 기대값의 차이를 측정할 검정통계량을 정의한다 p-값과 유의 수준인 를 비교한다 관측된 유의수준인 p-값을 계산한다

16 INDEX 유의성 검정절차 5 0과 1의 숫자로만 이루어진 상자: 추출횟수가 많은 경우 6
7 0과 1의 숫자로만 이루어진 상자: 추출횟수가 적은 경우 8 t - 검정 부록 : 인터넷 연습문제 (야구 통계)

17 6. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 많은 경우
6. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 많은 경우 예 시 종합주가지수의 등락을 잘 맞춘다고 소문난 사람이 있었으니 그의 이름은 ‘칼’ 100거래일 동안 매일매일의 등락을 예측하게 함 100일 중 65일을 옳게 예측 절반보다 15일을 더 맞춘 것은 우연인가, 그의 능력인가?

18 6. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 많은 경우
6. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 많은 경우 Z-검정의 예시 H0 : 칼에게는 특별한 능력이 없다 관측치 – 기대값 관측치의 표준오차 Z 검정 1 상자의 표준편차= 개수의 표준오차= 0과1이 50% 이 상자에서 무작위 복원추출로 100장의 카드를 뽑는 것과 같다 p-값= =0.14% 3 우연에 의한 것이라 보기 힘들다

19 INDEX 유의성 검정절차 5 0과 1의 숫자로만 이루어진 상자: 추출횟수가 많은 경우 6
7 0과 1의 숫자로만 이루어진 상자: 추출횟수가 적은 경우 8 t-검정 부록 : 인터넷 연습문제 (야구 통계)

20 7. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 적은 경우
7. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 적은 경우 표본 크기가 작은 경우 (1) : Z-검정 EX) 세익이의 데이트 신청 이전에는 2 번 신청 시 한번 꼴로 만남 이제는 9 번에 한번 만나준다면  표본 크기가 작으므로 정규분포에 근거할 수 없다! ‘윤영이는 변심한 것일까?’ : 윤영이는 변심하지 않았다 1 값=1% 위의 상자로부터 9회 무작위 복원추출해서 얻은 합

21 7. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 적은 경우
7. 0과 1의 숫자로만 이루어진 상자 : 추출횟수가 적은 경우 표본 크기가 작은 경우 (2) : 부호검정 표본크기가 작을 때 0-1상자에서 추출한 질적인 자료에 대해선 부호검정을 적용 귀무가설 하에서 데이트에 성공한 횟수(X)는 이항분포를 따른다

22 INDEX 유의성 검정절차 5 0과 1의 숫자로만 이루어진 상자: 추출횟수가 많은 경우 6
7 0과 1의 숫자로만 이루어진 상자: 추출횟수가 적은 경우 8 t - 검정 부록 : 인터넷 연습문제 (야구 통계)

23 8. t - 검 정 EX) 과속을 단속하는 속도측정기의 정확성 5개 속도측정기 무작위 선택 예 시
예 시 EX) 과속을 단속하는 속도측정기의 정확성 5개 속도측정기 무작위 선택 시속100 km로 달리는 자동차의 속도 측정 108, 113, 98, 102, 118 측정치들의 평균 = 107.8 측정치들의 표준편차 = 7.22 표본합의 표준편차 = 표본평균의 표준오차 = H0 : 속도측정기에 편의가 없다

24 측정횟수가 적으므로 상자의 표준편차를 정확히 추정할 수 없다 따라서 정규분포곡선을 이용하기 어렵다  t-분포곡선을 이용
정규분포 곡선을 이용하면 p-값 < 1% 측정횟수가 적으므로 상자의 표준편차를 정확히 추정할 수 없다 따라서 정규분포곡선을 이용하기 어렵다  t-분포곡선을 이용 자유도 = ‘측정횟수-1’= 5-1= 4 자유도가 작을수록 꼬리부분이 두꺼워진다

25 INDEX 유의성 검정절차 5 0과 1의 숫자로만 이루어진 상자: 추출횟수가 많은 경우 6
7 0과 1의 숫자로만 이루어진 상자: 추출횟수가 적은 경우 8 t - 검정 부록 : 인터넷 연습문제 (야구 통계)

26 부록 : 인터넷 연습문제(야구 통계) 재미난 야구 통계 – 상식 vs 통계 -
일반적으로 ‘홈런타자’라고 하면, 거대한 체구와 그로부터 뿜어져 나오는 파워넘치는 풀스윙을 떠올린다. 자연스레 홈런타자는 삼진이 많고 발이 느려 도루가 적을 것이라는 인식이 일반적이다. 이에 대하여 실증적으로 검토해 보자. 재미난 야구 통계 – 상식 vs 통계 -


Download ppt "제 19 장 유의성 검정 가설검정의 원리 귀무가설과 대립가설 검정통계량과 유의수준 제1종 오류와 제2종 오류 유의성 검정절차"

Similar presentations


Ads by Google