검정 개요 모평균의 검정 모비율의 검정
가설검정 -가설검정의 목적은 원래 제기된 대립가설을 지지할 만한 통계적 증거를 확인하는데 있다. 일반적으로 대립가설과 상반되는 귀무가설을 세우고 귀무가설의 모순을 밝힘으로써 대립가설을 지지하는 형태로 가설검정이 진행된다. 예) 보건복지부는 소비자 단체로부터 어떤 제과업체의 제품 내용물이 명시된 양( g)에 미달한다는 제보를 받았다. 그래서 복지부는 이 회사의 제품 내용물의 중량이 실제 132g에 미달하는가를 검사하려고 한다. 대립가설과 귀무가설을 설정하라. 풀이) 이 문제에서 연구의 대상은 제품 내용물의 중량 가 132g에 미달하는가이다. 따라서 예) 3년 전의 실업률은 3%였다. 통계청은 작년의 실업률이 3년 전과 다름없는지 조사하려고 한다. 대립가설과 귀무가설을 설정하라. 풀이) 검정통계량(test statistic)이란 가설검정을 위하여 사용되는 통계량을 말한다. 예를 들어서 가설검정의 대상이 모평균일 경우에는 표본평균이, 모 비율일 경우에는 표본비율이, 그리고 모 분산일 경우에는 표본분산이 검정통계량이 된다. 기각역(rejection region)이란 귀무가설을 기각(reject) 할 수 있는 검정통계량 값의 범위를 말한다.
표본통계량의 분포와 기각역의 설정 ≠ = (a) (양측검정) : ; q H (b) (우측검정) (b) (좌측검정) q ≤ = 1 : ; q ≠ = H 기각역 기각역 (b) (우측검정) (b) (좌측검정) 1 q ≤ = : H ; 1 : ; q ≥ = H 기각역 기각역
가설검정의 원리 TV 광고-P234 얼마나 신뢰성(신빙성)이 있을까 ? 새로운 타이어 광고 / 6년 보장 ? 60,000km 보장 ? 진통제 효과 / 기존 30분 ← 20분 효과 있다고 주장 우유회사 : 기존의 우유보다 영양가가 높다. 콜라회사 : 실험에 의해 C회사 콜라보다 더 맛있다고 주장? 얼마나 신뢰성(신빙성)이 있을까 ? 주장 입증 ← How ? 모집단→표본→통계량추출→(정보)←주장에 대한 타당성 ? 모집단 분포모양 ? 모수에 대한 가설 ? 통계적 기법 적용 ← 가설검정 주장에 대한 의사결정에 관련된 오류발생 관리가 필요 → 검정법에는 오류의 허용확률을 미리 정함
가설검정의 원리 백열전구 공장(P235) 평균수명(품질관리) :1,200시간 ← 새로운 공법에 의한 전구생산 연구진 주장 : 기존전구에 비해 원가는 비슷하며 평균 전구 수명이 길다? 경영진의 조치 ? 100개의 표본을 추출 평균수명 : 1,220, 표준편차 : 100 절차 가설을 세운다. 유의수준(α )를 세운다. α =0.05 검정통계량 계산한다. 기각역을 구한다. : 귀무가설( )이 참일 때 근사적으로 정규분포를 따르는 성질이 있으므로 다음의 조건이 만족하면 귀무가설을( ) 기각(P237) 유의성을 판정, 결과 해석 관측값은 기각역에 속한다. 귀무가설을 버리고 대립가설(새로운 공법의 주장)을 채택한다. 전구수명이 개선되었다고 본다.
가설검정의 원리 관측값은 기각역에 속한다. 귀무가설을 버리고 대립가설(새로운 공법의 주장)을 채택한다. 전구수명이 개선되었다고 본다. 백열전구 공장(P235) 귀무가설이 참인데도 불구하고 표본에서 우연히 큰 값이 많이 관측되어 X 값이 커지고, 따라서 z 통계량의 값이 1.645보다 커서 를 기각시킬 확률이 0.05인 의미이다. 따라서 기각역 Z≥1.645는 유의수준 α=0.05에서의 기각역이다. 제 1종 오류를 범할 확률을 5%까지 허용하는 검정법에서 기각역은 Z≥1.645로 주어짐을 알 수 있다.(P239) 검정방법에 따라(P239) 우측단측검정 좌측단측겁정 양측검정 유의수준 5%, 1% 대립가설을 정하는 것은 문제에서 요구하는 것이 무엇인가에 따라 결정된다.(p241)
용어 로날드 피셔(Ronald A. Fisher)가 1966년에 만든 개념이다(귀무가설, 대립가설) 귀무가설(null hypothesis)은 통계학에서 처음부터 버릴 것을 예상하는 가설이다. 차이가 없거나 의미 있는 차이가 없는 경우의 가설이며 이것이 맞거나 맞지 않다는 통계학적 증거를 통해 증명하려는 가설이다 대립가설(Alternative Hypothesis) : “모집단에서 독립변수와 결과변수 간에 관련이 있다”라고 기술하는 명제 – 연구가설 유의수준(significance level) 귀무(영)가설의 수용여부를 결정하기 위한 기준 - 귀무가설이 참일 때 대립가설을 채택하는 오류를 범할 확률의 최대 허용한계 연구자가 심각한 오판인 1종 오류를 범할 확률. 검정통계량 귀무가설과 대립가설 중에서 하나를 선택하는 데 사용하는 통계량 가설검정에서 기각역을 결정하는 기준이 되는 통계량 기각역 귀무가설을 기각시키는 검정통계량의 관측값 영역 기각역은 가설이 참인데도 불구하고 이를 기각하는 경우의 확률과 가설이 거짓인데도 이를 기각하지 않는 경우의 확률을 될 수 있는 한 작아지도록 정해야 한다.
용어 p-값 가설검정 결과와 오류 귀무가설이 진실일 때 얻은 표본통계량을 포함하여 그보다 극단적인 값을 얻을 수 있는 확률 귀무가설(Ho)이 거짓이라는 결론을 내릴 때 우리의 판단이 잘못 되었을 확률 일반적으로 P-value < 0.05 라면 Ho를 기각. 즉, 평균은 μo가 아니라는 결론을 내린다. P-value 1% 사용 : 제1종 오류에 대한 손실이 큰 경우 P-value 10% 사용 : 손실이 심각하지 않을 경우 제 2종 오류에 대한 손실이 클 경우 P-value ≥ α : 귀무가설 채택 P-value < α : 귀무가설 기각 가설검정 결과와 오류 구 분 Ho 사실이라고 판정 Ho 사실이 아니라고 판정 Ho 사실임 옳은 결정 (1-α) (무죄인 사람은 석방된다.) 제1종 오류 (α) (무죄인 사람이 투옥된다.) Ho 사실이 아님 제2종 오류 (β) (유죄인 사람이 석방된다.) 옳은 결정 (1-β) (유죄인 사람이 투옥된다.) 검정력(power) = 1- 제2종 오류의 가능성 귀무가설을 기각해야 하는 상황에서 제대로 기각하는 결정을 내릴 확률 (‘자를 때 자르는 힘’=power)
■ 가설검정 절차 – P241 reading 2. 적절한 유의수준을 설정 (1%, 5%, 10%) 1. 검정하고자 하는 목적에 따라서 귀무가설과 대립가설을 설정 2. 적절한 유의수준을 설정 (1%, 5%, 10%) 3. 검정통계량을 구하고 그 통계량의 분포를 구함 (이때 검정통계량의 분포는 귀무가설이 사실이라는 가정 하에 구함) 4. 검정통계량의 분포에서 가설의 형태에 따라 유의수준에 해당하는 기각역을 설정 5. 귀무가설이 옳다는 전제 하에서 표본관찰에 의한 검정통계량의 값을 구함 6. (4)에서 구한 검정통계량의 값이 기각역에 속하는가를 판단하여 귀무가설을 기각하고 기각역에 속하지 않으면 귀무가설을 기각할 수 없다.
검정통계량과 유의 수준 관측치 – 기대값 관측치의 표준오차 z 또는 t = 검정통계량 자료의 관측치와 귀무가설 하에서의 기대값의 차이 측정 널리 쓰이는 z-통계량 또는 t-통계량 귀무가설 하에서 계산 관측치 – 기대값 관측치의 표준오차 z 또는 t = 표본표준편차를 이용하여 계산
검정통계량과 유의 수준 이 확률을 ‘관측된 유의수준’ 또는 ‘p-값’이라 한다 -21만9천원 - 0원 7만3천원 앞의 예에서 계산한 z-값 = = -3 이 확률을 ‘관측된 유의수준’ 또는 ‘p-값’이라 한다 표준오차 단위로 -3보다 더 작을 확률 = 1/1000 p-값은 관측된 것 이상의 극단적인 검정통계량 값을 얻을 확률을 의미. 이 확률이 작아질수록 귀무가설에 대항하는 반대의 근거는 강해진다
검정통계량과 유의 수준 귀무가설 기각! Z-검정은 모순에 의한 논증법 귀무가설(H0) p-값이 보다 작다 귀무가설의 기각 Z-검정은 모순에 의한 논증법 유의수준 (판정기준) 귀무가설(H0) p-값이 보다 작다 귀무가설 기각! p-값 < : 유의수준 에서 H0 기각 (통계적으로 유의하다) p-값 > : 유의수준 에서 H0 기각못함 (통계적으로 유의하지 않다)
모평균의 검정 정규분포를 이용하여 시행하는 검정 : 정규검정(Z검정) (예8-1) – p244 reading 절차 과일 통조림 내용물 무게 350g으로 표시 →평균무게 360g이 되도록 품질관리 공정으로부터 표본 30개를 추출 → 위자료를 가지고 공정관리에 이상이 있다고 할 수 있는가 ? 유의수준 5% 고려 절차 귀무가설 유의수준 α = 0.05 검정통계량 기각역 검정통계량의 관측값 Z=-2.19<-1.645 유의수준 5%에서 귀무가설을 기각(공정이상 이라고 판단함)
제공된 자료를 가지고 컴퓨터 칩의 평균수명이 15,000시간이라고 보증하기에는 문제가 있다 모평균의 검정 (예 8-2) – P245 reading 컴퓨터 칩 평균수명 15,000시간 이상을 보증한다고 광고 중임 확인을 위해 100개의 칩을 단축실험 하였다. 위자료를 가지고 회사의 선전을 신뢰(유의수준:1%)할 수 있는가 ? 절차 귀무가설 유의수준 α = 0.01 검정통계량 기각역(P498) 검정통계량의 관측값 Z=1.64<2.236 유의수준 1%에서 귀무가설을 채택(신뢰보증 못함) 제공된 자료를 가지고 컴퓨터 칩의 평균수명이 15,000시간이라고 보증하기에는 문제가 있다
측정횟수가 적으므로 상자의 표준편차를 정확히 추정할 수 없다 따라서 정규분포 곡선을 이용하기 어렵다 t-분포곡선을 이용 정규분포 곡선을 이용하면 p-값 < 1% 측정횟수가 적으므로 상자의 표준편차를 정확히 추정할 수 없다 따라서 정규분포 곡선을 이용하기 어렵다 t-분포곡선을 이용 자유도 = ‘측정횟수-1’= 5-1= 4 자유도가 작을수록 꼬리부분이 두꺼워진다 값
주어진 자료만을 가지고는 현재의 사실을 뒤집을 수 없다. 모평균의 검정 소표본에서 Z값을 정규분포로 근사시키는 것이 무리이므로 t분포 적용 적용방법은 앞에서 배운 것과 동일 함 (예8-5) – p249 reading 청소년 IQ 110이라고 주장 → 약물 복용 청소년 15명을 조사하였다. 125 105 117 109 118 98 111 107 108 135 94 90 100 99 약물 복용자는 약물로 인해 이 지역 보통 청소년의 IQ와 차이가 있을까? 5% 유의수준을 기준으로 검정하라. 절차 귀무가설 유의수준 α = 0.05 검정통계량 기각역(P 499표 참조) 검정통계량의 관측값 t=-0.645>-1.761 유의수준 5%에서 귀무가설을 채택(IQ의 차이가 없다) -1.761 주어진 자료만을 가지고는 현재의 사실을 뒤집을 수 없다.
모비율의 검정 모비율 p에 관한 추론은 이항확률변수 X나 표본비율 를 이용 적용방법은 앞에서 배운 것과 동일 함 (예8-7) – p252 reading 제약회사 무좀약 개발하여 치유율이 70% 이상이라고 광고한다 30명의 무좀환자에게 임상실험 후 27명이 완치되었다고 한다. 유의수준 5%에서 광고의 신빙성을 검정하라 ? 절차 귀무가설 유의수준 α = 0.05 검정통계량 기각역 검정통계량의 관측값 Z=2.39>1.645 유의수준 5%에서 귀무가설을 기각(치유율 선전광고 신뢰) 1.645
검정 예제 예 8-3(P246) 실습 예 8-4(P247) 실습 예 8-6(P250) 실습 예 8-87(P253) 실습 두 모평균에 차에 대한 검정(self study)
계량치 1개의 모평균에 관한 가설 검정법 ■ Z 검정 - 모분산이 알려져 있는 정규모집단의 모평균에 대한 가설검정 분산 귀무가설 통계량 대립가설 기각역 평균의 신뢰구간 100(1-α)% σ2 기지 H0 : μ = μ0 H1 : μ ≠ μ0 H1 : μ > μ0 H1 : μ < μ0 │Z0│> Zα/2 Z0 > Zα Z0 < -Zα ■ t 검정 - 모분산이 미지이며, 소표본인 경우에는 모집단이 정규분포인 경우에 한해서 tn-1 분포 사용하여 가설검정 -t 검정이 Z 검정과 다른 것은 Z분포 대신에 t분포를 사용한다는 것일 뿐 분산 귀무가설 통계량 대립가설 기각역 평균의 신뢰구간 100(1-α)% σ2 미지 H0 : μ = μ0 H1 : μ ≠ μ0 H1 : μ > μ0 H1 : μ < μ0 │t0│> tα/2, (n-1) t0 > tα, (n-1) t0 < -tα, (n-1)
평균의 차이에 대한 표준오차 - 두 집단이 독립이면 집단간 평균 차이의 표준오차는 - a, b 는 각각의 평균의 표준오차 집단간 차이의 표준오차 무작위 복원추출 상자A로부터 400회 추출에 대한 평균 = 120 3 상자B로부터 100회 추출에 대한 평균 = 80 4 상자 A 평 균 120 표준편차60 상자 B 평 균 80 표준편차40 - 두 집단이 독립이면 집단간 평균 차이의 표준오차는 - a, b 는 각각의 평균의 표준오차
평균의 차이에 대한 표준오차 1 2 4 3 5 1 이 뽑히는 개수와 5 가 뽑히는 개수의 차이에 대한 표준오차는 이다 보기 2 1 2 4 3 5 1부터 5까지의 카드가 한 장씩 들어 있는 상자에서 무작위로 100회 복원추출 각각의 숫자가 뽑히는 개수가 20 4 일 때 1 이 뽑히는 개수와 5 가 뽑히는 개수의 차이에 대한 표준오차는 이다 ☞ 한 숫자가 많이 뽑히면 다른 숫자는 적게 뽑히므로 두 숫자가 뽑히는 개수는 서로 독립이 아니다
두 평균의 비교 EX) 매년 전국적으로 고등학교 1학년생을 무작위 로 1,000명 뽑아 수학시험을 치르게 한다. 1988년과 2001년을 비교하면 다음과 같다. 1988년 평균 = 64점 표준편차 = 11점 2001년 평균 = 66점 표준편차 = 10점 ‘평균의 차이는 실질적인가 아니면 우연인가?’
두 평균의 비교 ☞ 두개의 상자모형을 만든다 1,000번 무작위 비복원추출 두 표본은 독립 두 평균의 비교 1988년 상자 1,000번 무작위 비복원추출 두 표본은 독립 61 50 73 97 88 35 1988년 상자 100 50 73 32 40 66 2001년 상자
두 평균의 비교 관측된 차이 – 기대된 차이 관측된 차이의 표준오차 기각! 복수표본 - 검정 복수표본 - 검정 H0 : 수학 실력은 향상되지 않았다 관측된 차이 – 기대된 차이 관측된 차이의 표준오차 관측된 차이 = 66-64 = 2 기대된 차이 = 0 관측된 차이의 표준오차 1988년도 표준오차 2001년도 표준오차 평균의 차이에 대한 표준오차 기각!
통제된 실험에서 두 집단간 평균의 비교 ‘두 평균의 차이가 통계적으로 유의한가?’ Ex) 비타민C의 감기예방 효과 실험 무작위로 통제된 실험 Ex) 비타민C의 감기예방 효과 실험 처리집단: 200명중 무작위로 100명 추출 매일 비타민 2,000mg을 준다. 통제집단: 나머지 100명에게 매일 같은 양의 가짜약을 준다. 실험기간이 끝난 후 감기에 걸린 횟수 측정 처리집단: 평균 = 2.3회 표준편차 = 3.1회 통제집단: 평균 = 2.6회 표준편차 = 2.9회 ‘두 평균의 차이가 통계적으로 유의한가?’
? 통제된 실험에서 두 집단간 평균의 비교 관측된 차이 – 기대된 차이 관측된 차이의 표준오차 무작위로 통제된 실험 관측된 차이 – 기대된 차이 관측된 차이의 표준오차 두 평균의 차이 = -0.3 관측된 차이의 표준오차 처리집단의 표준오차 통계집단의 표준오차 평균의 차이에 대한 표준오차 ? 비복원추출이고 종속임에도 불구하고 공식을 사용할 수 있을까?
통제된 실험에서 두 집단간 평균의 비교 두 가지 문제점 비복원 추출 표준오차가 작아짐 상쇄 두 평균이 종속 표준오차가 커짐 표준오차의 계산 두 가지 문제점 비복원 추출 표준오차가 작아짐 상쇄 두 평균이 종속 표준오차가 커짐 무작위로 통제된 실험에서 얻은 자료의 경우에는 공식을 이용하여 차이의 표준오차를 구할 수 있다.