Download presentation
Presentation is loading. Please wait.
1
Hypothesis Testing 가설 검정
2
1. 가설의 설정 가설검정 Set Hypothesis Choose statistic and α
Reject or Do not reject 1. 가설의 설정 Null hypothesis (귀무가설) : (test 하려고 하는 가설) Alternative hypothesis(대립가설) : ; 귀무가설에 대립되는 가설
3
예 1 : 충돌시험에서 자동차 수리비 예 2 : 자동차의 연비
예 1 : 충돌시험에서 자동차 수리비 자동차 회사의 주장 : 시속 60km로 달리 때 충돌의 수리비가 100만원 소요 예 2 : 자동차의 연비 자동차 회사의 주장 : 15km/l
4
예 3 : 우리 나라 금융기관의 평균 배당률 = 5%라는 주장의 진위
예 3 : 우리 나라 금융기관의 평균 배당률 = 5%라는 주장의 진위 단측검정 One-tailed test 대립가설은 위의 세 가지 경우가 가능 예 1 : 만약 표본평균이 크게 나오면 귀무가설을 기각 예 2: 만약 표본평균이 작게 나오면 귀무가설을 기각 예 3 : 만약 표본평균이 크거나 작게 나오면 귀무가설을 기각 양측검정 two-tailed test 따라서 귀무가설에 따라 기각여부가 다르게 나타난다.
5
2. 통계량의 설정 μ에 대한 검정 에 대한 검정 p에 대한 검정 에 대한 검정
6
3. 판정의 기준( α)의 설정 5개 추출 흰 돌 검은 돌 사전 정보 : 흰 돌의 비율이 1/3 혹은 2/3
이를 보고 박스 안의 흰 돌의 비율을 추정 사전 정보 : 흰 돌의 비율이 1/3 혹은 2/3 Statistic : x = 0, 1, 2, 3, 4, 5
7
가설 설정 일시적인 판정기준 Do not Reject Reject 귀무가설을 채택 귀무가설을 기각 Note :
8
Rejection Region(기각역) : R = {3/5, 4/5, 1}
Do not Reject Reject Rejection Region(기각역) : R = {3/5, 4/5, 1} C / /243 1/ / /243 2/ / /243 A Do not Reject 3/ / /243 4/ / /243 / /243 D B Reject
9
A 확률 : p=1/3인데 p=1/3을 부정하지 못할 확률
B 확률 : p=1/3인데 p=1/3을 부정할 확률 Type I error(α) C 확률 : p=2/3인데 p=1/3을 부정하지 못할 확률 Type II error(β) D 확률 : p=2/3인데 p=1/3을 부정할 확률
10
유의수준 Significance level Do not Reject 올바른 결정(A) Type II error (C)
Type I error (C) 올바른 결정(D) 유의수준 Significance level 검정의 검출력 Power of test 가 틀렸는데 이를 기각할 확률
12
: true : true 채택역={0, 1/5, 2/5} 기각역 = {3/5, 4/5, 1} If If 일반화
Only way to and n
13
Given , Max or Min 이제 판정기준을 변화시켜 보자. 기각역
{2/5, 3/5, 4/5, 1} {3/5, 4/5, 1} {4/5, 1} {1} 만약 기각역 ={4/5, 1}로 판정기준을 삼는다. 즉 흰 돌의 개수 : 3개 이하이면 귀무가설을 기각하지 못한다. 흰 돌의 개수 : 4개 이상이면 귀무가설을 기각한다.
14
모 평균의 가설검정 (1) 모집단의 분산이 알려져 있을 경우 : true : given 기각역 : 기각역에 있다면 Reject
그렇지 않다면 Do not Reject
15
: true : given : given : true 기각역 기각역 표로부터 임계값을 구할 수 있다. 또한
기각역 표로부터 임계값을 구할 수 있다. 또한 : true 일 때 값을 계산할 수 있다(즉 에 대응하는 Z값). 값이 기각역에 있으면 Reject 그렇지 않으면 Do not Reject
16
따라서 가 true일 때 값을 구하고 주어진 값에 대응하는 임계값 를 구하여 기각역을 구한 후에 (1)에서 구한 값이 기각역에 있는지 아닌지에 따라 결론을 내린다. 기각역은 대립가설에 따라 다르게 나타난다
17
예 1 단 (1) 이 맞다면 (2) 일 때 임계값 Z = 1.64 기각은 가 1.64보다 크게 나올 때 임
기각은 가 1.64보다 크게 나올 때 임 (3) 따라서 Do Not Reject 즉 이라는 가설을 기각하지 못한다.
18
: true : true : true 일 때 가 되는 : true 일 때 c값 이하가 될 단 검정의 검출력은 ? (1)
(2) : true 일 때 c값 이하가 될 확률 을 구한다 (3) 값을 구한다. c 5%
19
: true : true (1) (즉 )일 때, 가 되는 임계값 c를 구한다. 일 때, (2) (즉 )일 때
(2) (즉 )일 때 : true 가 11.28보다 작을 확률 ? (3) 따라서 검정의 검출력은 ?
20
예 2 : 어느 까페에서 성냥갑을 1만개를 주문하였고,
주문한 성냥갑의 성냥 개비는 평균적으로 8개가 있어야 한다. 1만개의 성냥갑을 모두 조사할 수 없어 100개의 표본을 추출하여 가설검정하라 (단 모집단의 표준편차는 4로 알려져 있고 가정) (1) 이 맞다면 (2) 일 때 임계값 Z = -1.64 기각은 가 -1.64보다 작게 나올 때 임 (3) 따라서 Reject 즉 이라는 가설을 기각한다.
21
예 3 : 모 입시학원에서 서강대학교 경제학과에 입학하기 위해서는 수능점수가
350점 이상을 받으면 된다는 발표를 하였다. 그러나 철수는 입시학원에서 발표하는 수능점수보다 높을 것이라고 생각하고 있어 49명의 표본을 추출하여 수능성적을 조사(평균 355점)하여 입시학원의 주장이 맞는지를 검정하고자 하였다. 단 서강대학교 경제학과 전체의 수능성적의 표준편차는 15점이라는 것을 알고 있다고 가정한다. (1) 이 맞다면 (2) 일 때 임계값 Z = 1.64 기각은 가 1.64보다 크게 나올 때 임 (3) 따라서 Reject 즉 이라는 가설을 기각한다.
22
예 4 : 길동이는 볼트와 너트를 조립하여야 하는데 너트가 부족하여 지름이 2cm인
반품을 하는 것으로 계약을 맺었다고 한다. 이를 검정하기 위해 25개의 너트의 지름을 재어 보니 평균이 cm가 나왔 을 때 5%의 유의수준에서 가설검정하여 보아라(단 모집단의 표준편차는 0.01cm 라고 가정한다). (1) 가 맞다면 (2) 일 때 임계값 기각은 가 -1.96보다 작거나 1.96보다 크게 나올 때 임 (3) 따라서 Do not Reject 즉 반품을 하게 않는다.
23
(1) 모집단의 분산을 모르고 있을 경우 예 1 : H 자동차의 연비가 라고 자동차 회사에서 선전하고 있다.
그러나 소비자들은 이보다 작을 것이라는 불만을 가지고 있어 9대의 신차를 표본을 추출하여 평균연비가 , 표준편차가 가 나왔다고 하자. 5%의 유의수준에서 가설검정해 보아라.
24
(1) 가 맞다면 (2) 일 때 임계값 기각은 가 보다 작게 나올 때 임 (3) 따라서 Reject 즉 자동차회사의 주장이 틀렸다고 할 수 있다.
25
예 2 : 자동차가 시속 30km로 달릴 때, 사고가 나면 평균 수리비가 50만원이
소요된다고 주장되고 있다. 이에 대한 소비자들의 불만이 있어 9대의 자동차를 정확히 시속 30km로 달려 충돌 시험을 한 후 수리비를 조사해 보니 평균 55만원이 소요되고, 표준편차는 15만원인 것으로 나타났다. 5%의 유의 수준에서 가설검정해 보아라. (1) 이 맞다면 (2) 일 때 임계값 기각은 가 보다 크게 나올 때 임 (3) 따라서 Do not Reject 즉 자동차회사의 주장이 틀렸다고 할 수 없다.
26
예 3 : 어느 공장에서 제품 하나를 생산하는데 소요되는 평균시간이 12.5분 이었다.
9명의 새로운 기능공을 모집하여 훈련시킨 다음에 이들의 생산시간을 측정 한 결과 평균은 11.85분, 표준편차가 1.28분으로 계측되었을 때, 5%의 유의수준에서 생산성의 차이가 있는지 가설검정하여라. (1) 이 맞다면 (2) 일 때 임계값 기각은 가 보다 작거나 보다 크게 나올 때 임 (3) 따라서 Do not Reject 즉 새로운 기능공의 생산성이 기존의 종사자와 차이가 없다는 주장을 기각할 수 없다.
27
모 분산의 가설검정 기각역 기각역 기각역
28
예 1 : 투자회사는 A 주식 수익률의 변동성(분산)이 0.04이라고 주장하고 있다.
그러나 변동성이 이 보다 큰 것으로 예상되어 철수는 과거 101일 동안 자료를 이용하여 분산을 구한 결과 인 것으로 나타났다. 5%의 유의수준에서 이를 가설검정하여라. (1) 이 맞다면 (2) 일 때 임계값 기각은 가 보다 크게 나올 때 임 (3) 따라서 Reject 즉 투자회사의 주장이 틀렸다고 할 수 있다.
29
예 2 : 위의 문제에서 투자회사에서 수익율의 분산이 0.04라고 주장하고 있고,
과연 실제 분산이 투자회사가 주장하는 분산과 차이가 나는지를 5%의 유의수준에서 가설검정하시오. (1) 이 맞다면 (2) 일 때 임계값 기각은 가 보다 작거나 보다 크게 나올 때 임 (3) 따라서 Do not Reject 즉 투자회사가 주장하듯이 A 주식의 수익률의 분산이 0.04라는 주장을 기각할 수 없다.
30
예 3 : 주식 수익률의 분산이 0.04보다 큰 경우 이 주식은 매우 위험한 투자대상으로
분류된다고 하자. 그런데 모 조사기관에서 길동이가 운영하고 있는 회사의 주식이 매우 위험한 투자대상으로 분류되어 길동이는 과거 101일 동안의 주식가격 자료를 이용하여 검정하고자 하였다. 101일 동안의 길동이 회사 주식 수익률의 분산은 0.035가 나왔을 때 5%의 유의수준에서 가설검정하시오. (1) 이 맞다면 (2) 일 때 임계값 가 나타나 있지 않음 그러나 가 적어도 보다 작게 나오면 기각 (3) 따라서 Reject 즉 투자회사의 주장이 틀렸다고 할 수 있다.
31
비율의 가설검정 기각역 기각역 기각역
32
예 1 : 2cm의 너트를 1,000개를 구입하기로 계약할 때 불량품의 비율이 5% 이상이
불량품으로 판정하기로 한다. 물건을 수령한 후 100개의 표본을 추출하여 검사한 결과 8개가 불량품이 나왔 을 때 5%의 유의수준에서 가설검정하시오. (1) 가 맞다면 (2) 일 때 임계값 기각은 가 1.65보다 크게 나올 때 임 (3) 따라서 Do not Reject 즉 반품을 하지 않는다.
33
예 2 : 과거 판매실적으로부터 소비자의 30%가 A 회사의 치약을 이용.
TV 광고를 시작한 이후 광고 효과로 시장점유율이 5%증가하였다는 주장이 있다. 이를 알아보기 위해 1,000명의 소비자들의 조사를 통하여 A 회사의 치약을 사용하고 있는 소비자가 328명인 것으로 나타났다. 5%의 유의수준에서 가설검정하시오. (1) 가 맞다면 (2) 일 때 임계값 기각은 가 보다 작게 나올 때 임 (3) 따라서 Do not Reject 즉 TV 광고로 5%의 시장점유율이 증대되었다는 주장을 기각하지 못한다.
Similar presentations