두 모집단에 대한 검정
지금까지 한 모집단의 기대값이나 분산 또는 비율에 대한 가설검정 그러나 현실적으로 두 모집단을 비교하는 경우가 있음 예를 들어, 강남과 강북의 아파트값 변동 서울과 지방의 아파트값 변동 남학생과 여학생의 평균 성적의 비교 등
두 모집단 평균에 관한 검정 가설 혹은 혹은 Let 혹은 혹은 를 이용하여 검정한다. ,
두 확률변수 와 가 정규분포 X, Y 독립이면 0
모분산을 알고 있을 때 : Notation의 편의를 위해 첨자 X 대신에 1, Y 대신에 2를 이용하자.
모분산을 알고 있지 않을 때 : t-분포를 이용(단 ). 표본의 비율을 가중치로 둔 두 표본분산의 가중평균
예 1 : 두 지역의 평균임균을 비교하기 위해 X 지역에서는 100명, Y 지역에서는 60명의 표본을 추출하여 다음과 같은 결과 5%의 유의수준에서 두 지역간의 평균임금의 차이가 있는지를 가설검정하시오.
(1) 가 맞다면 (2) 일 때 임계값 기각은 가 -1.975보다 작게 나오거나 1.975보다 크게 나올 때 임 (1) 가 맞다면 (2) 일 때 임계값 기각은 가 -1.975보다 작게 나오거나 1.975보다 크게 나올 때 임 (3) 따라서 Reject 즉 두 지역의 임금차이가 없다는 귀무가설을 기각한다.
표본의 크기가 큰 경우(두 모집단의 표본의 크기가 30보다 큰 경우) t-분포보다는 근사적으로 정규분포를 이용하기도 함. 근사적으로 다음의 정규분포를 이용함
예 : 경제학 전공자의 연봉( ) > 경영학 전공자의 연봉 ( )? 50명씩 표본추출
1.676 따라서 Do not Reject 즉 임금차이가 없다는 귀무가설을 기각하지 못한다.
두 모집단 분산에 관한 검정 기각역 기각역 기각역
예 1 : 전자와 금융산업 주식 수익률의 위험을 비교하려 한다. 일반적으로 전자산업과 금융산업 주식 수익률의 위험이 동일할 것으로 예상되지만 길동이가 생각하기에 금융산업이 전자산업보다 더 위험하다고 예상하고 있다. 이를 검정하기 위해 전자와 금융산업에서 각각 7개와 11개 주식 수익률의 분산을 구한 결과 와 이 나왔다. 2%의 유의수준에서 검정하시오.
(1) 이 맞다면 (2) 일 때 임계값 기각은 가 0.1855보다 작게 나오거나 7.87보다 크게 나올 때 임 기각은 가 0.1855보다 작게 나오거나 7.87보다 크게 나올 때 임 (3) 따라서 Do not Reject 즉 두 산업 주식의 수익률 간에 위험의 차이가 없다는 귀무가설을 기각하지 못한다.
두 모집단 비율에 관한 검정 가설 혹은 혹은 혹은 혹은 Note :
모수 과 가 알려져 있지 않기 때문에 표본의 크기가 큰 경우에 근사적으로 표본의 값을 이용
만약 을 위 식에 대입하고 정리 여기서
예 : 어느 회사의 제품을 두 지역에서 판매하고 있는데 두 지역에서의 시장점유율이 동일한 것인가를 알고자 한다. 이를 위해 1지역에서는 1,000명, 2지역에서는 1,500명의 표본을 추출 하여 설문조사를 한 결과 1지역에서는 420명이 2지역에서는 615명이 이 회사의 제품을 소비한다고 하였다. 5%의 유의 수준에서 검정하시오.
만약 귀무가설이 맞다면
-1.96 1.96 따라서 Do not Reject 즉 두 지역의 점유율의 차이가 없다는 귀무가설을 기각하지 못한다.