제 7 장 표본분포
표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산
통계량의 예 모집단 … … 표본 표본추출 … … 통계량 계산 [예][예] …
통계량의 예 [ 질문 ] 모집단 … … 표본 표본추출 … … 다음은 통계량인가 ? Yes/No 왜 ? 123 N
유용한 통계량 : 평균 / 비율 / 분산 모집단 … … 표본 표본추출 … … 통계량 계산 … 평균 분산 유용한 통계량 비율 또는 평균비율분산
평균의 표본분포 : 기대값 / 분산 모집단 … … 표본 … … … … …… …
평균의 표본분포의 종류 모집단의 분포가 정규분포이면 표본크기에 관계없이 표본평균의 분포는 정규분포이다. 모집단의 분포에 관계없이 표본크기가 크면 표본평균의 분포는 정규분포에 가까워진다. 중심극한정리 (central limit theorem)
표본 평균의 확률계산 1) 표본 평균을 표준화 Z 통계량 (standardized Z statistic) 으로 변환 2) (1) 표준정규분포표를 사용하여 확률계산 (2) normsdist(z) 를 사용하여 확률계산 또는 (1) normdist(x, , ,1)
예제 7.1 ( 원료사용량 분석 ) K 사의 주원료 1 일 사용량은 평균 270 ㎏, 표준편차 50 ㎏인 정규분포를 이루고 있다. 매일의 주원료 사용량이 독립적이고, 1 주일 가동일 수를 5 일, 1 개월 가동일 수를 20 일이라고 할 때 다음을 구하시오. 1) 1 주일 동안의 1 일 평균 사용량이 300 ㎏을 초과할 확률. 2) 1 개월 동안의 1 일 평균 사용량이 300 ㎏을 초과할 확률. 3) 1 주일 동안 1 일 평균 사용량이 250 ㎏ 이하일 확률. 4) 1 개월 동안의 1 일 평균 사용량이 250 ㎏ 이하일 확률.
비율의 표본분포 : 기대값 / 분산 모집단 … … 표본 … … … … …… …
비율의 표본분포의 종류 모집단의 비율 (pi) 이 0.5 이면 표본의 크기에 관계없이 비율의 표본분포는 정규분포이다. 모집단의 비율 (pi) 이 0.5 가 아닌 경우 이고 또한이면 정규분포에 접근한다.
표본 비율의 확률계산 1) 표본 비율을 표준화 Z 통계량 (standardized Z statistic) 으로 변환 2) (1) 표준정규분포표를 사용하여 확률계산 (2) normsdist(z) 를 사용하여 확률계산 또는 (1) normdist(x, , ,1)
예제 7.2 휴대폰을 보유한 우리나라 대학생의 40% 가 T 사에 가입하고 있는 것으로 알려져 있다. 다음을 구하시오. 1) 휴대폰을 보유한 대학생 100 명을 무작위 추출하는 경우 T 사에 가 입한 학생의 비율이 45% 이상일 확률. 2) 1) 의 문제에서 비율이 30% 이하일 확률. 3) 1) 의 문제에서 196 명을 표본 추출하는 경우 45% 이상일 확률. 4) 3) 의 문제에서 비율이 30% 이하일 확률.
평균의 표본분포 : 가 알려지지 않 은 경우 모집단 … … 표본 … … … … …… … … 자유도가 인 분포
t 분포 1) 모수 : 자유도 (degree of freedom) 2) 확률변수값의 범위 3) 확률밀도함수 4) 기대값 / 분산 생략
t 분포표 tdist(1.812,10,1) tinv( 확률, 자유도 ) tinv(0.1,10) tdist( 변수값, 자유도,1 or 2) 0.05
확률계산 1) 표본의 평균을 t 통계량 (t statistic) 으로 변환 2) 자유도 (n-1) 의 t 분포표를 사용하여 확률계산 tdist( t, df, 1 )
예제 7.4 H 편의점 본사에서는 서울 인근의 시 지역 가맹점의 평일 하루 평균 고객 수가 400 명, 1 인당 평균 구매액 8,000 원이라고 한다. K 씨가 3 개 가맹점에서 1 일 고객 수와 1 인당 구매금액을 조사한 결과는 첨부자료 12 ‘ 편의점 ’ 의 자료와 같다. H 편의점 본사의 주장이 사실이며, 정규분포라고 가정하고 다음을 구하시오. 각 가맹점의 고객 수 및 구매액의 표본평균의 값이 본사의 주장보다 클 경우 표본평균이 관찰된 값보다 클 확률을 구하고, 표본평균이 본사의 주장보다 작을 경우 표본평균이 관찰된 값보다 작을 확률을 구하시오.
분산의 표본분포 모집단 … … 표본 … … … … …… … 123 N 123n 123n 123n 123n … 자유도가 인 분포
Chi-square 분포 1) 모수 : 자유도 (degree of freedom) 2) 확률변수의 값의 범위 3) 확률함수 4) 기대값 / 분산
Chi-square 분포표 chidist(15.598,10) 0.1 chiinv(0.1,10)
표본 분산 / 표준편차의 확률계산 1) 표본의 분산 / 표준편차를 카이제곱통계량 ( 2 statistic) 으로 변환 2) 자유도 (n-1) 의 카이제곱분포를 사용하여 확률계산
예제 7.5 건강보조식품 P-10 을 생산하여 판매하는 인하제약은 에는 P 성분의 함량이 표준편차 0.04 ㎎으로 정규분포를 이루고 있는 것으로 알려져 있다. 12 개를 무작위로 추출하여 조사할 경우 1) 표준편차 s 가 0.05 ㎎ 이상일 확률 : P(s≥0.05 ㎎ ). 2) 표준편차 s 가 0.03 ㎎ 이하일 확률 : P(s≤0.03 ㎎ ). 3) 표준편차가 표준규격인 이상 ㎎ 이하일 확률 : P(0.025 ㎎ ≤s≤0.045 ㎎ ). 4)P(s>s*)=0.05 인 s* 의 값. 5)P(s<s#)=0.05 인 s# 의 값.
분산비율의 표본분포 두 표본 ( 표본 1, 표본 2) 에서 계산된 분산의 비율을 라고 하자. 는 분자의 자유도가이고 분모의 자유도가인 F 분포를 따른다.
F 분포 1) 모수 : 분자의 자유도 : 분모의 자유도 2) 확률변수가 취할 수 있는 범위 3) 확률함수 여기서
F 분포표 =fdist(x,df1,df2) (예)(예) =fdist(3.48,5,9) 0.05
예제 7.6 첨부자료 13 ‘ 삼성 &LG 전자 주식 ’ 은 전자업계의 우리나라 대표기업인 삼성전자와 LG 전자의 주식거래 관련 자료를 무작위로 50 일간을 수집한 자료이다. 주가 등락률이 정규분포이고 분산이 같으며 상호독립적이라는 가정하에 이 자료를 이용하여 다음을 구하시오. 삼성전자 :LG 전자 1 일 주가 등락률의 분산 비율이 1 보다 클 확률 ? 삼성전자 :LG 전자 1 일 주가 등락률의 분산 비율이 2 보다 클 확률 ?