Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions November 29, 2018 켈러의 경영경제통계학 제8장 표본분포 Sampling Distributions Copyright © 2006 Brooks/Cole, a division of Thomson Learning, Inc.
표본분포 (Sampling Distributions)… -표본분포는 통계량의 확률분포이다. -표본분포를 도출하기 위해 확률법칙(rules of probability )과 기대치및 분산의 법칙(laws of expected value and variance )이 사용된다.
8.1 표본평균의 표본분포 (Sampling Distribution of the Sample Mean)… -한 개의 균형잡힌 주사위를 무한히 던지면서 구해지는 확률변수 X(=주사위에 나타나는 점의 수)의 확률분포는 다음과 같다. -…확률변수 X의 모평균과 모분산은 … x 1 2 3 4 5 6 P(x) 1/6
두개 주사위 던지기에서 표본평균의 표본분포… -표본크기 n=2인 가능한 모든 표본들과 각 표본의 표본평균을 정리하면 다음과 같다.
두개 주사위 던지기에서 표본평균의 표본분포… 6/36 5/36 4/36 3/36 2/36 1/36 P( ) P( )
비교… X의 확률분포… … 의 표본분포…
표본분포의 모표준편차는 표준오차(standard error:)라고 부른다. 일반화… -두 개 주사위로부터 만들어지는 표본평균의 모평균과 모분산은 … -n 개 주사위로부터 만들어지는 표본평균의 모평균과 모분산은… 표본분포의 모표준편차는 표준오차(standard error:)라고 부른다.
중심극한정리 (Central Limit Theorem)… -임의의 확률분포를 모집단으로부터 추출된 임의표본의 표본평균이 가지는 표본분포는 표본크기가 충분히 크면 (a sufficiently large sample size) 정규분포에 더 가까워진다 (“approximately normal “) -표본크기가 크면 클수록, 표본평균의 표본분포는 정규분포에 더 가까워진다.
중심극한정리 (Central Limit Theorem)… 모집단이 정규분포를 따르면, 표본크기에 관계없이 표본평균은 정규분포를 따른다. 모집단이 정규분포를 따르지 않으면 (임의의 분포를 따르면), 표본크기가 충분히 크면 표본평균은 근사적으로 정규분포를 따른다. -대부분의 실제상황에서 표본크기가 30이면 충분히 크며 표본평균의 표본분포에 대한 근사로서 정규분포를 사용할 수 있다.
표본평균의 표본분포 (Sampling Distribution of the Sample Mean)… 1. 2. 3. 만일 X가 정규분포를 따르면, X 는 정규분포를 따른다. 만일 X가 정규분포를 따르지 않으면, X 는 표본크기가 충분히 크면 근사적으로 정규분포를 따른다. “표본크기가 충분히 크다”는 정의는 X가 정규분포로부터 이탈되어 있는 정도에 의해 결정된다.
표본평균의 표본분포 (Sampling Distribution of the Sample Mean)… -표본평균의 표본분포는 다음과 같이 나타낼 수 있다.
표본평균의 표본분포: 실증적 도출… “Applet 9 –Applet 12 를 사용하여 표본평균의 표본분포를 실증적으로 도출해보라.”
예제 8.1 “32-온스” 병의 내용물 중량… -한 보틀링(bottling/병에 내용물을 채워 넣는) 공장의 공장장은 가 “32-온스” 병에 들어있는 탄산음료의 양은 실제로 평균이 32.2온스이고 표준편차가 0.3온스인 정규분포를 따르는 확률변수라는 것을 관측하였다.
예제 8.1 “32-온스” 병의 내용물 중량… 한 고객이 한 개의 병을 사는 경우 이 병이 32온스를 초과하는 탄산음료의 양을 가지고 있을 확률은 얼마인가? -한 개의 병에 들어있는 탄산음료의 양을 확률변수 X라고 하자. X는 µ = 32.2와 σ =0.3을 가진 정규분포를 따른다. 이제 P(X>32)..??
예제 8.1 “32-온스” 병의 내용물 중량… -b. 한 고객이 4개의 병이 들어있는 카톤 1개를 사는 경우 4개 병의 평균 탄산음료 양 이 32온스를 초과할 확률은 얼마인가? ->P(X > 32) ?? X는 µ = 32.2와 σ =0.3을 가진 정규분포를 따른다. 그러므로 X는 =32.2 와 를 가진 정규분포를 따른다. -따라서
예제 8.1 그래프로 나타내면… mean=32.2 한 개의 병이 32온스이상의 탄산음료를 가지고 있을 확률은 얼마인가? 4개 병의 평균이 32온스이상의 탄산음료를 가지고 있을 확률은 얼마인가?
8.2 표본비율의 표본분포 (Sampling Distribution of the Sample Proportion)… -모비율(population proportion)(p)의 추정량은 표본비율(sample proportion )이다. 표본비율은 성공의 횟수(X)를 표본크기(n)로 나누어 구해진다. -X는 n번 시행에서 성공하는 횟수이며 각 시행은 독립이고 각 시행에서 성공확률은 모비율 p 인 이항분포를 따른다.
이항분포의 정규분포에 의한 근사 (Normal Approximation to Binomial)… -이항분포(n=20, p=.5)는 정규분포( =10, = 2.24)에 의해 양호하게 근사된다.
이항분포의 정규분포에 의한 근사 (Normal Approximation to Binomial)… -이항분포의 정규분포에 의한 근사는 시행의 횟수 n (표본크기)가 크고 각 시행에서 성공의 확률 p가 0.5에 가까울 때 가장 잘 이루어진다. np ≥ 5과 n(1–p) ≥ 5의 조건이 충족될 때 이항분포의 정규분포에 의한 근사가 양호하게 이루어진다.
이항분포의 정규분포에 의한 근사 (Normal Approximation to Binomial)… *정규분포를 사용하면서 P(X=10)를 계산하기 위해 정규분포를 이용하여 P(9.5 < Y < 10.5)를 구한다. P(X = 10) ≈ P(9.5 < Y < 10.5) Y (np, np(1-p)) 는 이항확률변수 X (n, p) 를 근사시키는 정규확률변수이다.
이항분포의 정규분포에 의한 근사 (Normal Approximation to Binomial)… P(X = 10) = .176 P(9.5 < Y < 10.5) = .1742 ”근사는 매우 양호” P(X = 10) ≈ P(9.5 < Y < 10.5)
표본비율의 표본분포 (Sampling Distribution of the Sample Proportion)… -기대치 및 분산의 법칙을 사용하면, 표본비율 의 기대치, 모분산, 모표준편차 (표본오차)를 구할 수 있다. 따라서 이항분포의 정규분포에 의한 근사를 사용하면 ~ N(0,1)
8.3 표본분산의 표본분포 (Sampling Distribution of the Sample Variance)… 표본분산 은 모분산 에 관한 추론을 위해 사용되는 통계량이다. <표본분산의 표본분포> 는 자유도가 n-1인 카이제곱분포를 따른다.
8.3 표본분산의 표본분포 (Sampling Distribution of the Sample Variance)… 카이제곱분포의 특성을 이용하면 - 따라서 표본분산의 평균과 분산은 다음과 같다.
8.4 두 표본평균 차이의 표본분포… - 두 표본평균 차이의 표본분포를 도출하기 위해서는 다음과 같은 조건이 충족되어야 한다. 두 개의 정규분포를 따르는 모집단으로부터 각각 독립적인 임의표본이 추출된다. -이와 같은 조건이 충족되면, 두 표본평균 차이의 표본분포는 정규분포를 따른다. (* 두 모집단이 모두 정규분포를 따르지 않으면, 표본크기들이 “크면” (>30), 두 표본평균 차이의 표본분포는 근사적으로 정규분포를 따른다)
8.4 두 표본평균 차이의 표본분포 … 의의 기대치와 분산은 각각 다음과 같다. , -따라서
예제 8.3 MBA졸업생의 최초 연봉… - 두 대학의 MBA졸업생들의 최초 연봉은 각각 표에 제시된 것 같은 평균과 표준편차를 가진 정규분포를 따른다고 하자. 두 대학의 MBA졸업생들에 대한 표본이 각각 표에 제시되어 있는 표본크기로 추출되었다. University 1 University 2 Mean 62,000 $/yr 60,000 $/yr Std. Dev. 14,500 $/yr 18,300 $/yr sample size n 50 60 -University1의 MBA졸업생 최초 연봉의 표본평균이 University 2의 MBA졸업생 최초 연봉의 표본평균을 초과할 확률은 얼마인가?
예제 8.3 MBA졸업생의 최초 연봉 … -질문은 P(X1 – X2 > 0)은 얼마인가 ? Z
8.5 표본분포와 통계적 추론… -모집단과 모수에 관한 지식이 있으면, 모집단의 개별적인 구성원(원소)에 대한 확률을 나타내기 위해 확률분포를 사용할 수 있다. 모집단/모수 확률분포 확률변수의 개별확률 -모수와 표본분포에 관한 지식이 있으면, 표본통계량에 관한 확률을 나타낼 수 있다. 모집단/모수 표본분포 표본통계량의 확률
8.5 표본분포와 통계적 추론… -표본분포는 모집단/모수에 관한 지식이 없는 상황에서 모집단과 모수에 관한 통계적 추론을 할 수 있게 해준다. 통계량 표본분포 모수