Sampling Distributions 켈러의 경영경제통계학 표본분포 Sampling Distributions
표본분포 (Sampling Distributions)… -표본분포는 통계량의 확률분포이다. -표본분포를 도출하기 위해 확률법칙(rules of probability )과 기대치및 분산의 법칙(laws of expected value and variance )이 사용된다.
표본평균의 표본분포 (Sampling Distribution of the Sample Mean) -한 개의 균형잡힌 주사위를 무한히 던지면서 구해지는 확률변수 X(=주 사위에 나타나는 점의 수)의 확률분포는 다음과 같다. 확률변수 X의 모평균과 모분산은 … x 1 2 3 4 5 6 P(x) 1/6
두개 주사위 던지기에서 표본평균의 표본분포 -표본크기 n=2인 가능한 모든 표본들과 각 표본의 표본평균을 정리하면 다 음과 같다.
두개 주사위 던지기에서 표본평균의 표본분포 표본평균의 표본분포 P( ) P( ) 6/36 5/36 4/36 3/36 2/36 1/36 P( )
비교… X의 확률분포… … 의 표본분포…
일반화 두 개 주사위로부터 만들어지는 표본평균의 모평균과 모분산은 -n 개 주사위로부터 만들어지는 표본평균의 모평균과 모분산은 표본분포의 모표준편차는 표준오차(standard error:)라고 부른다.
중심극한정리 (Central Limit Theorem) -임의의 확률분포를 모집단으로부터 추출된 임의표본의 표본 평균이 가지는 표본분포는 표본크기가 충분히 크면 (a sufficiently large sample size) 정규분포에 더 가까워진다 (“approximately normal “) -표본크기가 크면 클수록, 표본평균의 표본분포는 정규분포에 더 가까워진다. 9.8
중심극한정리 (Central Limit Theorem) 모집단이 정규분포를 따르면, 표본크기에 관계없이 표본평균 은 정규분포를 따른다. 모집단이 정규분포를 따르지 않으면 (임의의 분포를 따르면) 표본크기가 충분히 크면 표본평균은 근사적으로 정규분포를 따 른다. -대부분의 실제상황에서 표본크기가 30이면 충분히 크며 표본 평균의 표본분포에 대한 근사로서 정규분포를 사용할 수 있다. 9.9
표본평균의 표본분포 (Sampling Distribution of the Sample Mean)… 1. 2. 3. 만일 X가 정규분포를 따르면, X 는 정규분포를 따른다. 만일 X가 정규분포를 따르지 않으면, X 는 표본크기가 충분히 크면 근사적으로 정규분포를 따른다. “표본크기가 충분히 크다”는 정 의는 X가 정규분포로부터 이탈되어 있는 정도에 의해 결정된다.
표본평균의 표본분포 (Sampling Distribution of the Sample Mean)… -표본평균의 표본분포는 다음과 같이 나타낼 수 있다.
표본비율의 표본분포 (Sampling Distribution of the Sample Proportion) -모비율(population proportion)(p)의 추정량은 표본비율 (sample proportion )이다. 표본비율은 성공의 횟수(X)를 표본 크기(n)로 나누어 구해진다. -X는 n번 시행에서 성공하는 횟수이며 각 시행은 독립이고 각 시행에서 성공확률은 모비율 p 인 이항분포를 따른다.
이항분포의 정규분포에 의한 근사(Normal Approximation to Binomial) -이항분포(n=20, p=.5)는 정규분포( =10, = 2.24)에 의해 양호하게 근사된다. 9.18
이항분포의 정규분포에 의한 근사 (Normal Approximation to Binomial) -이항분포의 정규분포에 의한 근사는 시행의 횟수 n (표본크 기)가 크고 각 시행에서 성공의 확률 p가 0.5에 가까울 때 가 장 잘 이루어진다. np ≥ 5과 n(1–p) ≥ 5의 조건이 충족될 때 이항분포의 정규 분포에 의한 근사가 양호하게 이루어진다. 9.19
Y (np, np(1-p)) 는 이항확률변수 X (n, p) 를 근사시키는 정규확률변수이다. 이항분포의 정규분포에 의한 근사 *정규분포를 사용하면서 P(X=10)를 계산하기 위해 정규 분포를 이용하여 P(9.5 < Y < 10.5)를 구한다. P(X = 10) ≈ P(9.5 < Y < 10.5) Y (np, np(1-p)) 는 이항확률변수 X (n, p) 를 근사시키는 정규확률변수이다.
이항분포의 정규분포에 의한 근사 P(X = 10) ≈ P(9.5 < Y < 10.5) P(X = 10) = .176 ”근사는 매우 양호” P(X = 10) ≈ P(9.5 < Y < 10.5)
표본비율의 표본분포 (Sampling Distribution of the Sample Proportion) -기대치 및 분산의 법칙을 사용하면, 표본비율 의 기대치, 모분산, 모표준편차 (표본오차)를 구할 수 있다. 따라서 이항분포의 정규분포에 의한 근사를 사용하면 ~ N(0,1) 9.22
표본분산의 표본분포 표본분산 은 모분산 에 관한 추론을 위해 사용되는 통계량이다. <표본분산의 표본분포> 표본분산 은 모분산 에 관한 추론을 위해 사용되는 통계량이다. <표본분산의 표본분포> 는 자유도가 n-1인 카이제곱분포를 따른다. 9.26
표본분산의 표본분포 카이제곱분포의 특성을 이용하면 - 따라서 표본분산의 평균과 분산은 다음과 같다.
두 표본평균 차이의 표본분포 - 두 표본평균 차이의 표본분포를 도출하기 위해서는 다음 과 같은 조건이 충족되어야 한다. 두 개의 정규분포를 따르는 모집단으로부터 각각 독립 적인 임의표본이 추출된다. -이와 같은 조건이 충족되면, 두 표본평균 차이의 표본분 포는 정규분포를 따른다. (* 두 모집단이 모두 정규분포를 따르지 않으면, 표본크기 들이 “크면” (>30), 두 표본평균 차이의 표본분포는 근사적 으로 정규분포를 따른다)
표본분포와 통계적 추론 -모집단과 모수에 관한 지식이 있으면, 모집단의 개별적 인 구성원(원소)에 대한 확률을 나타내기 위해 확률분포 를 사용할 수 있다. 모집단/모수 확률분포 확률변수의 개별확률 -모수와 표본분포에 관한 지식이 있으면, 표본통계량에 관한 확률을 나타낼 수 있다. 모집단/모수 표본분포 표본통계량의 확률
표본분포와 통계적 추론 -표본분포는 모집단/모수에 관한 지식이 없는 상황에서 모집단과 모수에 관한 통계적 추론을 할 수 있게 해준다. 통계량 표본분포 모수