표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포
1 모집단분포와 표본분포 모집단 분포와 확률표본의 의미, 표본분포와 통계량에 대하여 알아본다.
▶ ▶ 모집단 분포(population distribution) : 어떤 통계적 실험의 대상이 되는 모든 대상물인 모집단의 정보로부터 얻어지는 확률 분포 ▶ 모수(parameter) : 모집단의 특성을 나타내는 수치 모평균, 모분산, 모표준편차, 모비율, 모상관관계 대부분의 모집단 분포는 완전하게 알려진 것이 없으며, 따라서 모집단 분포의 정확한 중심의 위치나 산포도 등을 알 수 없다. 모집단의 확률분포를 비롯한 특성을 알기 위하여 전수조사를 한다는 것은 경제적, 공간적 또는 시간적인 제약에 의하여 거의 불가능 표본을 선정
? 어느 배터리 제조회사에서 특별한 모델의 cell phone에 사용될 새로운 배터리를 생산하고자 한다면, 임의 추출 정보수집 추 론 어느 배터리 제조회사에서 특별한 모델의 cell phone에 사용될 새로운 배터리를 생산하고자 한다면, 이 회사에서 생산될 배터리의 수명이 어떠한 확률분포에 따르는지 알 수 없다. 따라서 몇 개의 배터리를 표본으로 추출하여 실제로 cell phone에 사용하여 얻은 배터리 수명에 대한 측정값을 구한다. 그러면 이러한 측정값들(표본)은 이 회사에서 생산될 배터리들의 확률분포(모집단 분포)로부터 추출된 표본을 구성하게 된다. 이때 앞으로 생산될 배터리의 수명은 갖는 알려지지 않은 확률분포 f(x)에 따른다.
▶ ▶ 확률표본(random sample) : 모집단을 형성하고 있는 모든 대상들이 선정될 가능성을 동등하게 부여하고, 객관적이고 임의적으로 각 대상을 선정한 표본 ▶ 통계량(statistics) : 표본으로 산출된 통계적인 양 표본평균, 표본분산, 표본표준편차, 표본비율, 표본상관관계 통계량은 표본을 어떻게 선정하느냐에 따라서 그 값이 다르게 나타난다. 즉, 동일한 모집단에서 동일한 크기의 표본을 선정하더라도 각 표본의 평균은 서로 다르게 나타남. 통계량은 확률변수 통계량의 확률분포를 표본분포라 한다.
x2 : 두 번째 추출된 관찰값 X2 ∼ f(x) E(Xi) = … Var(Xi) = 2 : 모평균 s2 : 모분산 모집단 x1 x2 x8 x9 xn x3 x7 x4 x5 x6 x10 표 본 … x1 : 첫 번째 추출된 관찰값 X1 ∼ f(x) x2 : 두 번째 추출된 관찰값 X2 ∼ f(x) E(Xi) = … Var(Xi) = 2 xn : n 번째 추출된 관찰값 Xn ∼ f(x) 표본평균 : 표본분산 : X = Xi S2 = (Xi – X )2 1 n n-1 i = 1 관찰된 표본평균 : 관찰된 표본분산 : x = xi s2 = (xi – x )2
예 생산된 10개의 배터리를 표본으로 추출하여 얻은 측정값 835 637 764 830 768 840 790 835 840 910 표본평균과 표본분산의 관찰값 = ? 예 관찰된 표본평균 : 관찰된 표본분산 : x = xi = 804.9 s2 = (xi – 804.9 )2 = 5488.77 1 9 i = 1 10 f(x) : 미지의 모집단 분포 : 모평균 2 : 모분산 전체 배터리 수명 764 835 637 768 830 840 790 910 표 본
2 표본평균의 분포 표본평균의 평균과 모평균, 표본평균의 분산과 모분산의 관계 그리고 중심극한정리에 의한 표본평균의 분포의 변화, 두 독립인 표본평균의 차에 대한 분포 등에 대하여 알아본다.
☞ 1) 표본평균과 모평균(비복원 추출) x1과 x2 그리고 x가 취할 수 있는 모든 경우 80 63 76 77 84 79 87.5 91 84 77.0 63 71.5 80 85.5 73.5 71.0 79 82.0 85.0 70.0 77 81.5 63.0 79.5 69.5 76 83.5 84.0 80.0 78.0 77.5 80.5 76.5 78.5 x x2 x1 x1 x1과 x2 그리고 x가 취할 수 있는 모든 경우 80 63 76 77 84 79 91 2개 x1 x2 표본평균 : X = x1 + x2 2
X 의 확률분포와 확률히스토그램 x X의 평균 : E(X) = 77.7 X의 평균 : Var(X) = 31.3 0.0444 0.0444 0.0222 0.0889 0.0667 확률 87.5 85.5 85.0 84.0 83.5 82.0 81.5 80.5 80.0 79.5 78.5 78.0 77.5 77.0 76.5 73.5 71.5 71.0 70.0 69.5 63.0 x X의 평균 : E(X) = 77.7 X의 평균 : Var(X) = 31.3
x 63 76 77 79 80 84 91 확률 0.2 0.1 모집단의 확률분포 모평균 : = E(X) = 77.7 모분산 : 2 = Var (X) = 70.41 2 n N - n N - 1 • 70.41 2 10 - 2 10 - 1 = = 31.3 = Var(X) 표본평균의 평균과 모평균은 동일하다. 2 n N - n N - 1 • 표본평균의 분산 =
☞ 2) 표본평균과 모평균(복원 추출) x1과 x2 그리고 x가 취할 수 있는 모든 경우 80 63 76 77 84 79 91 2개 x1 x2 0.01 0.02 91.0 87.5 85.5 85.0 84.0 83.5 77.0 91 0.04 82.0 81.5 80.5 80.0 73.5 84 79.5 78.5 78.0 71.5 80 79.0 77.5 71.0 79 76.5 70.0 77 76.0 69.5 76 63.0 63 x1 x2 표본평균 : x1 + x2 2 X = x x 의 확률
X 의 확률분포와 확률히스토그램 x X의 평균 : E(X) = 77.7 X의 분산 : Var(X) = 35.21 2 70.41 0.01 0.04 0.02 0.06 0.08 확률 91.0 87.5 85.5 85.0 84.0 83.5 82.0 81.5 80.5 80.0 79.5 79.0 0.05 78.5 78.0 77.5 77.0 76.5 76.0 73.5 71.5 71.0 70.0 69.5 63.0 x X의 평균 : E(X) = 77.7 X의 분산 : Var(X) = 35.21 2 70.41 = 35.21 2 = 모분산 : 2 = Var (X) = 70.41 표본평균의 평균과 모평균은 동일하다. 2 n 표본평균의 분산 =
☞ 3) 표본평균과 모평균의 비교 ⊙ 모평균 와 모분산 2을 갖는 크기 N인 모집단으로부터 크기 n인 확률표본을 추출할 경우 = E(X) 복원추출인 경우 X 비복원추출인 경우 2 모집단 분 산 평 균 구 분 n N - n N - 1 • ※ N이 충분히 크면 비복원 추출과 복원 추출이 동일한 결과를 나타낸다. 특별한 언급이 없는 한 복원 추출인 경우를 다룬다.
☞ 4) 중심극한정리에 의한 표본평균의 변화 주사위 2번 던지기 게임 (n=2인 경우) 표본평균 : X = x1 + x2 2 의 확률분포 ? X1과 X2의 결합분포 1 1/6 fX (x) 1/36 6 5 4 3 2 fX (x) x1 x2 X1과 X2가 취하는 값 : 1, 2, 3, 4, 5, 6 2 P(X1 = x, X2 = y) = P(X1 = x)• P(X2 = y) (x1, x2)의 취하는 값 : (1, 1), (1, 2), …, (6, 6) x = x1 + x2 2 가 취하는 값 : 1, 1.5, 2, 2.5 3, 3.5 4, 4.5 5, 5.5, 6 1
표본평균 X 의 확률분포 : X E(X) = xP(X=x) = 3.5 E(X2) = x2 P(X=x) = 13.7083 0.028 0.056 0.083 0.111 0.139 0.166 확률 6 5.5 5 4.5 4 3.5 3 2.5 2 1.5 1 X E(X) = xP(X=x) = 3.5 E(X2) = x2 P(X=x) = 13.7083 Var(X) = E(X2) – E(X)2 = 1.4583 모평균 : = (1+6)/2 = 3.5 모분산 : 2 = (62 -1)/12 = 2.9167 표본 평균 모집단 = E(X) = 1.5, 2 = 2Var(X) = 2.9167
주사위 3번 던지기 게임 (n=3인 경우) x1 + x2+ x3 표본평균 : X = 의 확률분포 ? 3 0.005 0.014 0.028 0.046 0.069 0.097 0.116 0.125 확률 6.00 5.67 5.33 5.00 4.67 4.33 4.00 3.67 3.33 3.00 2.67 2.33 2.00 1.67 1.33 1.00 X = E(X) = 1.5, 2 = 3Var(X) = 2.9167
주사위 4번 던지기 게임 (n=4인 경우) x1 + x2+ x3+ x4 표본평균 : X = 의 확률분포 ? 4 X 0.001 0.003 0.008 0.015 0.027 0.043 0.062 0.080 0.097 0.108 확률 6.00 5.75 5.50 5.25 5.00 4.75 4.50 4.25 4.00 3.75 0.113 3.50 3.25 3.00 2.75 2.50 2.25 2.00 1.75 1.50 1.25 1.00 X 주사위 5번 던지기 게임 (n=5인 경우) 표본평균 : 의 확률분포 ? X = x1 + x2+ x3+ x4 + x5 5 0.0001 0.0006 0.0019 0.0045 0.0090 0.0162 0.0264 0.039 0.0541 0.0693 0.0838 0.0945 0.1002 확률 6.0 5.8 5.6 5.4 5.2 5.0 4.8 4.6 4.4 4.2 4.0 3.8 3.6 0.0398 3.4 3.2 3.0 2.8 2.6 2.4 2.2 2.0 1.8 1.6 1.4 1.2 1.0 X
● 모집단분포와 크기에 따른 표본평균의 분포 비교 n이 커질수록 표본평균의 분포는 종모양에 가까워진다.
( ) ( ) f(x) : 미지의 모집단 분포 : 모평균, 2 : 모분산 Xi ~ i.i.d. f(x) , : 모평균, 2 : 모분산 Xi ~ i.i.d. f(x) , i = 1, 2, 3, …, n E(Xi) = , Var(Xi) = 2 크기 n인 표본 E(Xi) = , Var(Xi) = 2 , i = 1, 2, 3, …, N 복원추출 1 n i=1 X = Xi의 평균과 분산 : E(X) = E Xi = E(Xi) = = (n) = 1 n ( ) i=1 Var(X) = Var Xi = Var(Xi) = 2 = (n2) = 2/n n2 S.D(X) = Var(X) = X ~ N , . 2 n ( ) ※중심극한정리에 의하여 미지의 모집단 분포 f(x)에 대하여
모집단 분포가 다음과 같은 모집단으로부터 비복원추출에 의하여 크기 2인 확률표본 X1, X2에 대한 표본평균의 확률분포와 평균 그리고 분산 x 1 2 3 4 f(x) 0.25 모집단 {1,2,3,4}에서 비복원추출에 의하여 크기 2인 확률표본을 뽑을 수 있는 모든 경우 : {1, 2}, {1, 3}, {1, 4}, {2, 1}, {2, 3}, {2, 4}, {3, 1}, {3, 2}, {3, 4}, {4, 1}, {4, 2}, {4, 3} X가 취할 수 있는 값들의 집합 : {1.5, 2, 2.5, 3, 3.5} X = 1.5 {X1 = 1, X2 = 2}, {X1 = 2, X2 = 1} X = 2 {X1 = 1, X2 = 3}, {X1 = 3, X2 = 1}, X = 2.5 {X1 = 1, X2 = 4}, {X1 = 2, X2 = 3}, {X1 = 3, X2 = 2}, {X1 = 4, X2 = 1} X = 3 {X1 = 2, X2 = 4}, {X1 = 4, X2 = 2} X = 3.5 {X1 = 3, X2 = 4}, {X1 = 4, X2 = 3}
P(X1 = i, X2 = j) = P(X1 = i)• P(X2 = j|X1 = i) 1 4 3 12 = 비복원추출에 의하여 표본을 선정 P(X1 = i, X2 = j) = P(X1 = i)• P(X2 = j|X1 = i) 1 4 3 12 • = , i, j = 1, 2, 3, 4, i ≠ j X의 확률분포 : 1/6 2/6 확률 3.5 3 2.5 2 1.5 x E(X) = 1.5 + 2 + (2.5)•2 + 3 + 3.5 6 = 2.5 E(X2 ) = 2.25 + 4 + (6.25)•2 + 9 + 12.25 = 6.67 Var(X) = E(X2 ) – E(X)2 = 0.417
( ) 예제1의 모집단분포로부터 크기 10인 표본을 임의 추출하였을 때, (1) X의 평균과 분산 모집단 분포 : x 1 2 3 4 f(x) 0.25 (1) = 2.5, 2 = 1.25, n = 10 = 2.5, 2 = = 0.125 X 2 10 (2) 표본평균의 근사분포 : X ~ N(2.5, 0.125) . P(2.75 ≤ X ≤ 3.5) = P ≤ X ≤ 2.75 – 2.5 0.354 3.5 – 2.5 ( ) = P(0.71 ≤ Z ≤ 2.82) = (2.82) – (0.71) = 0.9976 – 0.7611 = 0.2365 .
( ) 확률분포가 N(60, 4)인 모집단에서 크기 10인 표본을 임의 추출하였을 때, (1) X 의 확률분포, 평균과 분산 (1) X1, X2, …, X10 ~ i.i.d. N(60, 4) E(X) = = 60, Var(X) = 2/10 = 0.4 X = Xi ~ N(60, 0.4) 1 10 (2) P(58.5 ≤ X ≤ 61.5) = P ≤ X ≤ ( ) = P(-2.37 ≤ Z ≤ 2.37) = 2[(2.37) – 0.5] = 2(0.9911 – 0.5) = 0.9822 58.5 – 60 61.5 – 60 0.4 .
( ) ( ) ( ) ( ) 고교 3학년 학생 1,000명을 대상으로 수학 모의시험을 실시한 결과 평균 68.3이고 분산 1.5인 정규분포 (1) 임의로 한 명을 선정하였을 때, 이 학생이 69점 이상일 확률 (2) 10명을 임의로 선정하였을 때, 이 학생들의 평균 점수가 69점 이상일 확률 (3) 10명의 평균 점수가 상위 5% 안에 들어가기 위한 최하 점수 (1) 임의로 선정한 학생의 점수 : X ∼ N(68.3, 1.5) P(X ≥ 69) = P ≥ ( ) = P(Z ≥ 0.57) = 1 - (0.57) = 1 – 0.7157 = 0.2843 X – 68.3 1.5 69 – 68.3 (2) 10명의 평균점수 : X ~ N(68.3, 0.15) P(X ≥ 69) = P ≥ ( ) = P(Z ≥ 1.81) = 1 - (1.81) = 1 – 0.9649 = 0.0351 X – 68.3 0.15 69 – 68.3 (3) z0.05 = 1.645이므로 P(X ≥ x0) = P ≥ ( ) X – 68.3 0.15 x0 – 68.3 = P Z ≥ = P(Z ≥ z0.05) = 0.05 ( ) x0 – 68.3 0.15 = z0.05 = 1.645 ; x0 = 68.937 ; 69점이상
☞ ( ) ( ) ( ) 5) 두 표본평균의 차에 대한 확률분포 Xi ~ N(1, 1 ), i = 1, 2, …, n ; Yj ~ N( 2, 2 ), j = 1, 2, …, m ; 2 X = Xi ~ N( 1, 1 /n) 1 n i = 1 2 Y = Yj ~ N( 2, 2 /m) 1 m j = 1 2 X와 Y가 독립이므로 X – Y ~ N 1 - 2, ( ) 2 2 m 1 n + 1 = 2 = 2 이면, 1 ( ) X – Y ~ N 1 - 2, 2 ( )
( ) ( ) ( ) Xi ~ f1(x) ; 평균 1, 분산 1, i = 1, 2, …, n ; Yj ~ f2(x) ; 평균 2, 분산 2, j = 1, 2, …, m ; 2 임의의 확률분포인 경우 X = Xi ~ N( 1, 1 /n) 1 n i = 1 2 Y = Yj ~ N( 2, 2 /m) m j = 1 . X와 Y가 독립이므로 X – Y ~ N 1 - 2, ( ) 2 2 m 1 n + . 1 = 2 = 2 이면, 1 ( ) X – Y ~ N 1 - 2, 2 ( )
( ) ( ) 남학생 200명과 여학생 150명을 임의로 선정한 결과 남학생의 평균 몸무게가 여학생의 평균 몸무게보다 22 kg이상 더 많을 근사확률 몸무게 평균 분산 남학생 69.75 12.25 여학생 47.25 15.15 남학생의 평균 몸무게 : X 여학생의 평균 몸무게 : Y X ~ N 69.75, = N(69.75, (0.25)2 ) ( ) . 12.25 200 Y ~ N 47.25, = N(47.25, (0.318)2 ) 15.15 150 X – Y ~ N(22.5, (0.405)2 ) . P(X ≥ Y +22) = P(X - Y ≥ 22) =P ≥ ( ) = P(Z ≥ -1.23) = P(Z ≤ 1.23) = 0.8907 . X – Y -22.5 0.4056 22 -22.5
3 정규모집단에 관련된 분포의 응용 표본분산과 합동표본분산에 관련된 분포, 표본표준편차에 관련된 분포 그리고 두 표본분산의 비(ratio)에 관한 분포 등에 대하여 알아본다.
☞ ( ) ( ) 1) 표본분산에 대한 확률분포 Zi ~ 2(n) , i = 1, 2, …, n X ~ N( , 2/n) Z2 ~ 2(1) Zi ~ 2(n) , i = 1, 2, …, n i=1 n 2 Z = X - ~ N(0, 1) Zi ~ i.i.d N(0, 1), i = 1, 2, …, n Zi = (Xi – )2 = [(Xi – X) + (X – )]2 i=1 n 2 1 2 1 2 n = (Xi – X)2 + (X – )2 i=1 = (Xi – X)2 + i=1 n n-1 2 1 • X – ( ) 2 X – m n ( ) 2 n-1 2 = S2 +
( ) Zi ~ 2(n) X – n ~ 2(1) n-1 2 S2 ~ 2(n-1) : 독립 n-1 2 ( ) 2 ~ 2(1) n-1 2 S2 ~ 2(n-1) : 독립 Zi ~ 2(n) i=1 n 2 n-1 2 S2 = n-1 E E(S2) = 2 카이제곱분포의 기대값 : n-1 2 S2 V = 모분산을 추정이나 검정하기 위한 통계량 :
정규모집단 N(, 25)에서 추출된 크기 5인 확률표본 [104, 110, 100, 98, 106] (1) 카이제곱분포의 자유도를 구하고, 관찰된 통계량의 값 (2) S2이 (1)에서 구한 통계량의 값보다 클 근사확률 (1) 확률표본의 크기가 5이므로 카이제곱분포의 자유도는 4 104 + 110 + 100 + 98 + 106 5 표본평균 : x = = 103.6 s2 = (xi – 103.6)2 = =22.8 i=1 5 1 4 91.2 표본분산 : 모분산이 25이므로 n-1 2 S2 V = 4•(22.8) 25 = = 3.648 관찰된 통계량의 값 : (2) d.f.=4에 대하여 P(V > 3.36) = 0.5, P(V > 5.39) = 0.25 P(V > 3.648) ≒ 0.404
☞ 2) 표본표준편차에 관련된 확률분포 Xi ~ N(, 2) , i = 1, 2, …, n n-1 2 S2 ~ 2(n-1) X - ~ N(0, 1) , n t- 분포의 정의에 의하여 X - n 2 n -1 S2 ~ t(n-1) s =
예제 1에서 표본표준편차를 구하고, P(|X – | < t0) = 0.99인 t0을 구하고, s2 = 22.8, s = 22.8 = 4.775 , X - ~ t(4) n s 이므로 x = 103.6 이고 X - n s 5 4.775 = 1.135 P(|T| < t0.005) = 0.99 ; t0.005 = 4.604 한편, 구하고자 하는 t0 와 의 범위 : t0 = t0.005 • (1.135) = 4.604 • (1.135) = 5.226 |x – | < 5.226 ; |103.6 – | < 5.226 ; 98.374 < < 108.828
☞ 3) 두 표본분산의 비(ratio)에 관련된 확률분포 S2 = (Xi – X )2 1 n-1 S2 = (Yj – Y )2 j = 1 m 2 m-1 독립 n-1 2 S2 ~ 2(n-1) , 1 m-1 S2 ~ 2(m-1) 2 S1 / 1 S2 / 2 2 (n-1) (m-1) = ~ F(n-1, m-1)
추출된 남학생과 여학생의 폐활량의 분산의 비가 x0이상일 확률이 0.05일 때, x0 = ? 남학생의 폐활량 ~ N(1, 1.2) 여학생의 폐활량 ~ N(2, 1.0) 남•여학생 각각 16명과 20명씩 임의로 추출할 경우, 추출된 남학생과 여학생의 폐활량의 분산의 비가 x0이상일 확률이 0.05일 때, x0 = ? 2 2 추출된 남학생의 표본분산 : S1 추출된 남학생의 표본분산 : S2 S1 / 1.2 S2 / 1.0 2 ~ F(15, 19) S1 / 1.2 S2 / 1.0 2 0.05 = P S1 / S2 1.2 > 2.23 = P(S1 / S2 > 2.676) = P x0 = 2.676
☞ [ ] 4) 동일한 모분산을 갖는 두 모집단에 대한 합동표본분산 Xi ~ N(1, 2) , i = 1, 2, …, n Yj ~ N(2, 2) , j =1, 2, …, m S2 = (Xi – X )2 1 n-1 i = 1 n S2 = (Yj – Y )2 j = 1 m 2 m-1 독립 n-1 2 S2 ~ 2(n-1) , 1 m-1 S2 ~ 2(m-1) 2 합동표본분산(pooled sample variance) : S2 = (Xi – X )2 + (Yj – Y )2 i = 1 n j = 1 m 1 n+m-2 [ ] p
합동표본분산의 확률분포 S2 = (Xi – X )2 + (Yj – Y )2 n+m-2 2 1 = (Xi – X)2 p n+m-2 2 1 = (Xi – X)2 i=1 n-1 • + (Yj – Y)2 m-1 j=1 S2 + S2 2 = 2(n+m-2) ⊙ 합동표본분산의 다른 표현 방법 : Sp = [(n-1)S1 + (m-1)S2] 2 1 n+m-2
독립인 두 정규모집단 N(2, 25)와 N(5, 25)에서 각각 크기 5인 확률표본을 추출 P(Sp > 20.09) = ? 2 V = 8Sp / 25 ~ 2(8) 2 이므로 P(Sp > 20.09) = P 2 8Sp 25 8•(20.29) > ( ) = P(V > 6.4288) = 0.01
☞ ( ) ( ) 5) 합동표본표준편차에 관련된 확률분포 (미지의 모분산) X = Xi ~ N(1, /n) 1 n 2 Y = Yj ~ N(2, /m) 1 m j = 1 2 1 n m + ( ) X – Y ~ N 1 - 2, 2 ( ) X - Y - (1 – 2) (1/n) + (1/m) 2 n +m -2 S2 n + m -2 p = Sp ~ t(n + m – 2)
예전 방식과 새로운 방법에 의한 수명에 대한 예비실험 : 평균수명이 동일하다 타이어 공정 방법 예전 방식과 새로운 방법에 의한 수명에 대한 예비실험 : 평균수명이 동일하다 새로운 방법에 의하여 생산된 타이어가 예전 방식에 의하여 생산된 타이어에 비하여 평균수명이 1,518㎞이상 더 클 확률 (단위 : 1,000㎞) 새로운 방법에 의한 평균 수명 : X예전 방식에 의한 평균 수명 : Y 새로운 방법 예전 방법 65.4 60.4 59.2 57.7 63.6 62.5 60.6 58.1 61.5 62.4 56.2 62.6 63.7 62.0 61.1 x = 62.58 , y = 58.84 s1 = (xi – 62.58)2 = 2.30 s2 = (yj – 58.84)2 = 3.76 2 1 8 6 sp = (8• s1 + 6•s2) = 2.926 , 2 1 9 + 7 - 2 합동표본분산 : sp = 2.926 = 1.71 0.254 1 n m + 9 7 = = 0.504 1 n m + sp• = (1.71)•(0.504) = 0.862
( ) 예비실험으로부터 두 모평균이 동일하다는 결론을 얻었으므로 X – Y = 0 ~ t(14) (1/n) + (1/m) Sp = X - Y 0.862 구하고자 하는 확률 : P(X - Y ≥ 1.518) = P X - Y 0.862 1.518 ≥ ( ) = P(T ≥ 1.761) = 0.05
4 표본비율의 분포 로그정규분포, t –분포, F-분포, 이변량정규분포의 확률밀도함수와 평균, 분산을 비롯한 특성에 대하여 알아본다.
▶ ▶ 모비율(population proportion) : 모집단을 형성하고 있는 표본비율(sample proportion) : 확률표본을 이루는 원소 수에 대한 특정한 성질을 갖는 원소 수의 비율 (p) ∧ 모집단의 원소의 수 : N 표본의 원소 수 : n 모집단이나 표본 안에 어느 특정한 성질을 갖는 원소의 수 : x p = x N n ∧ 모비율 : 표본비율 :
☞ 1) 표본비율에 관련된 확률분포 1 , 표본의 i번째 성분이 특정 성질을 갖는 경우 0 , 그렇지 않은 경우 Xi = 0 , 그렇지 않은 경우 X = X1 + X2 + … + Xn 표본에서 성공의 횟수 : 표본비율 : p = X n ∧ = Xi 1 i=1
E(X) = np, Var(X) = np(1-p) 4•3절로부터 Xi ~ B(1, p), i = 1, 2, …, n E(Xi) = p, Var(Xi) = p(1-p) X ~ B (n, p) E(X) = np, Var(X) = np(1-p) 표본비율의 평균 : E(p) = E(X/n) = p 표본비율의 분산 : Var(p) = Var(X/n) = ∧ p(1-p) n ∧ 표본의 크기 n이 충분히 크다면, np > 5, n(1-p) > 5이면 중심극한정리에 의하여 특정한 성질을 갖는 성분의 수의 확률분포 : 표본비율의 확률분포 : X ~ N(np, np(1-p)) . p ~ N p, p(1-p) n ∧ ( )
지난 선거에서 A 후보자에 대한 지지도는 45.5%이었다. 이번에 보궐선거 실시 지지할 확률 (2) A 후보자에 대한 보궐선거 지지율이 45%와 46% 사이일 확률 2 2 (1) A 후보자를 지지하는 유권자의 수 : X n = 200, p = 0.455 np = 91, np(1-p) = 49.595 연속성수정에 의한 정규근사를 위하여 X ≈ N(91, 49.595) P(X ≥ 100) = P 49.595 X - 91 99.5 - 91 ≥ = P(Z ≥ 1.21) = 1 – 0.8869 = 0.1131 .
(2) 200명의 유권자에 대한 A 후보자의 지지율 : p p ~ N 0.455, = N(0.455, (0.035)2) ∧ ∧ p ~ N 0.455, = N(0.455, (0.035)2) (0.455)•(0.545) 200 . ∧ P(0.45 ≤ p ≤ 0.46) = P 0.45 – 0.455 0.035 p – 0.455 0.46 – 0.455 ≤ = P(-0.14 ≤ Z ≤ 0.14) = 2((0.14) – 0.5) = 2(0.5557 -0.5) = 0.1114 .