표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.

Slides:



Advertisements
Similar presentations
Statistics 상지대학교 1 / 22 추정 개요 점추정과 구간추정 표본크기 두 모집단의 비교.
Advertisements

6σ 관련 기초 통계 (1) -. 통계적사고 -. 모집단과 표본. 통계적 사고 모든 작업은 상호연관된 프로세스의 시스템 예 ) 열처리 작업 공정 원료 투입 공정가열 공정 냉각 공정 모든 프로세스에는 산포가 존재 가피원인 불가피원인 동일 원료동일 생산공정 동일 작업자동일.
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
Ⅱ 세포의 주기와 생명의 연속성 Ⅱ 세포의 주기와 생명의 연속성 - 1. 세포주기와 세포분열.
제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
이항분포와 정규분포 이항분포 정규분포.
재료수치해석 HW # 박재혁.
표본분포.
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
6σ를 위한 알기 쉬운 기초통계 Histogram 이항분포의 정규 근사 정규분포(n ≥30) t (5) :자유도 5인 t 분포
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
고장률 failure rate 어떤 시점까지 동작하여 온 품목이 계속되는 단위기간내에 고장을 일으키는 비율(횟수). 고장률은 확률이 아니며 따라서 1 보다 커도 상관없다. 고장이 발생하기 쉬운 정도를 표시하는 척도. 일반으로 고장률은 순간고장률과 평균고장률을 사용하고 있지만.
표본 이론.
수치해석 6장 예제문제 환경공학과 천대길.
제9장 샘플링과 오차 표본: 시료, Sample 모집단 : 공정, Lot Sampling
제12주 회귀분석 Regression Analysis
결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값.
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
제 3장. 수치를 통한 연속형 자료의 요약.
가설검정 9 1 가설검정 2 모평균의 검정 3 모비율의 검정 4 c2-검정과 모분산의 검정.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
Multimedia Programming 10: Point Processing 5
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다.
연 속 확 률 분 포 5 균등분포 지수분포 감마분포 웨이블분포 베타분포 정규분포 정규분포에 관련된 연속분포들
확률통계론 2장 : 확률변수.
Chapter 11 위험과 수익률, 기회자본비용의 개요.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
제9 강 표준정규분포 학습목표: 표준정규분포의 이해 학습내용: 표준정규분포의 계산방법과 실습 지난강의
제4장 제어 시스템의 성능.
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
수학10-가 Ⅳ. 통 계 백암고등학교 수학교사 : 양상옥.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
Keller: Stats for Mgmt & Econ, 7th Ed
Keller: Stats for Mgmt & Econ, 7th Ed
(independent variable)
학습 주제 p 일률 측정하기.
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
T-test.
연 속 확 률 분 포 5 1 균등분포 2 지수분포 3 감마분포 4 정규분포.
밀도 (1) 부피가 같아도 질량은 달라요 ! 밀도의 측정 밀도의 특징.
두 모집단에 대한 검정.
고급행정통계 –표본분포, 통계적 추정 한 모집단
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
제3장 함수와 배열수식 전진환
감마분포 gamma distribution
Sampling Distributions
Intelligent Systems and Control Lab. Dept. of EE, Yeungnam Univ.
기초 통계학 지도위원 이광희.
통계해석 및 오차의 제거.
Chapter 3: 확률변수와 분포함수 Pilsung Kang
쉽게 배우는 알고리즘 2장. 점화식과 점근적 복잡도 분석
척도의 속성 - 목 차- 자료수집과정 척도의 속성 -명목척도 -서열척도 -등간척도 -비율척도 -리커트척도 3.Data(자료)
결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값.
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
추리통계학의 기본개념.
제 16장 비율의 정확성 머리말 신뢰구간 신뢰구간의 해석.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
문제의 답안 잘 생각해 보시기 바랍니다..
Survey Sampling Sangji University.
Presentation transcript:

표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포

1 모집단분포와 표본분포 모집단 분포와 확률표본의 의미, 표본분포와 통계량에 대하여 알아본다.

▶ ▶ 모집단 분포(population distribution) : 어떤 통계적 실험의 대상이 되는 모든 대상물인 모집단의 정보로부터 얻어지는 확률 분포 ▶ 모수(parameter) : 모집단의 특성을 나타내는 수치 모평균, 모분산, 모표준편차, 모비율, 모상관관계 대부분의 모집단 분포는 완전하게 알려진 것이 없으며, 따라서 모집단 분포의 정확한 중심의 위치나 산포도 등을 알 수 없다. 모집단의 확률분포를 비롯한 특성을 알기 위하여 전수조사를 한다는 것은 경제적, 공간적 또는 시간적인 제약에 의하여 거의 불가능 표본을 선정

? 어느 배터리 제조회사에서 특별한 모델의 cell phone에 사용될 새로운 배터리를 생산하고자 한다면, 임의 추출 정보수집 추 론 어느 배터리 제조회사에서 특별한 모델의 cell phone에 사용될 새로운 배터리를 생산하고자 한다면, 이 회사에서 생산될 배터리의 수명이 어떠한 확률분포에 따르는지 알 수 없다. 따라서 몇 개의 배터리를 표본으로 추출하여 실제로 cell phone에 사용하여 얻은 배터리 수명에 대한 측정값을 구한다. 그러면 이러한 측정값들(표본)은 이 회사에서 생산될 배터리들의 확률분포(모집단 분포)로부터 추출된 표본을 구성하게 된다. 이때 앞으로 생산될 배터리의 수명은 갖는 알려지지 않은 확률분포 f(x)에 따른다.

▶ ▶ 확률표본(random sample) : 모집단을 형성하고 있는 모든 대상들이 선정될 가능성을 동등하게 부여하고, 객관적이고 임의적으로 각 대상을 선정한 표본 ▶ 통계량(statistics) : 표본으로 산출된 통계적인 양 표본평균, 표본분산, 표본표준편차, 표본비율, 표본상관관계 통계량은 표본을 어떻게 선정하느냐에 따라서 그 값이 다르게 나타난다. 즉, 동일한 모집단에서 동일한 크기의 표본을 선정하더라도 각 표본의 평균은 서로 다르게 나타남. 통계량은 확률변수 통계량의 확률분포를 표본분포라 한다.

x2 : 두 번째 추출된 관찰값 X2 ∼ f(x) E(Xi) = m … Var(Xi) = s2 모집단 x1 x2 x8 x9 xn x3 x7 x4 x5 x6 x10 표 본 … x1 : 첫 번째 추출된 관찰값 X1 ∼ f(x) x2 : 두 번째 추출된 관찰값 X2 ∼ f(x) E(Xi) = m … Var(Xi) = s2 xn : n 번째 추출된 관찰값 Xn ∼ f(x) 표본평균 : 표본분산 : X = S Xi S2 = S (Xi – X )2 1 n n-1 i = 1 관찰된 표본평균 : 관찰된 표본분산 : x = S xi s2 = S (xi – x )2

예 생산된 10개의 배터리를 표본으로 추출하여 얻은 측정값 835  637  764  830  768  840  790  835  840  910 표본평균과 표본분산의 관찰값 = ? 예 관찰된 표본평균 : 관찰된 표본분산 : x = S xi = 804.9 s2 = S (xi – 804.9 )2 = 5488.77 1 9 i = 1 10 f(x) : 미지의 모집단 분포 m : 모평균 s2 : 모분산 전체 배터리 수명 764 835 637 768 830 840 790 910 표 본

2 표본평균의 분포 표본평균의 평균과 모평균, 표본평균의 분산과 모분산의 관계 그리고 중심극한정리에 의한 표본평균의 분포의 변화, 두 독립인 표본평균의 차에 대한 분포 등에 대하여 알아본다.

☞ 1) 표본평균과 모평균(비복원 추출) x1과 x2 그리고 x가 취할 수 있는 모든 경우 80 63 76 77 84 79 87.5 91 84 77.0 63 71.5 80 85.5 73.5 71.0 79 82.0 85.0 70.0 77 81.5 63.0 79.5 69.5 76 83.5 84.0 80.0 78.0 77.5 80.5 76.5 78.5 x x2 x1  x1  x1과 x2 그리고 x가 취할 수 있는 모든 경우 80 63 76 77 84 79 91 2개 x1 x2 표본평균 : X = x1 + x2 2

X 의 확률분포와 확률히스토그램 x x X의 평균 : E(X) = 77.7 X의 평균 : Var(X) = 31.3 63.0      x 63.0 69.5 70.0 71.0 71.5 73.5 76.5 77.0 77.5 78.0 78.5 확률 0.0222 0.0444 0.0444 0.0444 0.0889 0.0889 0.0222 0.0444 0.0222 0.0667 0.0444      x 79.5 80.0 80.5 81.5 82.0 83.5 84.0 85.0 85.5 87.5 계  확률 0.0444 0.0667 0.0444 0.0444 0.0889 0.0222 0.0444 0.0222 0.0444 0.0444  1.00 X의 평균 : E(X) = 77.7 X의 평균 : Var(X) = 31.3

x 63 76 77 79 80 84 91 확률 0.2 0.1 모집단의 확률분포 모평균 : m = E(X) = 77.7 모분산 : s2 = Var (X) = 70.41 s2 n N - n N - 1 • 70.41 2 10 - 2 10 - 1 = = 31.3 = Var(X) 표본평균의 평균과 모평균은 동일하다. s2 n N - n N - 1 • 표본평균의 분산 =

☞ 2) 표본평균과 모평균(복원 추출) x1과 x2 그리고 x가 취할 수 있는 모든 경우 80 63 76 77 84 79 91 2개 x1 x2 0.01 0.02 91.0 87.5 85.5 85.0 84.0 83.5 77.0 91 0.04 82.0 81.5 80.5 80.0 73.5 84 79.5 78.5 78.0 71.5 80 79.0 77.5 71.0 79 76.5 70.0 77 76.0 69.5 76 63.0 63    x1       x2     표본평균 : x1 + x2 2 X = x x 의 확률

X 의 확률분포와 확률히스토그램 x X의 평균 : E(X) = 77.7 X의 분산 : Var(X) = 35.21 2 70.41 0.01 0.04 0.02 0.06 0.08 확률 91.0 87.5 85.5 85.0 84.0 83.5 82.0 81.5 80.5 80.0 79.5 79.0      0.05 78.5 78.0 77.5 77.0 76.5 76.0 73.5 71.5 71.0 70.0 69.5 63.0 x X의 평균 : E(X) = 77.7 X의 분산 : Var(X) = 35.21 2 70.41 = 35.21 s2 = 모분산 : s2 = Var (X) = 70.41 표본평균의 평균과 모평균은 동일하다. s2 n 표본평균의 분산 =

☞ 3) 표본평균과 모평균의 비교 ⊙ 모평균 m와 모분산 s2을 갖는 크기 N인 모집단으로부터 크기 n인 확률표본을 추출할 경우 m = E(X) 복원추출인 경우 X 비복원추출인 경우 s2 m 모집단 분 산 평 균 구 분 n N - n N - 1 • ※ N이 충분히 크면 비복원 추출과 복원 추출이 동일한 결과를 나타낸다. 특별한 언급이 없는 한 복원 추출인 경우를 다룬다.

☞ 4) 중심극한정리에 의한 표본평균의 변화 주사위 2번 던지기 게임 (n=2인 경우) 표본평균 : X = x1 + x2 2 의 확률분포 ? X1과 X2의 결합분포 1 1/6  fX (x)   1/36 6 5 4 3 2  fX (x)   x1 x2 X1과 X2가 취하는 값 : 1, 2, 3, 4, 5, 6 2 P(X1 = x, X2 = y) = P(X1 = x)• P(X2 = y) (x1, x2)의 취하는 값 : (1, 1), (1, 2), …, (6, 6) x = x1 + x2 2 가 취하는 값 : 1, 1.5, 2, 2.5 3, 3.5 4, 4.5 5, 5.5, 6 1

표본평균 X 의 확률분포 : X E(X) = SxP(X=x) = 3.5 E(X2) = Sx2 P(X=x) = 13.7083 0.028 0.056 0.083 0.111 0.139 0.166 확률 6 5.5 5 4.5 4 3.5 3 2.5 2 1.5 1         X E(X) = SxP(X=x) = 3.5 E(X2) = Sx2 P(X=x) = 13.7083 Var(X) = E(X2) – E(X)2 = 1.4583 모평균 : m = (1+6)/2 = 3.5 모분산 : s2 = (62 -1)/12 = 2.9167 표본 평균 모집단 m = E(X) = 1.5, s2 = 2Var(X) = 2.9167

주사위 3번 던지기 게임 (n=3인 경우) x1 + x2+ x3 표본평균 : X = 의 확률분포 ? 3 0.005 0.014 0.028 0.046 0.069 0.097 0.116 0.125 확률 6.00 5.67 5.33 5.00 4.67 4.33 4.00 3.67         3.33 3.00 2.67 2.33 2.00 1.67 1.33 1.00 X m = E(X) = 1.5, s2 = 3Var(X) = 2.9167

주사위 4번 던지기 게임 (n=4인 경우) x1 + x2+ x3+ x4 표본평균 : X = 의 확률분포 ? 4 X 0.001 0.003 0.008 0.015 0.027 0.043 0.062 0.080 0.097 0.108 확률 6.00 5.75 5.50 5.25 5.00 4.75 4.50 4.25 4.00 3.75 0.113 3.50 3.25 3.00 2.75 2.50 2.25 2.00 1.75 1.50 1.25 1.00         X 주사위 5번 던지기 게임 (n=5인 경우) 표본평균 : 의 확률분포 ? X = x1 + x2+ x3+ x4 + x5 5 0.0001 0.0006 0.0019 0.0045 0.0090 0.0162 0.0264 0.039 0.0541 0.0693 0.0838 0.0945 0.1002 확률 6.0 5.8 5.6 5.4 5.2 5.0 4.8 4.6 4.4 4.2 4.0 3.8 3.6 0.0398 3.4 3.2 3.0 2.8 2.6 2.4 2.2 2.0 1.8 1.6 1.4 1.2 1.0 X

● 모집단분포와 크기에 따른 표본평균의 분포 비교 n이 커질수록 표본평균의 분포는 종모양에 가까워진다.

( ) ( ) f(x) : 미지의 모집단 분포 m : 모평균, s2 : 모분산 Xi ~ i.i.d. f(x) , i = 1, 2, 3, …, n E(Xi) = m, Var(Xi) = s2 크기 n인 표본 E(Xi) = m, Var(Xi) = s2 , i = 1, 2, 3, …, N 복원추출 1 n i=1 X = S Xi의 평균과 분산 : E(X) = E S Xi = S E(Xi) = S m = (nm) = m 1 n ( ) i=1 Var(X) = Var S Xi = S Var(Xi) = S s2 = (ns2) = s2 n2 S.D(X) = Var(X) = s ( ) s2 n ※중심극한정리에 의하여 미지의 모집단 분포 f(x)에 대하여 X ~ N m, .

모집단 분포가 다음과 같은 모집단으로부터 비복원추출에 의하여 크기 2인 확률표본 X1, X2에 대한 표본평균의 확률분포와 평균 그리고 분산 x 1 2 3 4 f(x) 0.25 모집단 {1,2,3,4}에서 비복원추출에 의하여 크기 2인 확률표본을 뽑을 수 있는 모든 경우 : {1, 2}, {1, 3}, {1, 4}, {2, 1}, {2, 3}, {2, 4}, {3, 1}, {3, 2}, {3, 4}, {4, 1}, {4, 2}, {4, 3} X가 취할 수 있는 값들의 집합 : {1.5, 2, 2.5, 3, 3.5} X = 1.5 {X1 = 1, X2 = 2}, {X1 = 2, X2 = 1} X = 2 {X1 = 1, X2 = 3}, {X1 = 3, X2 = 1}, X = 2.5 {X1 = 1, X2 = 4}, {X1 = 2, X2 = 3}, {X1 = 3, X2 = 2}, {X1 = 4, X2 = 1} X = 3 {X1 = 2, X2 = 4}, {X1 = 4, X2 = 2} X = 3.5 {X1 = 3, X2 = 4}, {X1 = 4, X2 = 3}

P(X1 = i, X2 = j) = P(X1 = i)• P(X2 = j|X1 = i) 1 4 3 12 = 비복원추출에 의하여 표본을 선정 P(X1 = i, X2 = j) = P(X1 = i)• P(X2 = j|X1 = i) 1 4 3 12 • = , i, j = 1, 2, 3, 4, i ≠ j X의 확률분포 : 1/6 2/6 확률 3.5 3 2.5 2 1.5 x E(X) = 1.5 + 2 + (2.5)•2 + 3 + 3.5 6 = 2.5 E(X2 ) = 2.25 + 4 + (6.25)•2 + 9 + 12.25 = 6.67 Var(X) = E(X2 ) – E(X)2 = 0.417

( ) 예제1의 모집단분포로부터 크기 10인 표본을 임의 추출하였을 때, (1) X의 평균과 분산 모집단 분포 : x 1 2 3 4 f(x) 0.25 (1) m = 2.5, s2 = 1.25, n = 10 m = 2.5, s2 = = 0.125 X s2 10 (2) 표본평균의 근사분포 : X ~ N(2.5, 0.125) . P(2.75 ≤ X ≤ 3.5) = P ≤ X ≤ 2.75 – 2.5 0.354 3.5 – 2.5 ( ) = P(0.71 ≤ Z ≤ 2.82) = F(2.82) – F(0.71) = 0.9976 – 0.7611 = 0.2365 .

( ) 확률분포가 N(60, 4)인 모집단에서 크기 10인 표본을 임의 추출하였을 때, (1) X 의 확률분포, 평균과 분산 (1) X1, X2, …, X10 ~ i.i.d. N(60, 4) E(X) = m = 60, Var(X) = s2/10 = 0.4 X = SXi ~ N(60, 0.4) 1 10 (2) P(58.5 ≤ X ≤ 61.5) = P ≤ X ≤ ( ) = P(-2.37 ≤ Z ≤ 2.37) = 2[F(2.37) – 0.5] = 2(0.9911 – 0.5) = 0.9822 58.5 – 60 61.5 – 60 0.4 .

( ) ( ) ( ) ( ) 고교 3학년 학생 1,000명을 대상으로 수학 모의시험을 실시한 결과 평균 68.3이고 분산 1.5인 정규분포 (1) 임의로 한 명을 선정하였을 때, 이 학생이 69점 이상일 확률 (2) 10명을 임의로 선정하였을 때, 이 학생들의 평균 점수가 69점 이상일 확률 (3) 10명의 평균 점수가 상위 5% 안에 들어가기 위한 최하 점수 (1) 임의로 선정한 학생의 점수 : X ∼ N(68.3, 1.5) P(X ≥ 69) = P ≥ ( ) = P(Z ≥ 0.57) = 1 - F(0.57) = 1 – 0.7157 = 0.2843 X – 68.3 1.5 69 – 68.3 (2) 10명의 평균점수 : X ~ N(68.3, 0.15) P(X ≥ 69) = P ≥ ( ) = P(Z ≥ 1.81) = 1 - F(1.81) = 1 – 0.9649 = 0.0351 X – 68.3 0.15 69 – 68.3 (3) z0.05 = 1.645이므로 P(X ≥ x0) = P ≥ ( ) X – 68.3 0.15 x0 – 68.3 = P Z ≥ = P(Z ≥ z0.05) = 0.05 ( ) x0 – 68.3 0.15 = z0.05 = 1.645 ; x0 = 68.937 ; 69점이상

☞ ( ) ( ) ( ) 5) 두 표본평균의 차에 대한 확률분포 Xi ~ N(m1, s1 ), i = 1, 2, …, n ; Yj ~ N(m2, s2 ), j = 1, 2, …, m ; 2 X = S Xi ~ N(m1, s1 /n) 1 n i = 1 2 Y = S Yj ~ N(m2, s2 /m) 1 m j = 1 2 X와 Y가 독립이므로 X – Y ~ N m1 - m2, ( ) s2 2 m s1 n + s1 = s2 = s2 이면, 1 ( ) X – Y ~ N m1 - m2, s2 ( )

( ) ( ) ( ) Xi ~ f1(x) ; 평균 m1, 분산 s1, i = 1, 2, …, n ; Yj ~ f2(x) ; 평균 m2, 분산 s2, j = 1, 2, …, m ; 2 임의의 확률분포인 경우 X = S Xi ~ N(m1, s1 /n) 1 n i = 1 2 Y = S Yj ~ N(m2, s2 /m) m j = 1 . X와 Y가 독립이므로 X – Y ~ N m1 - m2, ( ) s2 2 m s1 n + . s1 = s2 = s2 이면, 1 ( ) X – Y ~ N m1 - m2, s2 ( )

( ) ( ) ( ) 남학생 200명과 여학생 150명을 임의로 선정한 결과 남학생의 평균 몸무게가 여학생의 평균 몸무게보다 22 kg이상 더 많을 근사확률 몸무게 평균 분산 남학생 69.75 12.25 여학생 47.25 15.15 남학생의 평균 몸무게 : X 여학생의 평균 몸무게 : Y ( ) 12.25 200 X ~ N 69.75, = N(69.75, (0.25)2 ) . X – Y ~ N(22.5, (0.405)2 ) . ( ) 15.15 150 Y ~ N 47.25, = N(47.25, (0.318)2 ) . P(X ≥ Y +22) = P(X - Y ≥ 22) =P ≥ ( ) = P(Z ≥ -1.23) = P(Z ≤ 1.23) = 0.8907 . X – Y -22.5 0.4056 22 -22.5

3 정규모집단에 관련된 분포의 응용 표본분산과 합동표본분산에 관련된 분포, 표본표준편차에 관련된 분포 그리고 두 표본분산의 비(ratio)에 관한 분포 등에 대하여 알아본다.

☞ ( ) 1) 표본분산에 대한 확률분포 SZi ~ c2(n) , i = 1, 2, …, n X ~ N( m, s2/n) Z2 ~ c2(1) SZi ~ c2(n) , i = 1, 2, …, n i=1 n 2 Z = X - m ~ N(0, 1) s , Zi ~ i.i.d N(0, 1), i = 1, 2, …, n SZi = S (Xi – m)2 = S [(Xi – X) + (X – m)]2 i=1 n 2 1 s2 = S(Xi – X)2 + (X – m)2 = S(Xi – X)2 + n-1 • X – m s ( ) = S2 +

( ) SZi ~ c2(n) X – m n s ~ c2(1) : 독립 n-1 s2 S2 ~ c2(n-1) n-1 s2 ( ) 2 ~ c2(1) SZi ~ c2(n) i=1 : 독립 n-1 s2 S2 ~ c2(n-1) n-1 s2 S2 = n-1 E E(S2) = s2 카이제곱분포의 기대값 : n-1 s2 S2 V = 모분산을 추정하기 위한 통계량 :

정규모집단 N(m, 25)에서 추출된 크기 5인 확률표본 [104, 110, 100, 98, 106] (1) 카이제곱분포의 자유도를 구하고, 관찰된 통계량의 값 (2) S2이 (1)에서 구한 통계량의 값보다 클 근사확률 (1) 확률표본의 크기가 5이므로 카이제곱분포의 자유도는 4 104 + 110 + 100 + 98 + 106 5 표본평균 : x = = 103.6 s2 = S(xi – 103.6)2 = =22.8 i=1 5 1 4 91.2 표본분산 : 모분산이 25이므로 n-1 s2 S2 V = 4•(22.8) 25 = = 3.648 관찰된 통계량의 값 : (2) d.f. = 4에 대하여 P(V > 3.36) = 0.5, P(V > 5.39) = 0.25 P(V > 3.648) ≒ 0.404

☞ [ ] 2) 동일한 모분산을 갖는 두 모집단에 대한 합동표본분산 Xi ~ N(m1, s2) , i = 1, 2, …, n Yj ~ N(m2, s2) , j =1, 2, …, m S2 = S (Xi – X )2 1 n-1 i = 1 n S2 = S (Yj – Y )2 j = 1 m 2 m-1 독립 n-1 s2 S2 ~ c2(n-1) , 1 m-1 S2 ~ c2(m-1) 2 합동표본분산(pooled sample variance) : S2 = S (Xi – X )2 + S (Yj – Y )2 i = 1 n j = 1 m 1 n+m-2 [ ] p

합동표본분산의 확률분포 S2 = S (Xi – X )2 + S (Yj – Y )2 n+m-2 s2 1 = S (Xi – X)2 p n+m-2 s2 1 = S (Xi – X)2 i=1 n-1 • + S (Yj – Y)2 m-1 j=1 S2 + S2 2 = ~ c2(n+m-1) ⊙ 합동표본분산의 다른 표현 방법 : 1 n+m-2 Sp = [(n-1)S1 + (m-1)S2] 2 2 2

독립인 두 정규모집단 N(2, 25)와 N(5, 25)에서 각각 크기 5인 확률표본을 추출 P(Sp > 20.09) = ? 2 V = 8Sp / 25 ~ c2(8) 2 이므로 P(Sp > 20.09) = P 2 8Sp 25 8•(20.29) > ( ) = P(V > 6.4288) = 0.01

☞ 3) 표본표준편차에 관련된 확률분포 Xi ~ N(m, s2) , i = 1, 2, …, n n-1 s2 S2 ~ c2(n-1) X - m ~ N(0, 1) , n s t- 분포의 정의에 의하여 X - m n s s2 n -1 S2 ~ t(n-1) =

예제 1에서 표본표준편차를 구하고, P(|X – m| < t0) = 0.99인 t0을 구하고, s2 = 22.8, s = 22.8 = 4.775 , X - m ~ t(4) n s 이므로 x = 103.6 이고 X - m n s 5 4.775 = 1.135 P(|T| < t0.005) = 0.99 ; t0.005 = 4.604 한편, 구하고자 하는 t0 와 m의 범위 : t0 = t0.005 • (1.135) = 4.604 • (1.135) = 5.226 |x – m| < 5.226 ; |103.6 – m| < 5.226 ; 98.374 < m < 108.828

☞ ( ) ( ) 4) 합동표본표준편차에 관련된 확률분포 X = S Xi ~ N(m1, s1 /n) 1 n 2 Y = S Yj ~ N(m2, s2 /m) 1 m j = 1 2 1 n m + ( ) X – Y ~ N m1 - m2, s2 ( ) X - Y - (m1 – m2) (1/n) + (1/m) s s2 n +m -2 S2 n + m -2 p = Sp ~ t(n + m – 2)

예전 방식과 새로운 방법에 의한 수명에 대한 예비실험 : 평균수명이 동일하다 타이어 공정 방법 예전 방식과 새로운 방법에 의한 수명에 대한 예비실험 : 평균수명이 동일하다 새로운 방법에 의하여 생산된 타이어가 예전 방식에 의하여 생산된 타이어에 비하여 평균수명이 1,518㎞이상 더 클 확률  (단위 : 1,000㎞) 새로운 방법에 의한 평균 수명 : X예전 방식에 의한 평균 수명 : Y 새로운 방법 예전 방법 65.4 60.4 59.2 57.7 63.6 62.5 60.6 58.1 61.5 62.4 56.2   62.6 63.7 62.0 61.1 x = 62.58 , y = 58.84 s1 = S(xi – 62.58)2 = 2.30 s2 = S(yj – 58.84)2 = 3.76 2 1 8 6 sp = (8• s1 + 6•s2) = 2.926 , 2 1 9 + 7 - 2 합동표본분산 : sp = 2.926 = 1.71 0.254 1 n m + 9 7 = = 0.504 1 n m + sp• = (1.71)•(0.504) = 0.862

( ) 예비실험으로부터 두 모평균이 동일하다는 결론을 얻었으므로 mX – mY = 0 ~ t(14) X - Y - (m1 – m2) (1/n) + (1/m) Sp = X - Y 0.862 구하고자 하는 확률 : P(X - Y ≥ 1.518) = P X - Y 0.862 1.518 ≥ ( ) = P(T ≥ 1.761) = 0.05

☞ 5) 두 표본분산의 비(ratio)에 관련된 확률분포 S2 = S (Xi – X )2 1 n-1 S2 = S (Yj – Y )2 j = 1 m 2 m-1 독립 n-1 s2 S2 ~ c2(n-1) , 1 m-1 S2 ~ c2(m-1) 2 S1 / s1 S2 / s2 2 (n-1) (m-1) = ~ F(n-1, m-1)

추출된 남학생과 여학생의 폐활량의 분산의 비가 x0이상일 확률이 0.05일 때, x0 = ? 남학생의 폐활량 ~ N(m1, 1.2) 여학생의 폐활량 ~ N(m2, 1.0) 남•여학생 각각 16명과 20명씩 임의로 추출할 경우, 추출된 남학생과 여학생의 폐활량의 분산의 비가 x0이상일 확률이 0.05일 때, x0 = ? 2 2 추출된 남학생의 표본분산 : S1 추출된 남학생의 표본분산 : S2 S1 / 1.2 S2 / 1.0 2 ~ F(15, 19) S1 / 1.2 S2 / 1.0 2 0.05 = P S1 / S2 1.2 > 2.23 = P(S1 / S2 > 2.676) = P x0 = 2.676

4 표본비율의 분포 로그정규분포, t –분포, F-분포, 이변량정규분포의 확률밀도함수와 평균, 분산을 비롯한 특성에 대하여 알아본다.

▶ ▶ 모비율(population proportion) : 모집단을 형성하고 있는 표본비율(sample proportion) : 확률표본을 이루는 원소 수에 대한 특정한 성질을 갖는 원소 수의 비율 (p) ∧ 모집단의 원소의 수 : N 표본의 원소 수 : n 모집단이나 표본 안에 어느 특정한 성질을 갖는 원소의 수 : x p = x N n ∧ 모비율 : 표본비율 :

☞ 1) 표본비율에 관련된 확률분포 1 , 표본의 i번째 성분이 특정 성질을 갖는 경우 0 , 그렇지 않은 경우 Xi = 0 , 그렇지 않은 경우 X = X1 + X2 + … + Xn 표본에서 성공의 횟수 : 표본비율 : p = X n ∧ = S Xi 1 i=1

E(X) = np, Var(X) = np(1-p) 4•3절로부터 Xi ~ B(1, p), i = 1, 2, …, n E(Xi) = p, Var(Xi) = p(1-p) X ~ B (n, p) E(X) = np, Var(X) = np(1-p) 표본비율의 평균 : E(p) = E(X/n) = p 표본비율의 분산 : Var(p) = Var(X/n) = ∧ p(1-p) n ∧ 표본의 크기 n이 충분히 크다면, np > 5, n(1-p) > 5이면 중심극한정리에 의하여 특정한 성질을 갖는 성분의 수의 확률분포 : 표본비율의 확률분포 : X ~ N(np, np(1-p)) . p ~ N p, p(1-p) n ∧ ( )

지난 선거에서 A 후보자에 대한 지지도는 45.5%이었다. 이번에 보궐선거 실시 지지할 확률 (2) A 후보자에 대한 보궐선거 지지율이 45%와 46% 사이일 확률 (1) A 후보자를 지지하는 유권자의 수 : X n = 200, p = 0.455 np = 91, np(1-p) = 49.595 연속성수정에 의한 정규근사를 위하여 X ≈ N(91, 49.595) P(X ≥ 100) = P 49.595 X - 91 99.5 - 91 ≥ = P(Z ≥ 1.21) = 1 – 0.8869 = 0.1131 .

(2) 200명의 유권자에 대한 A 후보자의 지지율 : p p ~ N 0.455, = N(0.455, (0.035)2) ∧ ∧ p ~ N 0.455, = N(0.455, (0.035)2) (0.455)•(0.545) 200 . ∧ P(0.45 ≤ p ≤ 0.46) = P 0.45 – 0.455 0.035 p – 0.455 0.46 – 0.455 ≤ = P(-0.14 ≤ Z ≤ 0.14) = 2(F(0.14) – 0.5) = 2(0.5557 -0.5) = 0.1114 .

☞ ( ) 2) 두 표본비율의 편차에 관련된 확률분포 . p1 ~ N p1, p1(1-p1) n p2 ~ N p2, ∧ ( ) p1(1-p1) n p2 ~ N p2, p2(1-p2) m p1 – p2 ~ N p1 – p2 , p1(1-p1) n p2(1-p2) m + ∧ . 표준화 p1(1-p1) n p2(1-p2) m + (p1 – p2) – (p1 – p2) ∧ ~ N(0, 1) .

대한가족계획협회에서 1998년 7월 미혼인 남자 470명과 여자 619명을 조사결과 : 남자 254명과 여자 223명이 성인전용 극장의 허용을 지지 올해 남자와 여자 각각 1,000명씩 조사할 경우, 지지율의 차가 15%이하로 줄어들 확률 남자의 지지율 : p1 =254/470=0.54 여자의 지지율 : p2 =223/619=0.36 지지율의 편차 : p1 – p2 = 0.54 – 0.36 = 0.18 남자와 여자 각각 1,000명씩 조사하므로 p1(1-p1) n p2(1-p2) m + (0.54)•(0.46) 1000 (0.36)•(0.64) = 0.022 = (p1 – p2) – 0.18 ∧ ~ N(0, 1) . 0.022 지지율의 차의 확률분포 : P(p1 – p2 ≤ 0.15) = P ∧ (p1 – p2) – 0.18 0.022 0.15 – 0.18 ≤ = P(Z ≤ -1.36) = 1 - F(1.36) = 1 – 0.9131 = 0.0869 .

제 7 장