Presentation is loading. Please wait.

Presentation is loading. Please wait.

표본분포 개요 랜덤추출법 표본분포 모양과 CLT.

Similar presentations


Presentation on theme: "표본분포 개요 랜덤추출법 표본분포 모양과 CLT."— Presentation transcript:

1 표본분포 개요 랜덤추출법 표본분포 모양과 CLT

2 표본추출과 편의 모집단을 묘사하는 특성 값 • 모집단과 표본 - 모집단(population) : 정보를 얻고자 하는 대상의 전체 집단 - 표본(sample) : 모집단의 일부로, 모집단에 대한 정보를 얻기 위해 사용 - 모집단의 평균이나 표준편차와 같은 모수(parameter)는 모집단 분포에 관한 특성을 대표하는 중요한 정보로 보통 그 실제 값은 알려있지 않음 - 표본 통계량은 표본으로부터 계산된 수치로 미지의 모수값을 추정 하기 위해 사용 - 모수는 해당 모집단에 고유한 일정한 상수인 데 반해 표본통계량은 표본을 달리 취하면 그 값이 달라짐 - (예) 신입생 IQ 검사 – P 156 • 표본분포 - 한 모집단에서 같은 크기로 뽑을 수 있는 모든 표본에서 통계량을 계산할 때 이 통계량이 이루는 확률분포 • 편 의 - 표본추출의 편의란 바로 이 자료수집과정의 실수를 의미하는 것으로, 선정편의, 응답편의, 무응답편의 등으로 분류됨 표본으로부터 계산되는 표본의 특성밗

3 - 여론조사에서는 최소한, 응답자와 무응답자가 연령, 성별, 경제, 사 회적 위치로 보아 체계적으로 어떤 차이가 있는지를 검토해야 함 • 전문기관의 표본추출법 - 대부분의 전문여론조사기관은 특정 후보에 대한 유권자 선호도 조 사시 단순 무작위 표본추출법(simple random sampling)을 사용하 지 않음 - 실제로 많은 여론조사기관은 확률표본추출 절차인 단계적 집단 표 본추출(multistage cluster sampling)을 주로 이용 - 단계적이란 말은 단순히 표본추출의 과정이 몇 단계에 걸쳐 이루어 진다는 것을 의미 - 집단이란 한 지역 내에 있는 도시들을 크기 별로 집단화한다는 것을 의미

4 표본분포와 중심극한정리 • 표본분포의 개념 크기가 3인 표본의 개수 = 이 20개의 표본에 대하여 각각의 표본평균을 계산하고 이를 막대 그래프로 표시하면, 이것이 바로 표본분포(sampling distribution) - 주어진 모집단으로부터 동일한 크기 ( )의 모든 표본을 추출하여 각 표본의 통계량( , 등)을 계산한다고 할 때, 표본분포는 이 모든 동일 크기의 표본들로부터 계산된 특정 통계량의 확률분포 직원번호 휴가일수 1 2 3 4 5 6 9

5 표본 (0,1,3) (0,1,5) (0,1,6) (0,1,9) (0,3,5) (0,3,6) (0,3,9) (0,5,6) (0,5,9) (0,6,9) 1.33 2.00 2.33 3.33 2.67 3.00 4.00 3.67 4.67 5.00 (1,3,5) (1,3,6) (1,3,9) (1,5,6) (1,5,9) (1,6,9) (3,5,6) (3,5,9) (3,6,9) (5,6,9) .033 4.33 5.33 5.67 6.00 6.67

6 어떠한 표본이 실제로 뽑히는가에 따라 달라질 수 있는 확률변수
이러한 확률변수인 표본평균분포가 “평균에 대한 표본분포” • 표본평균의 표본분포 - 표본분포의 평균= - 표본분포의 표준편차 [=표준오차(standard error)] = 표본의 크기가 커지면 커질수록 표본평균은 표본분포 및 모집단의 평균에 점점 근접하게 되며 이에 따라 표본평균의 표준오차도 감소 • 중심극한정리 - 표본의 크기에 관계없이 표본분포의 평균은 모집단 평균에 근접 - 평균값의 표준오차는 표본의 크기가 증가해 감에 따라 감소 - 중심극한정리는 모집단이 정규분포를 따르지 않는다 하여도 표본분 포는 정규분포에 가까운 형태를 취하며, 표본의 크기가 커지면 커질 수록 표본분포는 점점 더 정규분포에 가까워진다는 것을 의미 - 평균이 이고 표준편차가 인 모집단으로부터 크기가 인 표 본을 취할 때, 이 큰 값이면 표본평균의 표본분포는 평균이 이고 표준오차가 인 정규분포에 가깝다.

7

8 표본평균의 기대값 표본평균의 분산 모평균 μ안 임의의 모집단에서 크기가 n 인 랜덤표본을 뽑을 때 표본평균
에 대하여 다음이 성립한다. 예6-3)/P161 남학생 평균 신장 170cm → 50명 추출 표본평균의 분산 모분산 이고 크기가 N인 모집단에서 크기 n인 랜덤표본을 뽑을 때 표본 평균 X에 대하여 복원인 경우 : 비복원인 경우 : (예6-4) / P 163 공장의 전구수명 150시간, 100개를 추출 표본평균의 표본오차

9 [예제]A냉장은 참치통조림을 생산하는 중견기업이다
[예제]A냉장은 참치통조림을 생산하는 중견기업이다. 지난 1년간의 자료에 의하면 참치통조림의 중량은 평균이 120g, 표준편차는 3g인 것으로 나타났다. 36개의 참치통조림을 무작위로 추출하여 중량의 평균을 계산한다고 할 때 다음 물음에 답하여라. (a) 36개 참치통조림의 평균중량이 121g 이상일 확률은? (b) 36개 참치통조림의 평균중량이 119.5g 이하일 확률은? (c) 36개 참치통조림의 평균중량이 119g과 120.5g 사이일 확률은? [풀이] (a) 36개 참치통조림의 평균은 모집단평균인 120g과 같을 것이므로 표준오차 만 계산하면, 답은 정규분포를 이용하여 계산할 수 있다 표준오차 = 우선 121g을 값으로 나타내면 =(121-120)÷0.5=2이므로 구하고 자 하는 확률값은 0.5-0.4772=2.28%이다. (b) =(119.5-120)÷0.5=-1이므로 구하고자 하는 확률값은 0.5- =0.1587이다. (c) =(119-120)÷0.5=-2, =(120.5-120)÷0.5=1이므로 표본의 평균중량이 119g과 120.5g 사이일 확률은 +0.3413=81.85%이다.

10 [예제]A지역의 소방서가 화재신고를 받고 현장에 도착하기까지 걸리는 시간, 즉 반응시간이 평균 14분, 표준편차 4분인 정규분포를 따른다고 알려져 있다. 이 소방서에 접수되는 화재신고 16건을 무작위로 추출하였을 때, 이 16건의 평균반응시간이 (a) 15분 이하일 확률은 얼마인가? (b) 12.5분과 15.5분 사이일 확률은 얼마인가? [풀이] 모집단이 정규분포를 따르므로 표본의 크기( =16)가 작더라도 표본분포는 정규분포를 따른다. 표본분포의 평균과 표준오차는 각각 14분, 1분(=4/ )이다. (a) 따라서 16건의 평균반응시간이 15분 이하일 확률은 아래와 같이 계산된다 =(15-14)÷1=1에서 값이 1보다 작거나 같을 확률은 0.5+ =0.8413이다. (b) =(12.5-14)÷1=-1.5, =(15.5-14)÷1=1.5에서 16건의 평균 반응시간이 12.5분과 15.5분 사이일 확률은 값이 -1.5와 1.5 사이일 확률이다. 답은 (2)(0.4332)=0.8664이다.

11 표본분포모양과 CLT 정규모집단인 경우 비정규모집단인 경우 정규모집단은 무한 모집단이므로 성립
정규모집단은 무한 모집단이므로 성립 모집단의 분포가 정규분포 일 때 표본평균 는 정규분포 를 따른다. - 그림 6-1(P164) 참조할 것 비정규모집단인 경우 모집단의 분포가 정규분포가 아닐 때 평균의 분포는 어떻게 구할 까 ? [이론적 배경] 표본분포 n이 충분히 클 때 어떤 분포에 상관없이 평균의 표본분포는 정규분포에 근사 한다. 평균이 μ이고 분산이 인 무한 모집단에서 크기 n인 랜덤표본을 뽑을 때 n이 충분히 크면 모집단의 분포모양에 관계없이 표본평균 는 근사적으로 - 예 6-6 / P 166 참조 할 것

12 중간고사 봅시다!


Download ppt "표본분포 개요 랜덤추출법 표본분포 모양과 CLT."

Similar presentations


Ads by Google