Survey Sampling Sangji University
모집단과 표집 추리통계는 표본의 자료를 이용하여 전집에 대한 모수치를 추정하는데 있다. 표본은 모집단을 대표할 수 있어야 한다. 이를 위하여 모집단의 구성원을 골고루 뽑아야 한다. parameter , 모집단 statistics ,s 표집 sampling
추리 통계의 두 가지 통계적 모형 무선표집모형(random sampling model) 모집단으로부터 표본을 무선적으로 추출하여 여기에서 얻은 값을 이용하여 모집단을 추론하는 것을 말한다. 즉 표본이 모집단을 대표한다고 가정하는 것이다. 반드시 모집단이 존재한다. 일반적으로 사회조사나 혹은 검사의 제작과 같은 분야에서 사용되는 모형이다. 무선화 모형(randomization model) 이 모형은 표본을 무선적으로 추출하는 대신 가용한 피험자를 여러 개의 집단에 무선적으로 배치하는 것을 말한다. 이러한 절차를 통하여 우리는 무선적으로 배치된 각 집단의 피험자들이 실험 처치 전에는 동일하다는 것을 전제할 수 있다. 일반적으로 실험에서 많이 사용하는 모형이다.
개별적인 집단을 무선표집하면 영역표집(area sampling)이 된다. 표집방법 단순무선표집(simple random sampling) 전집의 모든 요소들이 표본에 선택될 동등한 확률을 가지며, 각 요소들은 서로 독립적으로 선정됨을 의미 모든 추리 통계에는 등가확률의 전제가 깔려 있음 층화표집 모집단이 몇 개의 하위집단으로 구성되어 있다는 것과 이들의 구성비를 알고 있는 경우 사용한다. 층화(stratum) 개별적인 집단을 무선표집하면 영역표집(area sampling)이 된다.
체계적 표집 이 방법은 각 사례에 번호를 부여한 후 무선적으로 한 번호를 택한다. 그 후 매번 K번째의 사례를 추출하는 방법을 통하여 표집하는 것을 말한다. 예를 들어 1,000명에서 11,000까지의 번호를 부여하고 먼저 무선적을 5를 택하였다면, 5, 15 … 995와 같이 체계적으로 표본을 추출하는 것을 말한다. 그러나 표본이 체계적으로 변화하는 경우 이 표집 방법은 바람직 한 것이 아니다.
표집분포 S1 모집단 표집분포 S2 P S3 S.. S.. Sk-1 Sk 추출된 평균값은 다를 수 있다. 어떤 평균은 다른 평균보다 자주 일어나며 모집단의 평균에 가까울 수로 자주 일어난다. 이 분포는 모집단의 평균을 중심으로 정규분포에 접근한다. Sk-1 Sk
표집분포의 속성 모집단과 표집 분포와의 관계
통계치로 모수치를 추정하는 경우 얼마나 좋은 추정점수 인지를 알아야 한다. 편기(bias) 통계치로 모수치를 추정하는 경우 얼마나 좋은 추정점수 인지를 알아야 한다. 편기 모수치 의 불편 추정치 모수치 의 편기 추정치
평균치의 표집분포의 표준편차=평균치의 표준오차 표집분포가 가지는 표준편차는 모수치를 정확하게 추정하지 못하는 정도를 나타낸다. 즉 잘못 추정한 오차의 크기를 나타낸다. 따라서 이를 표준오차라고 한다. 평균치의 표집분포의 표준편차=평균치의 표준오차 표본 전집 두 가지 모두 분모가 사례 수 이다. 따라서 사례수가 커지면 표본 평균치의 변산은 감소하게 되며, 더욱 전집의 평균을 정확하게 예측할 수 있게 된다. 가능하면 큰 표본을 가지는 것이 좋다.
정규성 대부분의 통계적 기법이 표집분포의 형태가 정규분포라는 가정을 따른다. 원점수의 전집분포가 정규적이면 표집분포는 정규분포 한다. 만약 X가 평균 와 표준편차 인 비정규 모집단이더라도 표본의 크기를 증가 시키면 정규분포에 점차 접근한다. 중심극한 정리 만약 n개의 관찰치로 된 임의 표본이 평균 와 표준편차 로 부터 추출된 것이라면 n이 클 때 표본의 평균은 평균이 와 표준편차가 / 인 근사 정규 분포를 이루게 된다. 이때 그 근사정도는 n이 크면 클 수로 더욱 정확하게 된다.
이미 를 알고 있는 경우 사용할 수 있다. 예를 들면 표준화된 검사의 요강에서 그 검사의 평균과 표준편차를 알 수 있다. 각종 표집분포의 표준오차 평균치의 표집분포 표본에서 n개의 표본의 계속하여 표집하여 각각의 평균치를 계산하면, 많은 평균치를 얻을 수 있으며, 이는 다시 모집단의 평균을 중심으로 정규분포에 접근하는 분포를 이룬다. 이미 를 알고 있는 경우 사용할 수 있다. 예를 들면 표준화된 검사의 요강에서 그 검사의 평균과 표준편차를 알 수 있다. 표본의 표준편차는 모집단의 표준편차와 비교할 때 극단치가 제외 됨으로 값이 작게 나오기 때문에 그냥 사용하면 모집단의 값을 추정하는데 편기하게 된다. 따라서 자유도를 고려하여 s를 계산한다.
각종 표집분포의 표준오차 비율의 표집분포 중앙치의 표집분포 표준편차의 표집분포 Q의 표집분포 상관계수의 표집분포 빈도의 SEM 중앙치의 표집분포는 평균치보다 대략 25% 더 크다. 빈도의 SEM 표준편차의 표집분포 백분율의 SEM Q의 표집분포 상관계수의 표집분포