Download presentation
Presentation is loading. Please wait.
1
표본추출방법 확률표본추출법 비확률표본추출법 ► 단순무작위 표본추출 ► 층화 표본추출 ► 체계적 표본추출 ► 군집 표본추출
► 편의표본추출 ► 할당표본추출 ► 판단표본추출 ► 눈덩이 표본추출
2
Simple Random Sample Problem There are 200 college freshmen in a large lecture room. Choose 10 at random by picking random rows and columns. But couldn't the same name come up more than once? - Unbiased, easy to understand. You need a list, and many populations are not listed (example : shoppers in a mall) Note If you chose the sample, you might try to avoid adjacent items, or might try to "include" each row and column. That would not be random.
3
Systematic Sample Problem There are 200 college freshmen in a large lecture room. Choose 10 at random by picking every 20th student starting in row 12, column 3 and going down and across. - No list required, easy to understand. - Starting point must be randomized, may be hard "in the field." Note For a finite population, we set k N/n, and specify a method of recursion if we reach the end of the list. This method is random unless there is hidden periodicity in the population order.
4
Cluster Sample Data are freshman students to be interviewed about campus food. Each cluster is a dormitory. There are 11 dorms (clusters). Choose 3 clusters at random, then select 3 persons from each selected cluster. But Barbara came up twice, and so did Thelma! Saves interviewer travel time. Complex, often not worth the trouble.
5
Simple Random Sampling
Used when there is inadequate information for developing a conceptual model for a site or for stratifying a site Any sample in which the probabilities of selection are known Sampling units are chosen by using some method using chance to determine selection Simple random sampling is the basis for all probability sampling techniques and is the point of reference from which modifications to increase sampling efficiency may be made Alone, simple random sampling may not give the desired precision Advantages Prior information about population is not necessary Easy to perform, easy to analyze Disadvantages May not give desired precision Need a sampling frame
6
Computation Simple Random Sample - continuous variable(P90) 추정오차의 한계
Mean Variance Confidence Interval Sample Size 추정오차의 한계
7
Simple Random Sample-Binomial variable(P99)
Proportion Variance Confidence Interval Sample Size 추정오차의 한계
8
SRS 사례연구 미국인 들은 술을 덜 마시는 가 ? (P81 reading)
술 마시는 남성의 비율은 1992년 이후로 현저하게 줄었는가 ? 추정값과 오차의 한계(-0.03∼0.07)로 보아 현저하게 감소되었다고 볼 수 없다. 술 마시는 여성의 비율은 1992년 이후로 현저하게 줄었는가 ? 1994년을 기준으로 지난 5년간 음주량의 변화가 없었던 사람들에 비율이 음주량을 줄였던 사람들의 비율에 비해 현저하게 높은가 ? 총계 남 여 1994 65 70 61 1992 64 72 57 1990 51
9
개요 정의 크기가 인 모집단에서 크기가 인 표본을 추출하고자 한다면 추출 가능한 표본의 개수는 개이다.
크기가 인 모집단에서 크기가 인 표본을 추출하고자 한다면 추출 가능한 표본의 개수는 개이다. 단순무작위추출법이란 이들 추출 가능한 개 표본들이 표본으로 뽑힐 기회(추출확률)를 모두 같게 해 주는 방법이다. 난수 이용(P411 참고) 단순무작위추출법의 특징 가장 단순한 방법의 확률추출법으로 다른 표본추출법의 이론적인 기초 소규모 조사나 예비조사(pilot survey)에서 주로 사용 소규모로 실시하고 조사표가 잘 작성되었는가 ? 조사방법과 조사과정은 적절한가 ? 표본설계에서 표본크기를 정하고자 할 때 사용함 모집단의 어느 부분도 과대하게 또는 과소하게 반영하지 않음
10
닐슨 미디어 리서치 - 피플미터 부착 - 5,000(P83-P84)
전화조사 - 무작위전화걸기법 닐슨 미디어 리서치 - 피플미터 부착 - 5,000(P83-P84) 시청률 조사 추출틀 내의 어떤 부분도 다른 부분에 비해 과대하게 반영되지 않는다.(공정성) 표본추출의 가장 기본적인 방법 모집단과 표본 추출의 틀을 정하고, 각 구성요소에 고유 번호를 부여 하며, 표본의 크기를 결정한 후 무작위로 규정된 표본의 수만큼 표출단위를 선정하는 표출 방법 장점 •모집단에 대한 사전 지식을 요하지 않고 추출된 표본이 모집단을 잘 대표할 수 있다. 단점 •연구자가 모집단에 대해 가지고 있는 지식을 활용할 수 없다. •비교적 표본의 규모가 커야 한다. •표본 추출의 틀의 작성이 어렵다. 예제 4.10(P ) 참고할 것 예제 4.11(P ) 참고할 것
11
표본추출법 표본추출방법(직관적인 방법) ① 추출틀 내에 있는 각 단위를 꼬리표와 대응시킨 다음 꼬리표를 상자 안에 넣고 완전히 잘 섞고 난 후 눈을 감고 꼬리표를 한 뽑는다. 만약 상자 속에 있는 꼬리표가 완전히 섞였다면 각 꼬리표가 뽑힐 가능성은 동일하게 된다. ② 뽑힌 꼬리표에 해당하는 단위가 단순임의표본의 첫 번째 단위이다. ③ 이러한 방법을 계속 적용하여 크기 인 단순임의표본을 뽑기 위해서는 추출틀 내의 개의 단위에 대응되는 개의 꼬리표를 계속 뽑는다.
12
표본추출방법(난수표를 이용하는 방법) 직관적인 방법에 의한 표본추출 방법은 단순무작위추출의 원리를 잘 설명해 준다.
추출틀이 방대한 경우에 있어서 꼬리표를 이용하여 표본을 추출하는 방법은 현실적으로 어려운 작업 실제로 단순무작위표본을 얻을 때는 난수표를 사용하여 추출단위를 하나씩 추출하게 된다. 난수표(random number table) : 동일성, 독립성 유사난수(pseudo random number) 이용 표본추출방법(난수표를 이용하는 방법) ① 학생수가 1,000 명인 어느 학교에서 의 단순무작위표본을 추출하는 경우를 예로 들자. 1,000명의 학생에게 000, 001, 002, ... , 999 까지 고유번호를 지정한다. ② 난수표에서 출발점을 결정한다. 난수표에서 출발점의 결정은 임의로 정한다. ③ 만약에 똑같은 난수가 두 번 발생하게 되면 나중에 생긴 수는 무시하고 다시 난수를 찾아 서로 다른 난수를 표본 수 만큼 찾는다. ④ 이렇게 해서 찾아진 난수들의 번호에 해당하는 단위를 표본으로 선택하여 조사한다.
13
표본의 크기 결정 표본크기 결정의 기본원칙 목표 정도의 형태 절대오차의 한계 b가 주어진 경우
목표 정도(허용오차)를 충족시킬 수 있는 범위 내에서 가능한 한 작게 한다. 목표 정도의 형태 절대오차의 한계 : 조사 결과 추정량의 오차한계가 를 넘지 않도록 계획하는 경우 상대오차의 한계 : 조사 결과 추정량의 변동계수가 를 넘지 않도록 계획하는 경우 표본크기가 크면 클수록 추정량의 분산이 줄어들게 되어 추정량의 표본오차가 줄어드는 장점이 있는 반면 조사에 소요되는 비용과 시간이 많이 든다. 가능한 예산과 시간의 범위 내에서 효율적인 조사가 될 수 있도록 표본의 크기를 결정해야 한다. 일반적으로 표본의 크기가 필요이상으로 크면 예산이 낭비될 뿐만 아니라 조사의 정확성(비표본오차 때문에)도 감소될 수 있기 때문에 좋지 않고 반대로 표본수가 너무 작으면 표본오차가 커져 조사의 결과를 신뢰할 수 없게 된다. 절대오차의 한계 b가 주어진 경우 ① 모평균에 대한 추정의 경우 의 양변을 제곱하여 에 관하여 정리한다. 단 이다. 절대오차의 한계로 주어진 목표 정도를 작게 잡은 경우와 모분산이 큰 경우에는 표본 수를 크게 잡아야 한다.
14
② 모총계에 대한 추정의 경우 의 양변을 제곱하여 에 관하여 정리한다. 표본수를 구하는 식에서 은 일반적으로 알 수 없다. 과거의 비슷한 조사를 실시했었다면 과거 자료에서 얻은 을 이용한다. 과거의 자료가 전혀 없는 경우에는 작은 규모의 예비조사를 통해 을 추정하여 이용한다. 상대오차의 한계가 주어진 경우 ① 모평균에 대한 추정의 경우
15
Stratified Random Sampling
Prior knowledge of the sampling area and information obtained from background data may be used to reduce the number of observations necessary to attain specified precision Goal is to increase precision and control sources of variability in the data Variability between strata must be larger than variability with strata for any benefit to be seen Sampling within each stratum is done with a Simple Random Sample Advantages Gives estimates for subgroups Can be more precise than Simple Random Sampling Can be more convenient to implement Disadvantages Requires prior information about the population More complicated computation
16
Computation Stratified Random Sample-continuous variable Mean Variance
Confidence Interval
17
개요 층화임의 추출법은 단순무작위추출법을 응용한 표본추출방법으로 가장 널리 사용되는 표본추출방법 층이란?
모집단을 서로 겹치지 않게 몇 개의 부분군으로 나누었을 때 각각의 부분군을 일컬어 층(stratum)이라고 한다. 이때 모집단을 서로 겹쳐지지 않게 몇 개의 부분군으로 나누는 일을 층화라고 한다. 층화는 층화임의추출법의 효율을 결정하는 가장 중요한 작업이다. 층화 무작위 추출법(stratified random sampling)의 정의 모집단을 먼저 서로 겹치지 않도록 여러 개의 층으로 분할한 후, 각 층별로 단순임의추출법을 적용시켜 표본을 얻는 방법을 말한다. 층화 무작위 추출 방법이 널리 사용되는 이유 ① 단순무작위추출법에 비해 추정의 정도를 높일 수 있다. ② 전체 모집단에 결과뿐만 아니라 각 층별로도 추정도 가능하다. ③ 조사관리가 보다 편리하고 조사비용도 절감할 수 있다. 층화와 관련된 몇 가지 사항들 ① 일반적으로 조사목적과 추정범위에 따라 층화의 방법은 달라진다. 예) 지가변동율 조사, 작물재배면적 조사 등에서 나타나는 층화방법의 차이 ② 층화를 추정치의 정도를 높이기 위하여 행하는 경우 층화가 조잡할 경우에는 추정의 정확도는 떨어지지만 편의(bias)는 발생하지 않음에 유의해야 한다.
18
층화 무작위 추출법의 추출방법 ① 모집단의 L개의 층으로 층화한다. 그러면 각 층의 크기는 가 된다. ② 각 층에서 표본크기 를 결정한다. 층화무작위추출법은 각 층을 독립된 부차모집단으로 간주하여 각 층에서 단순무작위추출법을 적용하여 표본을 추출하기 때문에 각각의 층에서 모수의 추정은 단순무작위추출법의 이론이 그대로 적용된다. 모집단을 상호 독립적인 동질적인 하위 집단으로 나누고 각 집단별로 단순 무작위 추출을 적용하는 방법 장점) •중요 집단은 빼놓지 않고 표본에 포함시킬 수 있다. •동질적 애상은 표본의 수를 줄이더라도 대표성을 높일 수 있다. 단점) •층화시 모집단에 대한 지식이 필요하다. •층화시 근거가 되는 명부가 필요하며 없을 경우 많은 시간과 노력이 소요 된다.
19
층화의 기준 층화변수(stratification variable)란?
모집단을 몇 개의 층으로 나누려고 할 때 각 추출단위가 어느 층에 속하는지를 구분하기 위해 기준으로 사용되는 변수를 말한다. 여론조사에서는 일반적으로 지역, 성별, 연령, 학력 등이 중요한 층화변수로 쓰이고 있으며, 서울시내 주택가격에 대한 조사라면 지역(강남, 강북), 주택유형(단독주택, 아파트, 연립주택 등의 구분), 주택면적 등이 중요한 층화변수가 될 것이다. 층화변수는 조사 전에 추출틀(모집단) 속한 전체 추출단위에 대해서 그 값을 알고 있어야 하며 조사되는 주관심 변수와 밀접한 관련이 있을 때 효과적이다. 일반적으로 층화무작위추출법에서는 층화변수를 무엇으로 정하는지에 따라서 추정의 효율이 달라지게 된다. 적절한 층화변수를 잡아 모집단을 효과적으로 층화한다면 단순무작위표본에 의한 결과 보다 훨씬 통계적 정확도가 높은 추정치를 얻을 수 있다. 일반적으로 각 층의 내부에 있는 단위들의 변동이 적을수록 즉, 층 내부가 동질적일수록 층화의 효과는 커지게 된다.
20
표본크기의 결정 오차의 한계가 b이하가 되도록 하는 표본크기 결정 방법(모평균 추정) ① 전체 표본의 크기 ②
여기서 는 각 층의 표본수 들의 식으로 표현되어 있다. 따라서 주어진 식을 전체 표본크기 에 관하여 풀기 위해서는 과 의 관계식(각 층에 대한 표본 배분 비율)이 주어짐. 전체 표본크기 을 각 층에 어떻게 배분하는가의 문제는 층화무작위 추출법에서 대단히 중요한 문제이다.
21
표본의 배분 표본배분의 일반적인 원칙 널리 사용되는 표본배분법 ① 각 층 내의 추출단위들의 수 ( )
각 층의 표본배분에 영향을 미치는 요인들 ① 각 층 내의 추출단위들의 수 ( ) ② 각 층 내에서 변동의 정도 ( ) ③ 각 층에서 추출단위를 조사하는데 드는 비용 표본배분의 일반적인 원칙 ① 층 내의 추출단위 수가 많을수록 표본을 많이 배분한다. ② 층 내의 단위들이 이질적이어서 층 내 변동(분산) 이 클수록 표본을 많이 배분한다. ③ 조사비용이 많이 드는 층에 대해서는 가능하면 표본을 적게 배분한다. 널리 사용되는 표본배분법 ① 비례배분법 - 각 층 내의 추출단위 수( )에 비례하여 표본의 크기를 배분하는 방법 - 각 층 내의 변동과 각 층에서 조사비용은 고려하지 않고 층의 크기만을 고려한 방법 - 층별 변동에 차이가 없고 층별로 조사비용이 비슷한 경우에 적당하다. ② 네이만배분법 - 각 층별 조사비용은 별 차이가 없고, 층별 변동의 정도가 많이 나는 경우에 적당하다. - 각 층의 크기와 층별 변동의 정도를 동시에 고려한 표본배정 방법이다. ③ 최적배분법
22
효과적인 층화무작위추출법이 되기 위한 조건 ③ 최적배분법
- 각 층에서 각 단위당 조사비용에 차이가 있는 경우에 쓰이는 배분방법 - 주어진 비용 하에서 추정량의 분산을 최소화시키거나 주어진 분산의 범위 하에서 비용을 최소화시키는 방법 - 최적배분법은 층의 크기, 층내 변동의 크기, 층별 조사비용 등의 3가지 요소를 모두 고려한 표본 - 층의 크기가 클수록, 층내 변동이 클수록 표본이 많이 배정되고, 조사비용이 많이 드는 층에 대해서는 상대적으로 표본이 적게 배분하는 방법 효과적인 층화무작위추출법이 되기 위한 조건 ① 적절한 층화변수를 결정해야 한다. 층화무작위추출법이 효과적이기 위한 가장 중요한 사항은 적절한 층화변수를 찾아 층화하는 것이 가장 중요하다. 층화변수는 모집단 전체에 대해서 이미 알려진 변수로 조사되는 특성치와 관련이 깊은 변수라야 한다. " ② 알맞은 층화기준에 따라 층화해야 한다. ③ 표본의 크기를 결정하고 효율적인 표본배분법에 따라 각 층에 표본을 배분하여야 한다.
23
Systematic Random Sampling
Attempt to provide better coverage of the study area or population than that provided by a simple random sample or a stratified random sample Is a simple random sample based on spatial distribution over the site Does not require a complete list of sampling units Can give better coverage than a simple random sample Requires some estimate of the total number of sampling units in the population Required sample size must be calculated Determine sampling interval between units Randomly select starting point Transect sampling is a version of Systematic Random Sampling Collects samples in a regular pattern over the area in the investigation Grid Line Transect Orientation of grid or transect starting point should be randomly selected
24
개요 대규모 조사에서 주로 사용되는 방법의 하나이며 단순임의추출법보다 추출작업이 쉽고 경우에 따라서는 추정의 정도도 높다.
계통추출법이란? 모집단 추출틀에서 처음의 k개 조사단위들 중에서 랜덤하게 하나의 단위를 추출하고 그 이후 매 번째간격마다 하나씩의 단위를 표본으로 추출하는 표본추출방법을 1/k 계통추출법이라고 한다. 계통표본 추출방법 ① 추출틀에서 처음 k개 단위 중에서 랜덤하게 하나 (r(1≤r≤k)를 선택한다. 이때 r을 출발점(starting point)이라고 한다. ② 이후 r, r+k, r=2k, … r+(n-1)k 들을 표본으로 추출한다. 추출간격(sampling interval) : 계통추출법의 장점 ① 표본추출이 간편하다. →표본추출과정의 선택오차(selection error)를 줄일 수 있다. 인구 및 주택 센서스에서 계통추출법을 사용하고 있는데 센서스에서는 일반적으로 전 가구를 대상으로는 간단한 내용의 조사를 실시하고, 전체 가구의 5%에 대해서는 다양한 내용의 조사를 실시함 이러한 경우 대개 조사원들이 전문적인 조사원이 아니기 때문에 복잡한 표본추출방법을 사용하게 되면 표본선정에 어려움이 많다. 이때 계통추출법을 사용하면 표본선정이 간단한데 매 20 가구마다 1가구에 대하여 표본조사를 실시하면 되기 때문이다. 이와 같이 비전문적인 조사원들이 할 수 있는 표본추출법이 계통추출법이다. ② 단순임의추출법의 대용으로 사용할 수 있다. 추출틀이 랜덤한 순서로 배열되어 있는 경우에 계통추출법은 단순임의추출법의 대용으로 간편한 방법으로 표본을 추출할 수 있어서 대규모 표본조사에서 널리 사용된다. ③ 계통추출법을 사용하면 일반적으로 모집단의 전체에 대하여 잘 반영한다.
25
시간적인 계통추출에도 주기성에 유의해야 한다.
계통추출법의 단점 ① 실제적으로 표본자료에서 표본오차를 계산할 수 없다. 따라서 단순임의표본으로 가정하여 표본오차를 추정하지만 이것은 모집단의 유형에 따라 실제보다 과대 또는 과소 평가된다. ② 계통표본은 추출틀의 형태에 따라 그 精度에 차가 생긴다. 특히 모집단 추출틀이 어떤 주기성을 갖고 있을 때는 이 방법의 적용을 피하는 것이 좋다. [참고] 계통추출은 추출방법이 간단하기 때문에 품질관리에서도 많이 이용된다. 그 예로서 공장의 제품이나 원료검사를 위한 시료(표본)추출에 사용된다. 어떤 기계에서 제품이 계속해서 흘러 나올 때, 일정한 시간간격으로 표본을 뽑는다. 그리고 수입곡물을 검사할 때 창고 내에서 시료(표본)를 뽑으면 표면에 있는 것만 뽑히고 내부나 밑바닥에는 뽑을 수 없다. 이러한 경우에는 운반할 때 표본을 뽑는 것이 좋은데 즉, conveyer belt로 운반될 때 일정한 시간간격으로 표본을 뽑으면 된다. 시간적인 계통추출에도 주기성에 유의해야 한다. 그 예로서 제품검사를 매일 오후 늦게 실시하면 작업자들이 피로한 시간이므로 불량률이 높아지게 된다. 이것은 주기성을 갖는 예라고 볼 수 있다.
26
체계적 표본추출 모집단을 구성하는 구성 요소들이 자연적 순서 또는 일정한 질서에 따라 배열된 목록에서 매 n번째 요소를 추출하여 표본을 형성하는 표출 방법 장점) •단순 무작위 표출에 비해 비용과 자원 및 노력을 절약할 수 있다. •표본 선정이 더 쉽다. 단점) •편견이 개입되어 표본 대표성의 문제가 발생할 수 있다. •주기성의 위험이 있다. P118(실제자료를 이용한 실습) -SRS 연습문제(P167) 5.1(P167) 실제자료를 이용한 실습(P171)
27
계통표본의 추출 계통표본의 특성 ① 계통추출은 집락추출의 일종으로 볼 수 있다. 전체 k개의 집락에서 하나의 집락을 추출하는 집락추출법의 특수한 경우이다. ② 계통추출은 층화추출법의 특수한 경우로 볼 수 있다. 그러나 각 층에서 하나의 단위를 뽑을 때 랜덤하게 추출하는 것이 아니라 미리 정해진 순서에 따라 추출하는 것이 차이이다. 인 경우의 계통추출법 ① 일반적으로 값에 가까운 정수값을 택하여 추출간격으로 정한다. ② 이후의 과정은 보통의 계통추출법과 동일하다. 을 사용하면 모평균에 대한 비편향추정량이 아니다. -표본 크기가 큰 경우(50 이상)에는 별 문제가 없다. 분수간격법(fractional interval method) ① 추출간격을 정수로 정하는 것이 아니라 분수값을 그대로 사용하는 방법 ② 이후의 과정은 보통의 계통추출법과 동일하다.
28
모집단의 유형 랜덤모집단 순서모집단 순환모집단 ① 추출틀의 추출단위의 배열과 관심변수 값과의 관계가 랜덤한 경우
② 대부분의 모집단은 랜덤모집단으로 간주할 수 있다. ③ 랜덤모집단인 경우에는 급내상관계수 값을 0으로 간주할 수 있다. →단순임의추출법에서와 같은 추정방법 사용 →랜덤모집단인 경우 단순임의추출법과 계통추출법은 동등(equivalent)하다. 순서모집단 ① 모집단 내의 각 추출단위들이 관심변수 값의 크기 순으로 나열되어 있는 경우를 말한다. ② 어느 지역의 소득을 추정하는 경우 먼저 모집단의 추출틀을 소득에 대한 과거 자료를 이용하여 크기 순으로 나열한 경우이다. ③ 일반적으로 계통표본 내의 단위들이 이질적이어서 급내상관계수 p값이 음수로 나타난다. 따라서 이러한 모집단의 경우에는 단순임의추출법에 비해 계통추출법이 효율적이다. ④ 추정량의 분산을 계산할 때 단순임의추출법에서의 추정식을 그대로 사용하면 실제 분산보다 과대 추정하게 된다. 순환모집단 ① 모집단의 추출단위들이 주변수의 값을 볼 때 주기적으로 변동하는 경우를 말한다. ② 계통표본내의 단위들이 동질적이어서 급내상관계수 값이 양수로서 커진다. 따라서 단순임의추출법에 비해 효율이 떨어진다. ③ 주기성을 갖는 모집단에 대해서는 계통추출법울 사용하는 것은 피해야 한다. 일반적으로 표본추출법에 대한 효율은 모집단의 배열 형태에 따라서 크게 달라진다. 따라서 표본추출법을 선택함에 있어 모집단에 대한 충분한 검토가 필요하다.
29
표본크기의 결정 ① 모평균 μ를 100(1-α) 신뢰도에서 오차의 한계가 B 이내가 되도록 추정하고자 한다면
: 양변을 제곱해서 전체 표본 크기 에 대해서 정리 ② 모비율 추정에서 표본의 크기 결정
30
Cluster Sampling Used when there is more variability within groups than among Groups are randomly sampled Units within groups are sampled Can sample every element within the group Can take a second random sample within the group
31
층화추출에서는 층 내가 가능하면 동질적이나 집락추출에서는 각 집락들이 이질적,
모집단을 상호 배타적인 소집단으로 구분하고, 분류된 소집단 중에서 무작위고 표본을 추출하는 방법 장점) •모집단의 목록이 없을 때 가능하다. 층화추출법과 집락추출법의 차이 층화추출에서는 층 내가 가능하면 동질적이나 집락추출에서는 각 집락들이 이질적, 층화추출을 위해 구성한 층의 경우 모든 층에서 표본조사를 통해 정보를 확보하게 되는 데, 집락추출의 경우 전체 집락 중 표본으로 추출된 일부 집락에 대해서만 표본조사로 정보를 얻게 된다. 층화추출법 집락추출법 그룹 층 군집 추출 각 층마다 적어도 하나를 반드시 추출하여 표본을 만든다 군집을 단순확률추출법으로 추출한 후 그 구성원 모두를 표본으로 한다.
32
개요 정의 대규모 사회조사에서 집락추출법이 사용되는 이유 확률비례추출법
① 서로 인접한 기본 단위틀로 구성된 집락을 만들어 먼저 집락을 추출하고, 추출된 집락 내의 일부 또는 전체를 조사 ② 집락 추출의 단위는 하나 이상의 기본 단위틀로 구성된 집락이다. ③ 집락 추출법이나 다단계추출법을 사용하면 모집단 전체에 대한 추출틀이 필요한 것이 아니라 표본으로 추출된 집락 내의 조사단위에 대한 리스트만 필요하다. 대규모 사회조사에서 집락추출법이 사용되는 이유 ① 모집단이 큰 대규모 사회조사에서는 추출틀을 마련하기가 매우 어렵거나 불가능한 경우가 많다. ② 완전한 추출틀이 마련 상태에서 뽑힌 표본은 지리적으로 매우 흩어지게 되어 조사비용과 노력이 많이 소요되고 관리가 어렵다. 확률비례추출법 모집단을 구성하는 집락들의 규모가 크게 차이가 날 경우 동일한 확률로 뽑지 않고 집락을 불균등확률로 추출하는 것이 바람직하다. 확률비례추출법(PPS sampling) 표본추출법 ① : 번째 집락의 크기 : 집락내 조사 값의 합계 ② 표본 집락은 사전에 알려진 집락의 크기 에 비례하여 복원확률 비례추출 →누적층계법 이용, →표본집락의 추출확률이 서로 다르기 때문에 모수 추정량도 달라진다.
33
모집단을 일련의 하위집단으로 층화시킨 다음 각 하위집단에서 적절한 수의 표본을 놓는 방법.
층화표집에서는 모집단을 동질적인 성격을 가지고 있는 하위집단으로 층화해야 함. 집단간 : 이질적 집단내 : 동질적 종류 비례층화표집 : 표본수가 소집단의 크기에 비례 비비례층화표집 : 소집단의 크기와 분산도를 모두 고려하여 표본을 추출 장점 집단간의 이질성이 존재하는 경우, 무작위추출법보다 추출된 표본이 모집단의 특성을 잘 반영함. 단순임의표본추출법과 같이 표본의 무작위성이 확보, 불필요한 분산을 줄임 층화된 부분집단의 특성을 잘 알고 비교 가능 단점 모집단의 각 부분층을 정확히 알고 있지 않으면 안됨. 표본추출과정에서 비용, 시간이 많이 듬. 사용하는 경우 각 증에 대하여 상이한 표집 방법, 상이한 목록표를 사용하여야 할 경우 정확도 확보에 필요한 표본 수를 되도록 적게 하고자 하는 경우 (조사하고자 하는 층이 동질적이라면, 최소한의 사례로 주어진 정확성을 확보할 수 있음.)
34
2단 집락 추출 2단계 확률비례 집락추출법 2단집락 추출이란 장점
먼저 1단계에서 모집단의 집락틀 중에서 표본 집락을 추출하고, 2단계에서 추출된 집락틀로부터 조사될 기본 단위를 추출한다. 여기에서 1단계에서 추출되는 1차추출단위(PSU:primary sampling unit)라고 하고, 2단계에서 추출되는 단위를 2차추출단위(SSU:secondary sampling unit)라 한다. 장점 2단집락추출 방법이나 다단계추출법을 이용하면 비교적 쉽게 자체가중설계를 얻을 수 있다. 행정조직과 같은 모집단일 경우 여러 단계의 계층적인 조직으로 구성되어 있는 경우 효과적 다른 표본추출법에 비해 전체적으로 조사가 편리하고 조사비용이 적게 된다 . 2단계 확률비례 집락추출법 집락의 크기에 심한 차이가 있을 때 표본집락을 집락의 크기에 비례하여 확률비례추출하는 것이 바람직하다. 1단계추출 : 확률비례추출법 적용 2단계추출 : 단순임의추출법 적용
35
고맙습니다 !
Similar presentations