경제활동인구조사 1997년 실업률 조사의 설계 표본추출방법 가중치 부여 표준오차 편의 제 17 장 실업률의 측정 경제활동인구조사 1997년 실업률 조사의 설계 표본추출방법 가중치 부여 표준오차 편의
INDEX 1 경제활동인구조사 2 1997년 실업률 조사의 설계 3 표본추출방법 4 가중치 부여 5 표준오차 6 편의
가구부문 통계조사인 경제활동인구조사를 통해 실업률을 측정 1. 경제활동인구조사 실업률 만 15세 이상 인구 비경제활동인구 경제활동인구 취업자 실업자 우리나라 통계청 : 가구부문 통계조사인 경제활동인구조사를 통해 실업률을 측정 경제활동참가율? 만 15세 이상 인구 중 경제활동인구의 비율 실업률? 경제활동인구 중 실업자의 비율
INDEX 1 경제활동인구조사 2 1997년 실업률 조사의 설계 3 표본추출방법 4 가중치 부여 5 표준오차 6 편의
표본틀(sampling framework) 2. 1997년 실업률 조사의 설계 표본틀(sampling framework) 경제활동 인구조사의 표본틀 10% 표본조사구란? - 인구주택총조사를 바탕으로 전국의 조사구를 행정구역별로 각각 10%가 되도록 추출한 것 - 표본틀에 속한 가구는 전국의 일반가구를 대표함. 사실상의 모집단 경제활동인구조사는 행정구역별로 추출한 10%표본조사구를 표본틀로 사용한다.
2. 1997년 실업률 조사의 설계 표본크기 표본크기의 결정 경제활동 인구조사의 표본크기 -1997년 결정된 지역별 표본조사구수 작다 크다 예산낭비 신뢰성하락 목표정도(target precision)를 충족시키는 범위 내에서, 각 지방사무소의 인력과 예산을 고려하여 적정규모로 결정
INDEX 1 경제활동인구조사 2 1997년 실업률 조사의 설계 3 표본추출방법 4 가중치 부여 5 표준오차 6 편의
3. 표본추출방법 조사구역 추출 조사구역으로 분할 표본 조사구 표본틀 결정 다단계군집추출 표본조사구별로 3개 조사 전국을 행정구역 별로 나누어 총 22,029개의 10%표본조사구로 이루어진 표본틀 결정 후 분류지표에 따라 조사구를 분류 원하는 수만큼의 표본조사구를 가구수에 비례 하는 확률로 추출 가구수 기준으로 (인접한 8가구) 표본조사구를 몇 개의 조사구역으로 분할 표본조사구별로 3개 조사 구역의 24가구씩 군집추출 표본조사구별로 하나의 조사구역을 무작위 추출 후 북쪽, 시계방향쪽도 조사
INDEX 1 경제활동인구조사 2 1997년 실업률 조사의 설계 3 표본추출방법 4 가중치 부여 5 표준오차 6 편의
4. 가중치 부여 가중치 부여는 왜 필요한가? 어떻게 가중치를 부여하는가? 가중치 조정을 통해 표본추출과정에서 드러난 불균형을 바로 잡는다. 시·도별 표본크기가 시·도별 가구수에 비례하지 않기 때문에 행정구역 에 따라 하나의 가구가 표본으로 선택될 확률이 다르다. 성·연령 등의 요인에 따라 개인별로 선택될 확률이 다르다. 어떻게 가중치를 부여하는가? 가중치로 수정된 표본이 하부집단별로 모집단의 구성비를 반영하도록 가중치를 설계한다. 표본으로 선택된 각 개인별로 거주지, 성, 연령에 따라 서로 다른 가중치를 부여해야 한다.
INDEX 1 경제활동인구조사 2 1997년 실업률 조사의 설계 3 표본추출방법 4 가중치 부여 5 표준오차 6 편의
경제활동인구조사는 다단계군집추출 방법 적용 4. 표준오차 경제활동인구조사는 다단계군집추출 방법 적용 군집 표본 어떤 조사구역이 선택되면, 그 이웃 조사구역이 선택될 확률이 매우 커진다. 단순 무작위 표본 하나의 조사구역이 선택되는 사건과 그 이웃의 다른 조사구역이 선택되는 사건은 서로 독립이다. 정보량 표준오차 군집표본은 같은 크기의 단순무작위표본에 비해 정보량이 적으므로 단순무작위표본에 적용한 표준오차 공식을 적용하지 못한다.
양분표본법(half-sample method) 4. 표준오차 양분표본법(half-sample method) 하나의 추정치가 과연 신뢰성이 있는지 알아보려면? 동일한 조사를 독립적으로 한 번 더 시행하여 두 조사결과의 차이를 보면 첫 번째 조사가 얼마나 믿을 만한지 평가할 수 있다. 그러나, 비용 때문에 조사를 반복하기 어렵다. 반복하지 않으면서 반복의 효과를 내려면? 반복대신 반분(半分)하면 된다. 주어진 표본을 두 부분으로 나누어 각각으로부터 원하는 추정치를 따로따로 구하면 된다. (양분표본법) 예시-우리나라의 실업자수 추정 표본가구를 조사구역 별로 양분 두개의 반쪽짜리 표본에서 추정한 실업자수:104만,108만 단일추정치=106만(평균) 개별추정치와의 차이: 2만(표준오차) 우리나라 실업자수 = 106만2만
4. 표준오차 실제 조사에서 단순무작위표본을 사용하지 않는 이유? 군집표본에서 표준오차 구하기 거주지 정보가 불완전하다. 단순무작위표본과 군집표본 실제 조사에서 단순무작위표본을 사용하지 않는 이유? 거주지 정보가 불완전하다. 단순무작위표본에 의한 조사는 조사비용이 매우 많이 든다. 방문조사가 원칙이므로 군집표본을 이용해야 비용이 절감된다. (통계조사도 경제적으로 해야 한다.) 군집표본에서 표준오차 구하기 표준오차를 구하려면 자료추출방식을 알아야 한다 (표본과 관련된 보다 많은 정보가 필요). 군집표본에서는 표본의 특성에 따라 표준오차가 달라진다. 군집표본에서 양분표본법은 이러한 복잡한 문제를 단순화시켜준다.
INDEX 1 경제활동인구조사 2 1997년 실업률 조사의 설계 3 표본추출방법 4 가중치 부여 5 표준오차 6 편의
6. 편의 편의(bias) 표본추출편의 표본조사는 전체의 일부만 조사하므로, 추출된 일부가 전체를 대표하지 못할 경우 편의가 발생. 전체를 조사하는 센서스의 경우, 누락되는 부분이 전체 인구의 일부에 불과하므로 편의 없음. 표본의 한 가구는 모집단의 약 430가구를 대표하므로, 한 가구의 불응은 조사결과에 큰 영향을 미친다. 조사시 누락된 가구에 대해 같은 조사구역의 인접한 가구와 동일한 조사결과를 부여하는데, 이는 아무런 근거가 없다. 무응답편의 직업이 있는 것, 일할 능력이 있는 것, 구직활동을 하는 것 등의 판단기준이 자의적이다. 취업자와 실업자의 구분이 어렵다. 분류기준모호 편의는 확률오차에 비해서 더 큰 문제를 일으킨다. 편의가 있는 표본에서 단지 자료를 살펴보는 것만으로는 그 편의의 존재를 알아차리기 힘들다.