선거조사에서의 다양한 표본추출방법 비교 구성욱 (주) 리서치 앤 리서치(R&R) Research &
선거전화조사 표본추출의 문제점 유 권 자 KT 전화 등재 가입자 KT 전화 비등재 가입자 KT 이외 전화 가입자 전화 비가입자 응답자 조사거부 부재 통화중 1. 모집단 Coverage 문제 2. 1차 접촉 실패시 재접촉 미실시 (응답율 30% 이하) 3. 할당 기준(지역, 성, 연령) 이외의 응답자 특성(학력, 소득, 출신지 등) 왜곡 가능성 의사 표명자 무응답자 투표자 기권자 투표자 기권자 KOSOMAR 세미나
할당 표집의 문제점 극복을 위한 실험 다양한 표본추출 방법 사용 지역, 성, 연령 할당 조사 지역 할당 조사 Kish Grid 조사 12/14 토요일 (N=1,000) 12/15 일요일 (N=1,495) 12/7~8 토~일요일 (N=461) 12/17~18 화~수요일 (N=425) KOSOMAR 세미나
Kish Grid란? 1차 접촉에서 응답이 이루어지지 않더라도 재접촉을 통해 표집된 전화번호 및 가구원이 가급적 동일한 확률로 표본에 들어갈 수 있도록 고안한 방법(Leslie Kish의 selection grid 활용) 다수접촉시도 최소 3차 접촉에 의해 유효표본의 응답률 제고 가구 내 응답자 편중 해소 가구 내 응답자 선정시 사전에 계획된 추출표로 선정 ☞ 응답자 선정을 위한 사전 질문 Step 1 : ○○님과 함께 살고 계신 분 중 만 20세 이상 성인 분은 ○○님을 포함해 몇 분이십니까? Step 2 : ○명 중 남자 분은 몇 분이십니까? Step 3 : 가구 내 선택표에 따라 조사 대상자 선정(다음 페이지 참조) KOSOMAR 세미나
Kish Grid에 사용되는 가구내 선택표 KOSOMAR 세미나 성 인 수 1명 2명 3명 4명 이상 0명 여자(101) 성 인 수 1명 2명 3명 4명 이상 0명 여자(101) 나이 많은 여자(201) 나이 적은 여자(202) 제일 나이 많은 여자(301) 둘째로 나이 많은 여자(302) 제일 나이 적은 여자(303) 제일 나이 많은 여자(401) 둘째로 나이 많은 여자(402) 셋째로 나이 많은 여자(403) 제일 나이 적은 여자(404) 남 남자(111) 남자(211) 여자(212) 남자(311) 나이 많은 여자(312) 나이 적은 여자(313) 남자(411) 제일 나이 많은 여자(412) 둘째로 나이 많은 여자(413) 제일 나이 적은 여자(414) 자 · 나이 많은 남자(221) 나이 적은 남자(222) 나이 많은 남자(321) 나이 적은 남자(322) 여자(323) 나이 많은 남자(421) 나이 적은 남자(422) 제일 나이 많은 여자(423) 제일 나이 적은 여자(424) 수 제일 나이 많은 남자(331) 둘째로 나이 많은 남자(332) 제일 나이 적은 남자(333) 제일 나이 많은 남자(431) 둘째로 나이 많은 남자(432) 제일 나이 적은 남자(433) 제일 나이 적은 여자(434) 4명 제일 나이 많은 남자(441) 둘째로 나이 많은 남자(442) 셋째로 나이 많은 남자(443) 제일 나이 적은 남자(444) KOSOMAR 세미나
Kish Grid 방식 통화 결과 (12월 17~18일) 1,497개 전화번호(유효 1,257개) 이용 총 3,281call N=425 유효전화(1,257) 대비 33.8% KOSOMAR 세미나
Kish Grid 방식 재접촉 결과(12월 17~18일) KOSOMAR 세미나
Kish Grid 조사 선택표 셀별 응답자수 KOSOMAR 세미나 12/17~ 18 조사 성 인 수 1명 2명 3명 4명 이상 성 인 수 1명 2명 3명 4명 이상 0명 여자(57) (13.4%) 나이 많은 여자 (6) 나이 적은 여자(91) (22.8%) 제일 나이 많은 여자 (1) 둘째로 나이 많은 여자(0) 제일 나이 적은 여자 (0) 셋째로 나이 많은 여자(0) 남 남자(12) 남자 (91) 여자(132) (52.5%) 남자 (7) 나이 많은 여자(12) 나이 적은 여자 (7) (6.1%) 남자 (8) 제일 나이 많은 여자 (4) 둘째로 나이 많은 여자(1) 제일 나이 적은 여자 (2) 자 · 나이 많은 남자(0) 나이 적은 남자(0) 나이 많은 남자(13) 나이 적은 남자 (6) 여자 (14) (7.8%) 나이 많은 남자 (14) 나이 적은 남자 (6) 제일 나이 많은 여자(7) 제일 나이 적은 여자(4) (7.3%) 수 제일 나이 많은 남자 (0) 둘째로 나이 많은 남자(0) 제일 나이 적은 남자 (0) 제일 나이 많은 남자 (6) 둘째로 나이 많은 남자(5) 제일 나이 적은 여자 (5) 4명 제일 나이 많은 남자 (3) 둘째로 나이 많은 남자(1) 셋째로 나이 많은 남자(0) KOSOMAR 세미나
응답자 특성 비교 성/연령 남자 여자 20대 30대 40대 50대이상 3단 층화 할당 49.3% 50.7% 25.3% 26.6% 20.2% 27.9% 지역 할당 37.9 62.7 13.4 22.9 23.6 40.1 KG 1차 (N=461) 44.5 55.5 8.0 24.3 26.2 41.4 KG 2차 (N=425) 40.5 59.5 8.5 17.2 23.8 50.6 지역 서울 인천/ 경기 PK TK 호남 충청 강원 3단 층화 할당 22.4 23.5 16.7 11.3 11.6 10.1 3.3 지역 할당 KG 1차 (N=461) 19.7 25.6 17.8 12.6 10.6 2.4 KG 2차 (N=425) 19.8 18.4 17.4 13.6 14.8 10.8 5.2 KOSOMAR 세미나
응답자 특성 비교 학력 중졸 이하 고졸 대재 이상 3단 층화 할당 20.3 33.2 45.4 지역 할당 31.5 31.6 35.4 KG 1차 (N=461) 34.3 32.5 KG 2차 (N=425) 42.8 30.1 25.4 직업 농/임/ 어업 자영업 블루 칼라 화이트 주부 학생 무직/ 기타 3단 층화 할당 5.0 17.0 7.9 20.1 32.0 9.7 8.3 지역 할당 7.3 13.8 5.1 17.8 41.2 9.8 KG 1차 (N=461) 11.3 15.8 5.2 21.5 30.6 2.6 13.0 KG 2차 (N=425) 9.2 11.8 12.9 36.5 3.1 19.3 KOSOMAR 세미나
조사결과 비교 단순지지도 무응답 제외 지지도 무응답 제외 투표율 적용 지지도 昌 盧 차이 3단층화할당(12/7~8) 28.5 41.4 12.9 38.7 54.8 16.1 39.3 54.1 14.8 Kish Grid(12/7~8) 26.2 36.2 10.0 38.9 53.7 53.4 14.1 3단층화할당(12/14) 34.7 42.6 7.9 41.3 50.7 9.4 42.0 50.1 8.1 거주지할당(12/15) 29.0 33.8 4.8 43.3 50.4 7.1 43.9 49.9 6.0 Kish Grid(12/17~18) 29.2 -7.0 51.9 41.8 -10.1 52.3 41.2 -11.1 실 제 결 과 46.6 48.9 2.3 KOSOMAR 세미나
시사점 Kish Grid 방식과 지역할당 표집은 고령층 및 여성층의 과다표집을 통제하기 어렵다 평일 조사보다는 주말 조사가 표본의 대표성 확보에 유리하다 (특히 선거일이 임박한 평일 조사에서 Kish Grid 방식은 예측 오류를 범할 가능성이 높다 → 저연령층 과소표집) 대표성을 상실한 표본조사는 아무리 정교한 통계분석을 해도 예측에 실패하게 된다 KOSOMAR 세미나
참 고 후보단일화 조사 개괄 KOSOMAR 세미나
조사개요 조사일시 2002년 11월 24일 (일) 13:00~22:00 조사대상 전국(제주 포함) 만 20세 이상 성인 남녀 조사방법 전화조사(Telephone Interview) 표본추출 성/연령/거주지별 인구비례할당 표집(Quota Sampling) 유효표본 2,000명 표본오차 95% 신뢰수준에서 최대허용 표본오차는 ±2.2% 포인트 KOSOMAR 세미나
설문 구성 KOSOMAR 세미나 〔 문1 〕○○○님께서는 이번 16대 대선에 투표하시겠습니까 ? ① 반드시 투표할 것이다 ② 아마도 투표할 것이다 ③ 별로 투표할 의향이 없다 ④ 전혀 투표할 의향이 없다 〔 문2 〕만약 내일이 투표일이라면 ○○○님은 한나라당의 이회창후보, 민주당의 노무현 후보, 국민통합21의 정몽준후보, 민주노동당 권영길후보, 장세동후보, 이한동후보 중 누구에게 투표하시겠습니까 ? ① 이회창 ② 노무현 ③ 정몽준 ④ 권영길 ⑤ 장세동 ⑥ 이한동 ⑦ 잘 모르겠다(읽지 말 것) 〔 문21 〕(문2의 ‘⑦ 잘 모르겠다’는 응답자만을 대상으로) 그래도 조금이라도 호감이 가는 후보는 누구입니까 ? ① 이회창 ② 노무현 ③ 정몽준 ④ 권영길 ⑤ 장세동 ⑥ 이한동 ⑦ 잘 모르겠다(읽지 말 것) 〔 문3 〕(이회창 지지자 제외 후) 그렇다면 ○○○님은 한나라당의 이회창 후보와 경쟁할 단일후보로서 노무현 후보와 정몽준 후보 중 누구를 지지하십니까 ? ① 노무현 ② 정몽준 문3의 경우 A, B의 두 타입으로 설문을 나누어 후보의 순서를 바꾸어 질문함 KOSOMAR 세미나
조사 과정의 특징 26명의 A급 면접원 투입(신규 면접원 배제) 양당 관계자 각 2명씩 4명이 참관 연구원이 직접 30% 검증 2회 펀칭으로 펀치 오류 배제(펀치 후 정당 관계자 임의 추출 검증) 기자 등 외부인 출입 철저 통제(면접원 화장실 출입도 동행) 분석, 요약보고 작성 등에 최소 인원만 투입 KOSOMAR 세미나
조사결과 1. 투표 의향(N=2,000) 2. 후보 지지도(N=2,000) 3. 단일후보 지지도(N=1,357) 반드시 투표할 것이다 아마도 별로 투표할 의향이 없다 전혀 투표할 모름/ 무응답 75.9 14.4 7.9 1.4 0.4 2. 후보 지지도(N=2,000) 이회창 노무현 정몽준 권영길 장세동 이한동 모름/ 무응답 32.1 28.7 23.9 2.3 0.7 0.3 12.0 3. 단일후보 지지도(N=1,357) 노무현 정몽준 모름/무응답 46.8 42.2 10.9 ※ 3번 문항의 경우 표본오차는 95% 신뢰수준에서 ±2.7% 포인트가 되므로, 노무현은 44.1~49.5%, 정몽준은 39.5~44.9%의 범위에 있는 것으로 해석할 수 있음 KOSOMAR 세미나