Chap 3. 표본조사 3.1 표본추출(Sampling)의 기초 3.2 단순임의표본추출 3.3 표본으로부터 모집단 추정

Slides:



Advertisements
Similar presentations
중등특수교육과 엄승현 이영재 이지수 속요에 대하여.
Advertisements

주사위를 이용한 땅 따먹기 청솔초 영재학급 4 학년 장 택 민 목차 1. 제작 동기와 원리 2. 필요한 도구 3. 게임규칙 설명 4. 게임 분석 및 전략 1. 제작 동기와 원리 2. 필요한 도구 3. 게임규칙 설명 4. 게임 분석 및 전략.
폭력. 폭력이란 무엇인가 우상의 눈물 물리적인 폭력 ( 최기표 ) VS 지능적인 폭력 ( 임형우, 담임선생님 )
1 통계를 왜 공부해야 하나 ? Dept. of Public Administration Chungnam National University.
목 차 ❖ 1 장. 서 론 ❖ 2 장. 표와 그림을 통한 자료의 요약 ❖ 3 장. 수치를 통한 연속형 자료의 요약
전남행복수업 design 독서ㆍ토론 수업 지원 자료 활용 목포유달초등학교 김미향.
2015년도 2학기 제 8 장 표본추출 마케팅조사.
전남행복수업 design, 독서·토론수업 연구의 개요를 말씀드리겠습니다..
호남선고속철도 개통 효과 조사 결과보고
금속의 종류와 액체의 성질에 따른 금속의 부식 창의적 산출물 연구 보고서 부명 초등 학교 임재윤 지도교사 노지은선생님
쯔쯔가무시 예방수칙을 실천하세요! 한국산업안전보건공단 광주지역본부.
교재:C언어로 쉽게 풀어 쓴 자료구조 (생능출판사, 천인국저)
14주차 1교시 강화계획 [학습목표] 1. 강화계획의 정의를 안다 [학습내용] 1. 단순한 강화계획 2. 간헐적 강화 3. 복합 계획 4. 선택과 대응법칙 [사전학습] 강화계획이 일어날 수 있는 사례를 생각해본다.
제5강 마우스 제2장 사육법 서울대학교 수의과대학 박재학 SNU LAM.
SNS의 개인행위 특성요인이 사용의도에 미치는 영향
연장근로와 야간·휴일근로 김영호 노무사 나눔 노사관계연구소 소장 연세대 일반대학원 박사 수료 고려사이버대 법학과 외래교수
기술 통계학 (Descriptive Statistics)
의료의 질 평가 분석 기법 김 민 경.
국민건강영양조사 한국보건의료연구원 이 자 연
제1장 과학과 사회조사방법 과학적 지식(scientific knowledge): 과학적 방법에 의해 얻어진 지식, 즉 논리적, 체계적, 경험적, 객관적 절차를 통해 얻어진 지식 과학적 지식의 특성 1) 재생가능성(reproducibility) 2) 경험가능성(empiricism)
Power Java 제4장 자바 프로그래밍 기초.
아파트관리비 청구서 이용 프로세스 안내 ㈜한국전산기술.
CHAPTER 21 UNIVARIATE STATISTICS
Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다.
1. 화면 및 메뉴소개 ▣ 온라인사업지원시스템 소개 ▶ 온라인사업지원시스템이란
2018-2학기 캡스톤디자인 실습지원비 사용설명회
제6장 표본추출 전수조사와 표본조사 1) 전수조사: 모집단 전체를 모두 조사. 예) 인구센서스, 농산물 수확조사
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
영원한 복음.
4-1 Gaussian Distribution
여는 장 큰제목과 조원이름은 늘 가로중앙선에 중심을 맞춰주세요.
1. 화면 및 메뉴소개 ▣ 온라인사업지원시스템 소개 ▶ 온라인사업지원시스템이란
2017년 1학기 국가근로장학금 장학생 교육 1.
Week 10:확률변수(Random Variable)
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
한밭대학교 산업경영공학과 강진규 ( jkkang.com.ne.kr)
경제통계학 개요 사공 용 서강대학교 경제학과.
지역 기획취재 지역신문의 취재방향과 보도 사례
Inferences concerning two populations and paired comparisons
Association between two measurement variables Correlation
수원대학교 응용통계학과 김 진 흠 표본추출의 이론과 실제 수원대학교 응용통계학과 김 진 흠
Statistical inference I (통계적 추론)
목적을 갖고 살아요!.
1 [100인의 멘토] 학교로 찾아가는 진로교육 □ 목적 인천지역 자유학기제 대상 청소년에게 건설관련 전문분야에 대한 진로탐색을 통해 체계적인 진로교육을 실시 □ 개요 ○ 참가대상: 18개 학교(학교당 1학급 기준) *협의가능 ○ 활동장소 : 각 선정 학교.
속요 국어국문학과 김보민 국어국문학과 조나현 제목 창의적으로 바꿔야 함.
Chapter Ⅱ. 연구 설계.
통계방법의 이해.
4장 마케팅 정보시스템과 마케팅조사.
제2장 통계학의 기초 1절 확률 기본정의 확률의 기본 공리와 법칙 2절 확률변수와 확률분포 3절 정규분포와 관련 분포 정규분포
제10장. 품질관리 (CHAPTER 10. Quality Control)
식물의 성장조건 만 든 이 : 김지혁 지도교사 : 김경순선생님.
갑을 관계(대기업 대 중소상공인들 간)등 상생과 협력방안
나비는 두 꽃 중에서 어느 꽃으로 날아 갈까요? 한 장미꽃은 향기가 나고 한 장미꽃은 악취가 납니다 두 개의 장미꽃이 있습니다
수정사항 → 수정 및 추가 → 삭제.
2019-1학기 캡스톤디자인 실습지원비 사용설명회
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
Definitions (정의) Statistics란?
Convergence Security 융합보안학과 17학번 이재승.
4.1 실험연구/관측연구 기초 4.2 좋은 실험연구란? 4.3 좋은 관측연구란?
제3장 사회조사방법의 기본개념 변수(variable): 사람, 물건, 사건 등의 특성이나 속성이 두 가지 이상의 가치(value)를 가질 때 변수라고 함. 즉 상호배타적인 속성들의 집합 1) 속성에 따른 분류 -. 명목변수(Nominal Variable): 분류에 기초를.
제안 제도 운영방안.
켈러의 경영경제통계학 제11장 모집단에 관한 추론.
기 술 통 계 학 6 1 기술통계학 2 자료의 정리 3 위치척도 4 산포의 척도.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
경영통계학 제1장 통계학은 어떤 학문인가? What is Statistics? 1.1.
확률표본추출 단순무작위 표본추출 SRS : simple random sampling
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
표본분포 개요 랜덤추출법 표본분포 모양과 CLT.
[2019 한양대 ERICA 졸업사진 촬영 안내] A type B type C type
Presentation transcript:

Chap 3. 표본조사 3.1 표본추출(Sampling)의 기초 3.2 단순임의표본추출 3.3 표본으로부터 모집단 추정 3.4 신뢰문(Confidence Statement) 3.5 표본조사의 여러측면

3.1 표본추출(Sampling)의 기초 Terminology in Sampling 추출단위(Sampling Unit) : 관심의 대상이 되는 집단을 구성하는 각 개체 특성값(Characteristic) : 추출단위의 특성을 나타내는 값 변수(Variable)라고도 함 모집단(Population) 모든 추출단위의 특성값을 모아 놓은 것의 모임 통계학에서 관심의 대상의 되는 전체 집단 유한모집단(Finite Population) : 유한개 추출단위로 구성된 모집단 예) 대통령 선거의 지지율에 대한 문제에서 추출단위인 유권자는 유한함 무한모집단(Infinite Population) : 무한개 추출단위로 구성된 모집단 예) 전 세계 쌀의 수확량 추출단위인 벼의 수는 무한함 표본(Sample) 모집단에서 통계적 분석을 위하여 실제로 관측된 특성값들의 모임 IDS Lab, SNU 2008

3.1 표본추출(Sampling)의 기초 Why Sampling? Census Sampling 모집단 = Sample : 전수조사 시간과 비용의 문제 2005년도 인구 및 주택조사 분석결과는 1290억원을 들여 1년 후에 나옴 표본추출로 인한 차이(Variation)가 없다? P.25 1999년도 성남시의 백궁, 정자지구 용도변경에 대한 여론조사 93,000명 중 70,000명 찬성. 찬성자 8명 중 1명 만이 찬성한 사실을 기억 Sampling 관심의 대상인 모집단의 특성 추측이 목적 모집단의 분포와 비슷한 Sampling 추출이 관건 IDS Lab, SNU 2008

3.1 표본추출(Sampling)의 기초 Bad Sampling 어떤 Sample이 좋지 않은 Sample인가? Example 편의상 Box의 맨 윗줄에서 추출한 귤의 품질 조사 오후 4시 이전에 출구조사한 백화점의 고객 만족도 조사 근무시간 중에 이루어진 전화면접조사 Biased Design 한 쪽으로 치우친 통계적 연구 Voluntary Response Sample: 응답자의 자의가 반영된 편향된 표본 Convenience Sample: 조사자의 자의가 반영된 편향된 표본 Online Survey vs. Street Survey IDS Lab, SNU 2008

3.2 단순임의표본추출 How to get Good Sample? 자발적 반응표본과 편의표본: 각각 응답자의 조사자의 선택편향 문제 양측 조사 당사자들의 선택성향의 개입을 원초적으로 막아야 함 단순임의추출(Simple Random Sampling, 단순랜덤추출)법 유한모집단에서 n개의 추출단위로 구성된 모든 부분집합들의 표본으로 선택될 확률이 같도록 설계된 표본추출방법 표본의 대표성 확보 목적 조사자의 자의와 응답자의 자의를 배제 난수표(Random Number Table)를 이용한 단순램덤추출법 N개 Sampling Unit이 있는 모집단에서 n개의 Sample을 뽑을 때, 모든 Sampling Unit에 고유번호 부여 [1부터 N까지] 1~N까지의 수 중에서 n개를 선발 IDS Lab, SNU 2008

3.3 표본으로부터 모집단 추정 모집단과 표본 모수(Parameter) 통계량(Statistic, 통계치) 모집단 크기 N 모집단의 특성에 관한 수: 평균, 분산, 비율 등 Constant, Unknown Value 통계량(Statistic, 통계치) 표본으로부터 구한 특성값 표본에 따라 다르다. 모수를 추측하는 도구 모집단 크기 N 표본 크기 n 모수 p 통계량 p^ IDS Lab, SNU 2008

3.3 표본으로부터 모집단 추정 표본추출분포 K Research의 “대통령 국정수행 만족도” 여론조사 단순임의추출로 1000명의 표본 추출 그 중에서 부정적인 견해를 가진 사람의 비율 644명/1000 = 64.4% H Research도 같은 질문으로 동일한 방법의 여론조사 p^ = 590/1000 = 59.0% p^ : 통계량은 표본에 따라 값이 다르게 나타난다. 즉, 분포가 있다. Sampling Variability (표본추출변동) 같은 모집단에서 동일한 확률적 절차에 의해 추출된 두 표본사이에 존재하는 차이 Sampling Distribution (표본추출분포, 표본분포) 확률적 절차에 의해 표본을 많은 횟수 추출하는 경우에 나타나는 통계량의 분포 32,625,000명 부정적 견해를 가진 사람 비율 p 1000명 p^ =64.4% IDS Lab, SNU 2008

3.3 표본으로부터 모집단 추정 표본추출실험 Simulation 1000개의 임의의 숫자를 읽어 5이하의 숫자들의 비율(p^)을 계산해보자. 이런 작업을 여러 번 반복하여 각각의 p^을 구한다. <모의실험> 이 때의 모수 p = 0.6 IDS Lab, SNU 2008

3.3 표본으로부터 모집단 추정 표본추출실험 Simulation p^ 의 표본분포 표본추출변동의 크기가 그다지 크지 않다. 120개의 표본 중 거의 대부분의 p^는 참비율인 p로부터 ±0.05 이내에 있음 (0.553~0.636) 단순임의표본으로부터 산출된 표본비율 p^는 어느정도 정밀한 추정값 p=0.6인 Simulation이 아닌 다른 비율의 경우는? (p=0.5 또는 p=0.7) 마찬가지로 참 비율인 p=0.5 / p=0.7을 중심으로 퍼져있으며 IDS Lab, SNU 2008

3.3 표본으로부터 모집단 추정 낮은 정밀도와 편향 만약 표본의 크기를 대폭 줄인다면 표본분포는 어떻게 될까? 250개의 표본으로부터 p^을 구한 후, 이를 120번 반복하여 표본분포를 구했다. 1000개 표본으로부터의 p^의 표본분포와 비교 모양은 비슷 (참 비율인 p=0.6을 중심으로 퍼져있다) 분포의 폭이 더 넓어졌다. (0.500~0.675: 편차범위 ±0.1) 표본의 크기가 작아지면 추정값의 정밀도가 낮아진다. IDS Lab, SNU 2008

3.3 표본으로부터 모집단 추정 낮은 정밀도와 편향 모집단의 크기 표본조사를 부실하게 만드는 또 다른 요인은 편향 표본조사 결과가 한쪽으로 치우치는 경향 Ex. 오후 시간대의 전화조사 표본의 크기를 아무리 크게한다고 해도 해결되지 않는다. 분포의 중심점이 p와 일치하지 않는다. (편향이 존재) 정밀도는 표본의 크기로 높일 수 있으나 편향문제는 표본추출방법 자체에 문제가 있으므로 표본설계를 처음부터 새로 해야 한다. 모집단의 크기 모집단 크기(N)가 표본 크기(n)에 비해 충분히 크다면 통계적 정밀도는 모집단 크기와 무관 IDS Lab, SNU 2008

3.4 신뢰문(Confidence Statement) p^의 표본분포 (Slide 8의 표본추출실험) 대부분 표본들의 p^은 모수(p=0.6)를 중심으로 ±0.05 사이에 존재 Furthermore… 0.6 ± 0.025에 표본비율들이 집중적으로 분포 [0.577,0.630]에서 114개의 표본비율 발견되는데, 이는 120개의 임의표본 중 대략 95%에 해당 크기 1000인 임의표본 120개 중 대략 95% p^ 들은 참 값 p(=0.6)를 중심으로 ± 0.03 이내 범위에 존재 p의 95% 신뢰구간 크기 1000인 표본에서 p^=0.644 라면, 신뢰도 95%에서 모비율 p는 0.644 ± 0.03 사이에 있는 것으로 추정된다. 95%의 표본들 IDS Lab, SNU 2008

3.4 신뢰문(Confidence Statement) 오차한계 (Margin of Error) 모집단의 참 값과 표본에서 산출되는 통계량과의 차이에 관한 일정 경계값 신뢰수준 (Level of Confidence) 가능한 모든 표본들 중에서 그 한계를 만족시키는 표본들의 비율 Q&A 신뢰수준 95%로 모비율(p)가 0.644±0.031 사이에 있다고 할 때, 이는 미지의 p 가 [0.613,0.675]에 있을 확률이 95%라는 말일까? 왜 꼭 95%인가. 이왕이면 99% 신뢰수준이 낫지 않을까? 동일한 신뢰수준에서 오차한계를 줄이고 싶다. 어떻게 하면 되는가? 신뢰도 95%에서 모비율 p는 0.644 ± 0.03 사이에 있는 것으로 추정된다. IDS Lab, SNU 2008

3.5 표본조사의 여러측면 단순임의추출인 표본조사 오류의 종류 편향이 없음 표본의 크기로 정밀도 제어가 가능 표본추출오류 (Sampling Error) 전수조사(Census)가 아니기 때문에, 표본(Sampling)으로 인하여 발생하는 오류 임의표본추출오류 (Random Sampling Error) : 오차한계로 표현 잘못된 표본추출로 인한 오류 : 표본설계 부실 Example. P42 전화조사 비표본추출오류 (Nonsampling Error) 표본추출오류가 아닌 오류: 부실한 응답자료입력/처리, 무응답, 응답자 오류 전수조사(Census)에서도 발생 가능 IDS Lab, SNU 2008

3.5 표본조사의 여러측면 표본조사 시 유의사항 조사결과 수용에 앞서 검토되어야 할 사항들 추출단위에 대한 정확하고 완전한 리스트의 작성 예) 1936년 미국 대통령선거 Landon VS. Roosevelt 무응답의 적절한 관리 철저한 조사자의 훈련 및 감독 정확한 설문지 작성 조사결과 수용에 앞서 검토되어야 할 사항들 P47~48 Twenty Questions a Journalist Should Ask About Poll Results Sheldon Gawiser & Evans Witt (저), National Council on Public Polls, USA IDS Lab, SNU 2008