표본분포.

Slides:



Advertisements
Similar presentations
신진영 현지 조사 방법 및 보고서 작성법 제 7 강 - 자료 수집과 설문지 작성 -
Advertisements

Statistics 상지대학교 1 / 22 추정 개요 점추정과 구간추정 표본크기 두 모집단의 비교.
6σ 관련 기초 통계 (1) -. 통계적사고 -. 모집단과 표본. 통계적 사고 모든 작업은 상호연관된 프로세스의 시스템 예 ) 열처리 작업 공정 원료 투입 공정가열 공정 냉각 공정 모든 프로세스에는 산포가 존재 가피원인 불가피원인 동일 원료동일 생산공정 동일 작업자동일.
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
Ⅱ 세포의 주기와 생명의 연속성 Ⅱ 세포의 주기와 생명의 연속성 - 1. 세포주기와 세포분열.
재료수치해석 HW # 박재혁.
적분방법의 연속방정식으로부터 Q=AV 방정식을 도출하라.
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
고장률 failure rate 어떤 시점까지 동작하여 온 품목이 계속되는 단위기간내에 고장을 일으키는 비율(횟수). 고장률은 확률이 아니며 따라서 1 보다 커도 상관없다. 고장이 발생하기 쉬운 정도를 표시하는 척도. 일반으로 고장률은 순간고장률과 평균고장률을 사용하고 있지만.
표본 이론.
Ⅱ. 측정(Measure) (2) Gage R&R (Crossed) – ANOVA 방법 [1] Data 입력
제 12 장 직교배열표에 의한 실험계획(1).
제9장 샘플링과 오차 표본: 시료, Sample 모집단 : 공정, Lot Sampling
보고서 #7 (기한: 6/2) 2개의 스택, stk1, stk2를 이용하여 큐를 구현하라.
제12주 회귀분석 Regression Analysis
경영통계학 통계학은 어떤 학문인가? What is Statistics? 1.1.
Windows Server 장. 사고를 대비한 데이터 백업.
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
가설검정 9 1 가설검정 2 모평균의 검정 3 모비율의 검정 4 c2-검정과 모분산의 검정.
비확률샘플링 - 편의표집 - 의도적 표집 - 할당 표집 - 눈덩이 표집 표본크기
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
비확률샘플링 - 편의표집 - 의도적 표집 - 할당 표집 - 눈덩이 표집 표본크기
제3부 표본추출법과 자료분석 준비 제6장 표본 추출 제7장 추정과 가설 제8장 분석자료 준비와 통계기법의 개요.
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다.
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
1. 현대 생활과 응용 윤리의 필요성 2. 윤리 문제의 탐구와 실천 3. 윤리 문제에 대한 다양한 접근
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
상관분석 (p , p ).
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
군집 분석.
표집유형: 확률표집, 비확률표집 확률표집 - 단순무작위표집 - 체계표집 - 층화표집 - 군집표집
(independent variable)
뇌를 자극하는 Windows Server 2012 R2
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
T-test.
강의 목차 1주차 통계학의 기본개념 7주차 통계적 추정 8주차 종합정리 및 중간고사 9주차 10주차 통계적 검정(1) 11주차
젠트리피케이션에 대한 인식 분석 경영학부 최은지 경영학부 이창현
8장. spss statistics 20의 데이터 변환
두 모집단에 대한 검정.
보고서 #7 (기한: 6/2) 2개의 스택, stk1, stk2를 이용하여 큐를 구현하라.
고급행정통계 –표본분포, 통계적 추정 한 모집단
⊙ 이차방정식의 활용 이차방정식의 활용 문제 풀이 순서 (1)문제 해결을 위해 구하고자 하는 것을 미지수 로 정한다.
Sampling Distributions
Intelligent Systems and Control Lab. Dept. of EE, Yeungnam Univ.
3장, 마케팅조사의 일번적 절차 마케팅 조사원론.
바넘효과 [Barnum effect] 사람들이 보편적으로 가지고 있는 성격이나 심리적 특징을 자신만의 특성으로 여기는 심리적 경향. 19세기 말 곡예단에서 사람들의 성격과 특징 등을 알아 내는 일을 하던 바넘(P.T. Barnum)에서 유래하였다. 1940년대 말 심리학자인.
기초 통계학 지도위원 이광희.
Chapter 3: 확률변수와 분포함수 Pilsung Kang
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
실습 : Sampling / Excel macro
제 16장 비율의 정확성 머리말 신뢰구간 신뢰구간의 해석.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
In-house Consultant Training
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
현지조사 방법 및 보고서 작성법 현지조사(field working)란?
CH4. 반복이 없는 이원배치법 ( Two-way ANOVA)
전류의 세기와 거리에 따른 도선 주변 자기장 세기 변화에 대한 실험적 고찰
문제의 답안 잘 생각해 보시기 바랍니다..
진리표를 이용한 타당성 증명 진리표(truth table) : 단순 문장들이 진리값을 상이하게 가질 수 있는 가능한 모든 경우를 남김없이 열거한 표 (ex) 오늘은 날씨가 맑거나 비가 올 것이다. 오늘은 날씨가 맑다 비가 온다 오늘은 날씨가 맑거나 비가 올 것이다. T.
알렌 인지 수준 판별검사와 한국판 간이 정신상태 판별검사의 상관관계
Survey Sampling Sangji University.
Presentation transcript:

표본분포

1. 백화점 사례 백화점 사례 ▣ 이 문제를 어떻게 해결할 것인가? : 가나 백화점의 박정준 사장은 오늘 최근 두 달간의 매출보고서를 보고 깜짝 놀랐다. 보고서에는 최근 매출이 두 달간 연속적으로 감소하고 있음을 나타내고 있었기 때문이었다. 박 사장은 최근 매출이 증가하지 않았지만 현상유지 하고 있다고 생각하였다. 박 사장은 대책을 논의하기 위하여 긴급 간부회의를 소집하였다. 간부들은 왜 긴급회의가 소집되었는지를 알고 있었으므로 무거운 분위기에서 회의가 진행되었다. 박 사장의 매서운 질책이 있자 간부들은 모두 자기 부서의 잘못이 아니라 타 부서의 잘못이 크다고 변명하기 시작하였다. ▣ 이 문제를 어떻게 해결할 것인가? : – 최근 두 달간의 매출 감소 현상을 가지고 심각하게 고려해야 할 매출 감소추세를 나타내는지. 아니면 단지 일시적인 매출감소 현상에 불과 한지를 어떻게 판정할 것인가? ㅡ 부분 정보를 가지고 전체를 파악하려는 문제: 통계학에서는 표본조사와 추론(통계적 추정과 가설검정)이라는 제목 으로 다루어지고 있음.

2. 서론 ▣ 서론 : 위 백화점 사례는 기업이 최적 의사결정을 내리기 위해 행하는 전형적인 하나의 과정을 예시 – 최적의 의사결정이 되기 위한 조건 1. 정확한 의사결정이 되어야 함(정확성) 2. 정확한 의사 결정이 신속하게 적시에 의사결정자에게 제공(신속성) 3. 의사결정시 많은 비용이 소요되어서는 안 됨(경제성) ▣ 표본조사의 목적 : – 전수조사를 하게 되면 정확성은 보장되는 대신에 신속성과 경제성을 희생. – 정확성과 신속성/경제성의 균형이 필요. 이러한 삼자간의 균형점을 찾고자 하는 것이 표본조사에서 공부하는 주 목적

2.1 표본조사·신뢰수준·유의수준 ▣ 표본조사 : – 표본조사는 말 그대로 전체를 조사치 않고 대상의 일부만을 조사하는 것. ▣ 신뢰수준 : – 표본 조사가 95%의 정확성을 갖고 있을 때 우리는 이를 95% 신뢰수준(confidence level)이라고 표현. ㅡ신뢰수준은 100(1-α)%으로 표시 ▣ 유의수준 : – 전부를 조사하지 않는 표본 조사이기 때문에 부득이하게 발생하는 부정확성을 유의수준(significance level) ㅡ유의수준을 표시 할 때 α(알파)로 표시, 예를 들어 α=0.05면 유의수준은 0.05이고 신뢰수준은 95% ▣ 모집단(population)과 모수(parameter) : – 모집단이란 간단히 말해 모든 조사 대상이 구성하고 있는 전체 집단 ㅡ 모집단의 성질을 측정 가능한 수치화 시킨 것을 모수라 함

2.1 표본조사·신뢰수준·유의수준 ▣ 표본(sample)과 표본통계량(sample statistics) : ㅡ대표적인 것이 표본 평균 (X)와 표본 분산(S ) ㅡ 2 ▣ 모수와 표보통계량과의 관계 : – 실제로 우리가 현실적으로 구할 수 있는 것은 표본통계량. ㅡ우리가 구한 표본 통계량을 가지고 모수를 알아 맞히는 과정을 통계학에서는 추론(inference) ㅡ추론에는 추정(estimation)과 가설검정(hypothesis test)이라는 두 가지 형태 ▣ 추정(estimation)과 가설검정(hypothesis test) : – 추정이란 구한 표본 통계량의 값을 가지고 모수의 값을 구하는 과정 ㅡ가설검정이란 모수의 진위(즉 옳고 그름)를 표본 통계량을 구해 가지고 판단하는 과정 ▣ 유의수준과 신뢰수준 : – 표본조사 결과에는 반드시 신뢰수준이나 유의수준의 값을 미리 선언함으로써, 표본조사 결과의 정확도를 표시 ㅡ 유의수준α가 많아야 0.05 이하가 되어야 그 표본조사의 정확도를 인정(95%의 신뢰수준이 보장)

3.1 표본통계량과 그 분포(표본분포)의 배경 ▣ 배경 : – 평균과 분산이 모집단의 성질을 나타내는 대표적인 모수 – 우리가 모수에 대해 알고자 할 때, 표본조사를 통해 대신 얻는 표본 통계량에 대한 이해가 필요, 특히 관심의 대상이 되는 것이 표본통계량의 확률분포(표본분포)와 그 평균, 분산인 것

3.2 표본분포의 필요성 ▣ 필요성 : – 우리가 하는 것은 표본통계량(조사된 표본의 성질)을 가지고 모수(알고자 하는 모집단의 성질)를 추론하고자 하는 것 ㅡ추론에는 표본통계량과 모수, 양자간의 관계를 안다면 가능하여 질 것 예를 들어 X값을 가지고 Y값을 알고자 할 때 양자의 관계 즉, Y=2X라는 관계를 안다면 Y값을 아는 것이 얼마든지 가능 ㅡ이와 같이 표본 통계량과 모수간의 관계식의 역할을 해 주는 것이 표본분포임. ㅡ표본통계량을 가지고 모수를 추론할 때 양자간의 관계인 표본 분포에 대한 이해가 반드시 필요

3.3 표본분포의 간단한 예 ▣ 5명이 모집단인 대학원생들의 통계학 점수를 알고자 함 : – 2명을 표본으로 선택하여 표본조사를 실시하여 추론하고 함. ㅡ 모집단의 크기는 5이고 모수는 5인 통계학 평균 성적이며 표본 집단의 크기는 2이고 표본 통계량은 2인의 통계학 평균 성적임. ▣ 모든 가능한 표본의 평균과 분산 : ▣ 표본평균의 평균과 표본평균의 분산 :

3.3 표본분포의 간단한 예 ▣ 표본평균 X 분포의 특성 : ㅡ

4.1 표본평균(X)의 이론적 확률분포 ▣ Z 분포 : ㅡ – 정규분포의 성질 – 관심을 갖고 있는 대상이 정규분포를 하는 경우에 문제를 풀어 구체적인 확률의 값을 구할 때는 이를 표준정규분포 로 바꾸어 이용. 이때 이 표준 분포를 Z분포하고 함.

4.1 표본평균(X)의 이론적 확률분포 ▣ 중심극한이론 : ㅡ – 만약, 모집단으로부터 추출하는 표본의 수가 충분히 크다면, 모집단의 분포에 관계없이 는 근사적으로 정규분포를 따른다는 것으로 알려져 있음. 이것이 바로 중심극한이론(CLT: Central Limit Theorem) 임. – 중심극한의 이론을 요약하면, 평균이 µ이고 표준편차가 σ인 임의의 모집단으로부터 크기 n의 확률표본을 추출했 을 때 그 평균 는 n이 충분히 크면(보통 30이상을 말함) 근사적으로 다음을 따름 – 중심극한 이론 덕분에 우리가 표본 집단을 30개 이상으로만 한다면 모집단의 확률분포와 모분산을 몰라도 표본평 균의 분포는 Z분포를 그대로 적용할 수 있음. 종국적으로 바람직하게 표본평균과 모평균 간의 관계만을 명시적으로 나타나게 해줌.

4.1 표본평균(X)의 이론적 확률분포 ▣ t분포 : ▣ 자유도 : ▣ Z분포와 t분포 요약 : ㅡ – 모평균의 추론에 사용되는 분포는 앞서 다룬 바 있는 표본평균의 분포로서 정규분포가 있음.그런데, 표본의 크기가 작은 경우에는 정규분포의 사용이 곤란하며, 그 때 사용되는 분포가 t분포. – t분포이 확률변수는 (여기서 n-1은 자유도) ▣ 자유도 : – 자유도란 자유로운 값을 가질 수 있는 변수의 수. 만약에 변수가 값을 자유로이 가질 수 없는 상호아이 된다면 그 변수는 이미 변수라 할 수 없는 것임. 따라서 자유도란 어떤 상황에서 변수의 역할을 하는 변수만의 수 ▣ Z분포와 t분포 요약 :

4.2 표본분산의 표본분포 ▣ 분포 : – 확률변수 Zi가 각각 표준정규분포 N(0,1)을 따르고 서로 독립일 때, 다음의 새로운 확률변수 의 분포를 자유도(degrees of freedom : df) k의 카이 제곱분포(X-square distribution)라 함.기호로 나타내면 ㅡ카이제곱분포의 특성은 자유도에 의해 결정되며, 자유도가 변함에 따라 분포의 형태가 어떻게 달라지는지를 다음의 그림에서 보이고 있는데, 이 분포는 정규분포와는 달리 좌우대칭형태가 아님을 볼 수 있음              

4.2 표본분산의 표본분포 ▣ F 분포 : – 두 정규모집단의 분산의 크기를 비교하는데 사용하는 분포로서 F본포가 있음, ㅡ V1과 V2를 각각 자유도 n1, n2인 카이제곱분포를 따르는 서로 독립인 확률변수라 할 때, 새로운 확률변수 F를 이라 하면, F는 자유도 (n1, n2)인 F-분포를 따른다고 하며, 기호로 F~F(n1, n2) 나타냄. F분포의 형태는 두 개의 자유도에 따라 다르지만 대체로 다음의 형태를 지니고 있음. 아래 그림에서 보는 바와 같이 F~F(n1, n2)일 때 P{F ≥f}=α가 성립하는 f의 값을 자유도 (n1, n2)인 F분포의 100(1- α)% 백분위수라 하 며, F(n1, n2, α)또는 Fa(n1, n2)로 표기.

4.3 표본비율의 분포 ▣ 표본비율 분포 : ▣ 표본비율 의 분포의 특성 : ▣ 표본비율 분포 : – 특정 제품에 대한 시장 선호도 조사, 각종 선거에서의 지지율 조사와 같은 것들은 모두 모집단의 특성인 모비율을 추정하기 위한 것 ㅡ 모집단에서 특정한 속성을 갖는 개체의 비율 p에 대한 점추정은 크기 n인 확률분포에서 특정한 속성을 갖는 개체 의 수를 X라 할 때, 모집단 비율의 p의 추정치로 사용 ▣ 표본비율 의 분포의 특성 :

4.4 표본집단을 추출하는 방법(선택적) ▣ 합리적인 표본 추출방법 : ▣ 합리적인 표본 추출방법 : – 통계분석 대상이 되는 모집단이 명확하게 정의되면, 이모집단으로 부터 몇 개의 데이터를 어떤 방법에 의헤 표본으 로 선정할 것인지를 결정 ▣ 확률적 표본 추출 : 무작위 표본추출, 계층화 표본추출, 군집 표본 추출, 체계적 표본 추출 ▣ 단순 무작위 표본추출법(simple random sampling) : – 모집단 내의 모든 구성요소들이 표본에 포함도리 확률을 동일하게 하는 방법

4.4 표본집단을 추출하는 방법(선택적) ▣ 군집 표본추출법(cluster sampling) : 에서 단순무작위 추출방법을 의미 ▣ 층화 표본추출법(stratified sampling) : – 층화 표본 추출은 우선 모집단을 층(strata)이라고 불리는 하위 그룹으로 분류한 다음 각 층으로부터 무작위 추출을 시행하여 개체를 선택하는 방법

4.4 표본집단을 추출하는 방법(선택적) ▣ 계통 표본추출법(systematic sampling) : – 무작위 추출이 가질 수 있는 단점인 시간이 많이 소요되고 표본이 어느 한쪽으로 편중될 수 있는 단점을 보완하기 위하여 시간적으로 또는 공간적으로 일정한 간격을 두고 표본을 추출하는 방법 ▣ 비확률적 표본 추출 : 판단 표본추출, 편의 표본추출, 퀴터 표본 추출 ▣ 판단 표본추출법(judgment sampling) : – 판단 표본추출은 모집단을 가장 잘 대표할 수 있는 표본을 의사결정자의 판단에 의거하여 선택하게 하는 방법 ▣ 편의 표본추출법(convenience sampling) : – 편의 표본추출은 표본을 구성할 수 있는 가장 편리한 개체를 선택하는 방법 ▣ 퀴터 표본추출법(quota sampling) : – 퀴터 표본추출은 의사결정자의 재량에 의해 그룹별로 미리 할당을 한 후 각 하위그룹별로 가장 편리한 개체를 선택하는 방법