Download presentation
Presentation is loading. Please wait.
1
제 16장 비율의 정확성 머리말 신뢰구간 신뢰구간의 해석
2
INDEX 1 머리말 2 신뢰구간 3 신뢰구간의 해석
3
1. 머리말 EX) 건달의 지지율 조사 모집단: 유권자 10만 명의 선거구 표본: 유권자 2,500명 무작위 추출
표본비율의 표준오차(SE) EX) 건달의 지지율 조사 모집단: 유권자 10만 명의 선거구 표본: 유권자 2,500명 무작위 추출 표본내 지지율: 53% (2500명 중 1328명이 지지) 추정된 지지율은 실제의 지지율과 얼마나 다른가? - 표본비율은 확률오차 때문에 모비율과 다름 - 이 둘간의 차이를 대략적으로 말해주는 것이 바로 표본비율의 표준오차
4
1. 머리말 표준오차의 계산 건달: 예측이 3% 이상 틀릴 수 있을까요? 모집단: 각 유권자마다 한장씩 10만장의 카드가 든 상자 (건달을 지지=1, 지지하지 않으면=0) 표본: 2,500장 카드 무작위 추출 상자의 표준편차= 표본에서 건달을 지지하는 유권자수의 표준오차= 표본지지율의 표준오차=25/2500=1% (3%는 표준단위로 3단위 차이) 건달의 당선은 거의 확실하다. 구성비가 알려지지 않은 0-1 상자에서 표본을 추출할 때 상자의 표준편차는 상자의 구성비를 표본의 구성비로 대체하여 추정한다. 표본크기만 크면 이러한 추정은 믿을 만하다.
5
INDEX 1 머리말 2 신뢰구간 3 신뢰구간의 해석
6
신뢰도(confidence level)와 신뢰구간(confidence interval)
2. 신뢰구간 신뢰도(confidence level)와 신뢰구간(confidence interval) 조사원: 확률오차가 2% 이내일거라고 95% 확신하고 있습니다. 51% 53% 55% 2SE 표본비율 표본비율 = 모비율 + 확률오차 모집단에서의 지지율 = 53%1% (51%, 55%): 95%신뢰도의 신뢰구간 표본비율 1SE의 구간은 68%의 신뢰도를 가진 신뢰구간 표본비율 2SE의 구간은 95%의 신뢰도를 가진 신뢰구간 표본비율 3SE의 구간은 99.7%의 신뢰도를 가진 신뢰구간
7
2. 신뢰구간 모집단: 유권자 25,000명의 도시 표본: 유권자 1,600명 무작위 추출
[보기 1]-여당지지율 구하기 모집단: 유권자 25,000명의 도시 표본: 유권자 1,600명 무작위 추출 표본내 지지율: 57% (1,600명 중 917명의 지지) 상자의 표준편차 = 표본내 여당지지자의 표준오차 = 표본내 여당지지율의 표준오차 = 20/1,600=1.25(%) 모집단에서의 여당지지율에 대한 95% 신뢰구간 = 57% 21.25%
8
표준오차를 구할 때 모비율 대신 표본비율을 사용했다. 표본비율의 확률히스토그램 대신 정규분포곡선을 썼다.
2. 신뢰구간 신뢰도의 해석 신뢰도는 ‘정확히 얼마’라고 말하기보다 ‘대략 얼마’라고 말해야 한다. 표준오차를 구할 때 모비율 대신 표본비율을 사용했다. 중심극한정리를 이용하고 있으므로 표본이 커야 정당화된다. 표본비율이 0% 또는 100%에 가까울 경우 표본비율의 분포를 정규분포로 근사시키려면 표본크기가 충분히 커야 한다. 표본비율이 50%에 가까운 경우는 표본크기가 아주 크지 않아도 정규분포로 근사시킬 수 있다. 표본비율의 확률히스토그램 대신 정규분포곡선을 썼다. 표본이 커지면 더 정확해진다.
9
INDEX 1 머리말 2 신뢰구간 3 신뢰구간의 해석
10
3. 신뢰구간의 해석 [보기1]여당지지율에 대한 95% 신뢰구간은 이다.
[보기1]여당지지율에 대한 95% 신뢰구간은 이다. 모집단에서의 여당지지율이 54.5%에서 59.5% 사이에 있을 가능성이 95% 이다? 신뢰구간은 표본에서 결정되며, 표본이 바뀌면 신뢰구간도 달라진다. 신뢰구간의 중심도 달라지고, 신뢰구간의 길이도 달라진다. 가능한 모든 표본들 중 95%가 ‘표본비율2SE’라는 신뢰구간 내에 모비율을 포함하고 나머지 5%는 포함하지 않는다.
11
3. 신뢰구간의 해석 상자 안 붉은 구슬의 비율에 대한 95% 신뢰구간 상자 안 붉은 구슬의 비율= 80% (모비율: 수직선)
100번의 조사를 반복 각각의 조사에서 2,500개의 구슬을 무작위 추출 100개의 서로 다른 표본에서 구한 100개의 신뢰구간이 그려져 있다. 신뢰구간은 표본마다 다르게 나타난다. 100개의 신뢰구간 중 실제로 94개의 신뢰구간이 모비율을 포함하고 있다.
Similar presentations