표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.

Slides:



Advertisements
Similar presentations
채소야 놀자 : 브로콜리.  겨자과에 속하는 짙은 녹색채소로 ‘ 녹색 꽃양 배추 ’ 라고도 불립니다.  샐러드, 스프, 스튜 등 서양음식에 가장 많이 사용하는 채소 중 하나입니다.  구입 시, 송이가 단단하면서 가운데가 볼록 하게 솟아올라 있고 줄기를 잘라낸 단면이.
Advertisements

산업시스템분석 임성수 차수길 장연식 주혜림 7조7조.
가. 3 일 취업완성 ! 성취반 _ 성공 취업 반 1 일차 시간 프로그램 내용비고 17:00 ~ 17:10 출석 및 일정 안내 17:10 ~ 18:10 취업 전략 및 채용 프로세스 이해 18:10 ~ 19:30 입사지원서 작성법 및 주요 기업 에세이 작성법 19:30 ~
10장. 시기별 학급경영 11조 염지수 이 슬 권용민 신해식.
일본 근세사. (1) 에도막부의 개창 ( ㄱ ) 세키가하라의 전투 (1600) - 히데요시의 사후 다섯 명의 다이로 ( 大老 ) 가운데 최대 영지 (250 만석 ) 를 보유하고 있던 도쿠가와 이에야스가 급부상. 이에 이에야스와 반목해 온 이시다 미쓰나리 ( 石田三成 ),
구 분현존 무창계사 사육장 (1,000 평기준 ) 신개념 가금류사육장 (1,000 평기준 특허보유유럽에서 약 50 여년전 개발 2008 년 특허개발 ( 송백영농조합 ) 계사구조 별도 독립된 단층계사 500 평ⅹ 2 동 건축 많은 사육장면적 확보시 계사를 추가로 신축 500.
아니마 / 아니무스 송문주 조아라. 아니마 아니마란 ? 남성의 마음속에 있는 여성적 심리 경향이 인격화 한 것. 막연한 느낌이나 기분, 예견적인 육감, 비합리적인 것에 대 한 감수성, 개인적인 사랑의 능력, 자연에 대한 감정, 그리.
대구가톨릭대학교 체육교육과 06 학번 영안중학교 체육교사 신웅섭 반갑습니다. 반야월초등학교 축구부 대륜중학교 축구부 대륜고등학교 대구가톨릭대학교 차석 입학 대구가톨릭대학교 수석 졸업 2014 년 경북중등임용 체육 차석 합격 영안중학교 체육교사 근무 소개.
일장 - 1 일 24 시간 중의 명기 ( 낮 ) 의 길이 ( 밤은 암기, 낮은 명기 ) 광주기성 - 하루 중 낮의 길이의 장단에 따라 식물의 꽃눈 형성이 달라지는 현상 일장이 식물의 개화현상을 조절하는 중요한 요인 단일식물 - 단일조건에서 개화가 촉진되는 식물 장일식물.
관세 부과의 효과. 관세장벽 비관세 장벽 : 쿼터 ( Quota ), 검역 등 관세 이외의 무역장벽 종량관세 종가관세 무역장벽.
2 학년 6 반 1 조 고은수 구성현 권오제 김강서.  해당 언어에 본디부터 있던 말이나 그것에 기초하여 새로 만들어진 말  어떤 고장 고유의 독특한 말  Ex) 아버지, 어머니, 하늘, 땅.
지하철 안내 앱 소개 제작자 : 손성준 P.S 이 사진은 내용과 관계없음을 명백히 알립니다.( 솔직히 전기동차라는 공통점이 있긴 하지만 ) 그리고 본인이 촬영하였음을 알립니다.
1 통계를 왜 공부해야 하나 ? Dept. of Public Administration Chungnam National University.
효과적인 금연법 산재의료관리원 동해병원 건강관리센타.
우리나라 전통의 무술, 태권도 5학년 8반 김유승.
2014년도 교원 및 기간제교사 성과상여금 전달교육 개 회 국기에 대한 경례 - 인사말
선진 고양교육 “유아교육 행정 업무 연수” 유치원 회계실무 및 유아학비 연수 경기도고양교육청.
자살 사례 분석 경영학과 백승용 경영학부 하수정 경영학부 이은옥
내 외국인 친구의 집은 어디인가? 활동계획서 및 자국문화 소개계획서 - 팀(원) 모집용-
묵자 겸애, 비명, 비공, 상현, 상동, 천지, 명귀, 삼표 법.
확률변수의 기대값, 분산 등.
내 아이를 위한 구강관리.
제16장 원무통계 • 분석 ☞ 통계란 특정의 사실을 일정한 기준에 의하여 숫자로 표시한 것을 말한다.통계로서 활용할 수 있는 조건으로는 ① 동질성을 지녀야 하고 ② 기준이 명확하고 ③ 계속성이 지속되어야 하며 ④ 숫자로 표시하여야 한다 경영실적의.
돼지가격 대표 기준 ‘탕박’변경 관련 설명자료
학습 주제 p 용해도 차이로 물질 분리하기.
빛과소금의교회 바이블스쿨 교재 8시간 만에 끝내는 성경의 맥(脈) 잡기 장창영 목사.
서울지방세무사회 부가세 교육 사진클릭-자료 다운 세무사 김재우.
Excel과 통계학.
치매의 예방 김 은민 윤금 노인요양원 치매의.
아파트관리비 청구서 이용 프로세스 안내 ㈜한국전산기술.
CHAPTER 21 UNIVARIATE STATISTICS
제4장 개별자산 /포트폴리오 투자결정 4.1 기대수익률과 위험의 의의 4.2 개별자산 기대수익률과 위험의 측정
패턴인식 개론 Ch.5 확률 변수와 확률 분포.
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
마산에 대하여 만든이 : 2204 김신우, 2202 권성헌.
확 률 변 수 2 1 이산확률변수 2 연속확률변수 3 기대값.
유독물 및 취급제한∙금지물질 관리자 교육 취급시설별 관리기준 2014 한강유역환경청 화학물질관리과.
Week 10:확률변수(Random Variable)
문찬식 현대적 원자모형.
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
Inferences concerning two populations and paired comparisons
Association between two measurement variables Correlation
: Two Sample Test - paired t-test - t-test - modified t-test
비, 비율, 퍼센트 실과교육과 김 화 민.
Statistical inference I (통계적 추론)
The normal distribution (정규분포)
소방시설 자동산정 프로그램.
이론적 확률분포 앞서: 확률변수의 임의의 확률분포 수학의 이론으로부터 도출될 확률분포 이항분포, Poisson 분포, 정규분포
문서의 제목 나눔고딕 45pt 작성자 | 소속팀 / 상위부서 | 이 문서는 나눔글꼴로 작성되었습니다. 설치하기.
통계방법의 이해.
韓國語 한국어 한국어.
6장 마케팅 조사 박소현, 김중호, 박기찬.
한밭대학교 창업경영대학원 회계정보학과 장 광 식
2015 학년도 신입생 오리엔테이션 학 사 소 개.
제 4 장 유전자 알고리즘 (Genetic Algorithm)
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
음양오행과 물리학 조 원 : 김용훈, 양범길, 박수진, 윤진희, 이경남, 박미옥, 박지선 (11조)
악취저감 / 친환경 축산(농장)을 위한 시험보고서
문서의 제목 문서의 개요 작성자 이름 소속팀 소속팀 작성년월일
1월 교회학교 진급예배 및 성탄절 음악예배 찬 양 기 도 교 회 소 식 특 순 성 경 봉 독 말 씀 찬 양 축 도 인 도 자
뜨거운 햇살을 받으며 양 손에 도시락 두 개를 들고, 콧 노래를 부르며, 시골 길을 걷고 있는 한 아이가 있었어요
이야기 치료에 대하여 <8조 학문적 글쓰기 발표> 주희록 최은지
의학자료분석론 교재: 강의록 Rosner B, Fundamentals of Biostatistics, 7th ed. Brooks/Cole Cengage Learning, Canada, 강의 평가: 출석 20% 숙제 30% 기말고사 50%
기 술 통 계 학 6 1 기술통계학 2 자료의 정리 3 위치척도 4 산포의 척도.
제7장 계수치의 추정과 검정 계량치: 정규분포 계수치: 이항분포 또는 포아송분포
경영통계학 제1장 통계학은 어떤 학문인가? What is Statistics? 1.1.
표본분포 개요 랜덤추출법 표본분포 모양과 CLT.
근골격계 질환 예방교육.
중국문학개론 한부와 겅건안문학 중어중국학과 ㅇ이진원 한부와 건안문학.
Presentation transcript:

표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포

1 모집단분포와 표본분포 모집단 분포와 확률표본의 의미, 표본분포와 통계량에 대하여 알아본다.

▶ ▶ 모집단 분포(population distribution) : 어떤 통계적 실험의 대상이 되는 모든 대상물인 모집단의 정보로부터 얻어지는 확률 분포 ▶ 모수(parameter) : 모집단의 특성을 나타내는 수치 모평균, 모분산, 모표준편차, 모비율, 모상관관계 대부분의 모집단 분포는 완전하게 알려진 것이 없으며, 따라서 모집단 분포의 정확한 중심의 위치나 산포도 등을 알 수 없다. 모집단의 확률분포를 비롯한 특성을 알기 위하여 전수조사를 한다는 것은 경제적, 공간적 또는 시간적인 제약에 의하여 거의 불가능 표본을 선정

? 어느 배터리 제조회사에서 특별한 모델의 cell phone에 사용될 새로운 배터리를 생산하고자 한다면, 임의 추출 정보수집 추 론 어느 배터리 제조회사에서 특별한 모델의 cell phone에 사용될 새로운 배터리를 생산하고자 한다면, 이 회사에서 생산될 배터리의 수명이 어떠한 확률분포에 따르는지 알 수 없다. 따라서 몇 개의 배터리를 표본으로 추출하여 실제로 cell phone에 사용하여 얻은 배터리 수명에 대한 측정값을 구한다. 그러면 이러한 측정값들(표본)은 이 회사에서 생산될 배터리들의 확률분포(모집단 분포)로부터 추출된 표본을 구성하게 된다. 이때 앞으로 생산될 배터리의 수명은 갖는 알려지지 않은 확률분포 f(x)에 따른다.

▶ ▶ 확률표본(random sample) : 모집단을 형성하고 있는 모든 대상들이 선정될 가능성을 동등하게 부여하고, 객관적이고 임의적으로 각 대상을 선정한 표본 ▶ 통계량(statistics) : 표본으로 산출된 통계적인 양 표본평균, 표본분산, 표본표준편차, 표본비율, 표본상관관계 통계량은 표본을 어떻게 선정하느냐에 따라서 그 값이 다르게 나타난다. 즉, 동일한 모집단에서 동일한 크기의 표본을 선정하더라도 각 표본의 평균은 서로 다르게 나타남. 통계량은 확률변수 통계량의 확률분포를 표본분포라 한다.

x2 : 두 번째 추출된 관찰값 X2 ∼ f(x) E(Xi) =  … Var(Xi) = 2  : 모평균 s2 : 모분산 모집단 x1 x2 x8 x9 xn x3 x7 x4 x5 x6 x10 표 본 … x1 : 첫 번째 추출된 관찰값 X1 ∼ f(x) x2 : 두 번째 추출된 관찰값 X2 ∼ f(x) E(Xi) =  … Var(Xi) = 2 xn : n 번째 추출된 관찰값 Xn ∼ f(x) 표본평균 : 표본분산 : X =  Xi S2 =  (Xi – X )2 1 n n-1 i = 1 관찰된 표본평균 : 관찰된 표본분산 : x =  xi s2 =  (xi – x )2

예 생산된 10개의 배터리를 표본으로 추출하여 얻은 측정값 835  637  764  830  768  840  790  835  840  910 표본평균과 표본분산의 관찰값 = ? 예 관찰된 표본평균 : 관찰된 표본분산 : x =  xi = 804.9 s2 =  (xi – 804.9 )2 = 5488.77 1 9 i = 1 10 f(x) : 미지의 모집단 분포  : 모평균 2 : 모분산 전체 배터리 수명 764 835 637 768 830 840 790 910 표 본

2 표본평균의 분포 표본평균의 평균과 모평균, 표본평균의 분산과 모분산의 관계 그리고 중심극한정리에 의한 표본평균의 분포의 변화, 두 독립인 표본평균의 차에 대한 분포 등에 대하여 알아본다.

☞ 1) 표본평균과 모평균(비복원 추출) x1과 x2 그리고 x가 취할 수 있는 모든 경우 80 63 76 77 84 79 87.5 91 84 77.0 63 71.5 80 85.5 73.5 71.0 79 82.0 85.0 70.0 77 81.5 63.0 79.5 69.5 76 83.5 84.0 80.0 78.0 77.5 80.5 76.5 78.5 x x2 x1  x1  x1과 x2 그리고 x가 취할 수 있는 모든 경우 80 63 76 77 84 79 91 2개 x1 x2 표본평균 : X = x1 + x2 2

X 의 확률분포와 확률히스토그램 x X의 평균 : E(X) = 77.7 X의 평균 : Var(X) = 31.3 0.0444   0.0444 0.0222 0.0889 0.0667 확률 87.5 85.5 85.0 84.0 83.5 82.0 81.5 80.5 80.0 79.5      78.5 78.0 77.5 77.0 76.5 73.5 71.5 71.0 70.0 69.5 63.0 x X의 평균 : E(X) = 77.7 X의 평균 : Var(X) = 31.3

x 63 76 77 79 80 84 91 확률 0.2 0.1 모집단의 확률분포 모평균 :  = E(X) = 77.7 모분산 : 2 = Var (X) = 70.41 2 n N - n N - 1 • 70.41 2 10 - 2 10 - 1 = = 31.3 = Var(X) 표본평균의 평균과 모평균은 동일하다. 2 n N - n N - 1 • 표본평균의 분산 =

☞ 2) 표본평균과 모평균(복원 추출) x1과 x2 그리고 x가 취할 수 있는 모든 경우 80 63 76 77 84 79 91 2개 x1 x2 0.01 0.02 91.0 87.5 85.5 85.0 84.0 83.5 77.0 91 0.04 82.0 81.5 80.5 80.0 73.5 84 79.5 78.5 78.0 71.5 80 79.0 77.5 71.0 79 76.5 70.0 77 76.0 69.5 76 63.0 63    x1       x2     표본평균 : x1 + x2 2 X = x x 의 확률

X 의 확률분포와 확률히스토그램 x X의 평균 : E(X) = 77.7 X의 분산 : Var(X) = 35.21 2 70.41 0.01 0.04 0.02 0.06 0.08 확률 91.0 87.5 85.5 85.0 84.0 83.5 82.0 81.5 80.5 80.0 79.5 79.0      0.05 78.5 78.0 77.5 77.0 76.5 76.0 73.5 71.5 71.0 70.0 69.5 63.0 x X의 평균 : E(X) = 77.7 X의 분산 : Var(X) = 35.21 2 70.41 = 35.21 2 = 모분산 : 2 = Var (X) = 70.41 표본평균의 평균과 모평균은 동일하다. 2 n 표본평균의 분산 =

☞ 3) 표본평균과 모평균의 비교 ⊙ 모평균 와 모분산 2을 갖는 크기 N인 모집단으로부터 크기 n인 확률표본을 추출할 경우  = E(X) 복원추출인 경우 X 비복원추출인 경우 2  모집단 분 산 평 균 구 분 n N - n N - 1 • ※ N이 충분히 크면 비복원 추출과 복원 추출이 동일한 결과를 나타낸다. 특별한 언급이 없는 한 복원 추출인 경우를 다룬다.

☞ 4) 중심극한정리에 의한 표본평균의 변화 주사위 2번 던지기 게임 (n=2인 경우) 표본평균 : X = x1 + x2 2 의 확률분포 ? X1과 X2의 결합분포 1 1/6  fX (x)   1/36 6 5 4 3 2  fX (x)   x1 x2 X1과 X2가 취하는 값 : 1, 2, 3, 4, 5, 6 2 P(X1 = x, X2 = y) = P(X1 = x)• P(X2 = y) (x1, x2)의 취하는 값 : (1, 1), (1, 2), …, (6, 6) x = x1 + x2 2 가 취하는 값 : 1, 1.5, 2, 2.5 3, 3.5 4, 4.5 5, 5.5, 6 1

표본평균 X 의 확률분포 : X E(X) = xP(X=x) = 3.5 E(X2) = x2 P(X=x) = 13.7083 0.028 0.056 0.083 0.111 0.139 0.166 확률 6 5.5 5 4.5 4 3.5 3 2.5 2 1.5 1         X E(X) = xP(X=x) = 3.5 E(X2) = x2 P(X=x) = 13.7083 Var(X) = E(X2) – E(X)2 = 1.4583 모평균 :  = (1+6)/2 = 3.5 모분산 : 2 = (62 -1)/12 = 2.9167 표본 평균 모집단  = E(X) = 1.5, 2 = 2Var(X) = 2.9167

주사위 3번 던지기 게임 (n=3인 경우) x1 + x2+ x3 표본평균 : X = 의 확률분포 ? 3 0.005 0.014 0.028 0.046 0.069 0.097 0.116 0.125 확률 6.00 5.67 5.33 5.00 4.67 4.33 4.00 3.67         3.33 3.00 2.67 2.33 2.00 1.67 1.33 1.00 X  = E(X) = 1.5, 2 = 3Var(X) = 2.9167

주사위 4번 던지기 게임 (n=4인 경우) x1 + x2+ x3+ x4 표본평균 : X = 의 확률분포 ? 4 X 0.001 0.003 0.008 0.015 0.027 0.043 0.062 0.080 0.097 0.108 확률 6.00 5.75 5.50 5.25 5.00 4.75 4.50 4.25 4.00 3.75 0.113 3.50 3.25 3.00 2.75 2.50 2.25 2.00 1.75 1.50 1.25 1.00         X 주사위 5번 던지기 게임 (n=5인 경우) 표본평균 : 의 확률분포 ? X = x1 + x2+ x3+ x4 + x5 5 0.0001 0.0006 0.0019 0.0045 0.0090 0.0162 0.0264 0.039 0.0541 0.0693 0.0838 0.0945 0.1002 확률 6.0 5.8 5.6 5.4 5.2 5.0 4.8 4.6 4.4 4.2 4.0 3.8 3.6 0.0398 3.4 3.2 3.0 2.8 2.6 2.4 2.2 2.0 1.8 1.6 1.4 1.2 1.0 X

● 모집단분포와 크기에 따른 표본평균의 분포 비교 n이 커질수록 표본평균의 분포는 종모양에 가까워진다.

( ) ( ) f(x) : 미지의 모집단 분포  : 모평균, 2 : 모분산 Xi ~ i.i.d. f(x) ,  : 모평균, 2 : 모분산 Xi ~ i.i.d. f(x) , i = 1, 2, 3, …, n E(Xi) = , Var(Xi) = 2 크기 n인 표본 E(Xi) = , Var(Xi) = 2 , i = 1, 2, 3, …, N 복원추출 1 n i=1 X =  Xi의 평균과 분산 : E(X) = E  Xi =  E(Xi) =   = (n) =  1 n ( ) i=1 Var(X) = Var  Xi =  Var(Xi) =  2 = (n2) = 2/n n2 S.D(X) = Var(X) =  X ~ N , . 2 n ( ) ※중심극한정리에 의하여 미지의 모집단 분포 f(x)에 대하여

모집단 분포가 다음과 같은 모집단으로부터 비복원추출에 의하여 크기 2인 확률표본 X1, X2에 대한 표본평균의 확률분포와 평균 그리고 분산 x 1 2 3 4 f(x) 0.25 모집단 {1,2,3,4}에서 비복원추출에 의하여 크기 2인 확률표본을 뽑을 수 있는 모든 경우 : {1, 2}, {1, 3}, {1, 4}, {2, 1}, {2, 3}, {2, 4}, {3, 1}, {3, 2}, {3, 4}, {4, 1}, {4, 2}, {4, 3} X가 취할 수 있는 값들의 집합 : {1.5, 2, 2.5, 3, 3.5} X = 1.5 {X1 = 1, X2 = 2}, {X1 = 2, X2 = 1} X = 2 {X1 = 1, X2 = 3}, {X1 = 3, X2 = 1}, X = 2.5 {X1 = 1, X2 = 4}, {X1 = 2, X2 = 3}, {X1 = 3, X2 = 2}, {X1 = 4, X2 = 1} X = 3 {X1 = 2, X2 = 4}, {X1 = 4, X2 = 2} X = 3.5 {X1 = 3, X2 = 4}, {X1 = 4, X2 = 3}

P(X1 = i, X2 = j) = P(X1 = i)• P(X2 = j|X1 = i) 1 4 3 12 = 비복원추출에 의하여 표본을 선정 P(X1 = i, X2 = j) = P(X1 = i)• P(X2 = j|X1 = i) 1 4 3 12 • = , i, j = 1, 2, 3, 4, i ≠ j X의 확률분포 : 1/6 2/6 확률 3.5 3 2.5 2 1.5 x E(X) = 1.5 + 2 + (2.5)•2 + 3 + 3.5 6 = 2.5 E(X2 ) = 2.25 + 4 + (6.25)•2 + 9 + 12.25 = 6.67 Var(X) = E(X2 ) – E(X)2 = 0.417

( ) 예제1의 모집단분포로부터 크기 10인 표본을 임의 추출하였을 때, (1) X의 평균과 분산 모집단 분포 : x 1 2 3 4 f(x) 0.25 (1)  = 2.5, 2 = 1.25, n = 10  = 2.5,  2 = = 0.125 X 2 10 (2) 표본평균의 근사분포 : X ~ N(2.5, 0.125) . P(2.75 ≤ X ≤ 3.5) = P ≤ X ≤ 2.75 – 2.5 0.354 3.5 – 2.5 ( ) = P(0.71 ≤ Z ≤ 2.82) = (2.82) – (0.71) = 0.9976 – 0.7611 = 0.2365 .

( ) 확률분포가 N(60, 4)인 모집단에서 크기 10인 표본을 임의 추출하였을 때, (1) X 의 확률분포, 평균과 분산 (1) X1, X2, …, X10 ~ i.i.d. N(60, 4) E(X) =  = 60, Var(X) = 2/10 = 0.4 X = Xi ~ N(60, 0.4) 1 10 (2) P(58.5 ≤ X ≤ 61.5) = P ≤ X ≤ ( ) = P(-2.37 ≤ Z ≤ 2.37) = 2[(2.37) – 0.5] = 2(0.9911 – 0.5) = 0.9822 58.5 – 60 61.5 – 60 0.4 .

( ) ( ) ( ) ( ) 고교 3학년 학생 1,000명을 대상으로 수학 모의시험을 실시한 결과 평균 68.3이고 분산 1.5인 정규분포 (1) 임의로 한 명을 선정하였을 때, 이 학생이 69점 이상일 확률 (2) 10명을 임의로 선정하였을 때, 이 학생들의 평균 점수가 69점 이상일 확률 (3) 10명의 평균 점수가 상위 5% 안에 들어가기 위한 최하 점수 (1) 임의로 선정한 학생의 점수 : X ∼ N(68.3, 1.5) P(X ≥ 69) = P ≥ ( ) = P(Z ≥ 0.57) = 1 - (0.57) = 1 – 0.7157 = 0.2843 X – 68.3 1.5 69 – 68.3 (2) 10명의 평균점수 : X ~ N(68.3, 0.15) P(X ≥ 69) = P ≥ ( ) = P(Z ≥ 1.81) = 1 - (1.81) = 1 – 0.9649 = 0.0351 X – 68.3 0.15 69 – 68.3 (3) z0.05 = 1.645이므로 P(X ≥ x0) = P ≥ ( ) X – 68.3 0.15 x0 – 68.3 = P Z ≥ = P(Z ≥ z0.05) = 0.05 ( ) x0 – 68.3 0.15 = z0.05 = 1.645 ; x0 = 68.937 ; 69점이상

☞ ( ) ( ) ( ) 5) 두 표본평균의 차에 대한 확률분포 Xi ~ N(1,  1 ), i = 1, 2, …, n ; Yj ~ N( 2,  2 ), j = 1, 2, …, m ; 2 X =  Xi ~ N( 1, 1 /n) 1 n i = 1 2 Y =  Yj ~ N( 2, 2 /m) 1 m j = 1 2 X와 Y가 독립이므로 X – Y ~ N  1 -  2, ( )  2 2 m  1 n +  1 =  2 = 2 이면, 1 ( ) X – Y ~ N  1 -  2,  2 ( )

( ) ( ) ( ) Xi ~ f1(x) ; 평균  1, 분산  1, i = 1, 2, …, n ; Yj ~ f2(x) ; 평균  2, 분산  2, j = 1, 2, …, m ; 2 임의의 확률분포인 경우 X =  Xi ~ N( 1,  1 /n) 1 n i = 1 2 Y =  Yj ~ N( 2,  2 /m) m j = 1 . X와 Y가 독립이므로 X – Y ~ N 1 - 2, ( )  2 2 m 1 n + . 1 = 2 = 2 이면, 1 ( ) X – Y ~ N 1 - 2, 2 ( )

( ) ( ) 남학생 200명과 여학생 150명을 임의로 선정한 결과 남학생의 평균 몸무게가 여학생의 평균 몸무게보다 22 kg이상 더 많을 근사확률 몸무게 평균 분산 남학생 69.75 12.25 여학생 47.25 15.15 남학생의 평균 몸무게 : X 여학생의 평균 몸무게 : Y X ~ N 69.75, = N(69.75, (0.25)2 ) ( ) . 12.25 200 Y ~ N 47.25, = N(47.25, (0.318)2 ) 15.15 150 X – Y ~ N(22.5, (0.405)2 ) . P(X ≥ Y +22) = P(X - Y ≥ 22) =P ≥ ( ) = P(Z ≥ -1.23) = P(Z ≤ 1.23) = 0.8907 . X – Y -22.5 0.4056 22 -22.5

3 정규모집단에 관련된 분포의 응용 표본분산과 합동표본분산에 관련된 분포, 표본표준편차에 관련된 분포 그리고 두 표본분산의 비(ratio)에 관한 분포 등에 대하여 알아본다.

☞ ( ) ( ) 1) 표본분산에 대한 확률분포 Zi ~ 2(n) , i = 1, 2, …, n X ~ N( , 2/n) Z2 ~ 2(1) Zi ~ 2(n) , i = 1, 2, …, n i=1 n 2 Z = X -  ~ N(0, 1)  Zi ~ i.i.d N(0, 1), i = 1, 2, …, n Zi =  (Xi – )2 =  [(Xi – X) + (X – )]2 i=1 n 2 1 2 1 2 n = (Xi – X)2 + (X – )2 i=1 = (Xi – X)2 + i=1 n n-1 2 1 • X –   ( ) 2 X – m n  ( ) 2 n-1 2 = S2 +

( ) Zi ~ 2(n) X –  n  ~ 2(1) n-1 2 S2 ~ 2(n-1) : 독립 n-1 2 ( ) 2 ~ 2(1) n-1 2 S2 ~ 2(n-1) : 독립 Zi ~ 2(n) i=1 n 2 n-1 2 S2 = n-1 E E(S2) = 2 카이제곱분포의 기대값 : n-1 2 S2 V = 모분산을 추정이나 검정하기 위한 통계량 :

정규모집단 N(, 25)에서 추출된 크기 5인 확률표본 [104, 110, 100, 98, 106] (1) 카이제곱분포의 자유도를 구하고, 관찰된 통계량의 값 (2) S2이 (1)에서 구한 통계량의 값보다 클 근사확률 (1) 확률표본의 크기가 5이므로 카이제곱분포의 자유도는 4 104 + 110 + 100 + 98 + 106 5 표본평균 : x = = 103.6 s2 = (xi – 103.6)2 = =22.8 i=1 5 1 4 91.2 표본분산 : 모분산이 25이므로 n-1 2 S2 V = 4•(22.8) 25 = = 3.648 관찰된 통계량의 값 : (2) d.f.=4에 대하여 P(V > 3.36) = 0.5, P(V > 5.39) = 0.25 P(V > 3.648) ≒ 0.404

☞ 2) 표본표준편차에 관련된 확률분포 Xi ~ N(, 2) , i = 1, 2, …, n n-1 2 S2 ~ 2(n-1) X -  ~ N(0, 1) , n  t- 분포의 정의에 의하여 X -  n  2 n -1 S2 ~ t(n-1) s =

예제 1에서 표본표준편차를 구하고, P(|X – | < t0) = 0.99인 t0을 구하고, s2 = 22.8, s = 22.8 = 4.775 , X -  ~ t(4) n s 이므로 x = 103.6 이고 X -  n s 5 4.775 = 1.135 P(|T| < t0.005) = 0.99 ; t0.005 = 4.604 한편, 구하고자 하는 t0 와  의 범위 : t0 = t0.005 • (1.135) = 4.604 • (1.135) = 5.226 |x – | < 5.226 ; |103.6 – | < 5.226 ; 98.374 <  < 108.828

☞ 3) 두 표본분산의 비(ratio)에 관련된 확률분포 S2 =  (Xi – X )2 1 n-1 S2 =  (Yj – Y )2 j = 1 m 2 m-1 독립 n-1 2 S2 ~ 2(n-1) , 1 m-1 S2 ~ 2(m-1) 2 S1 / 1 S2 / 2 2 (n-1) (m-1) = ~ F(n-1, m-1)

추출된 남학생과 여학생의 폐활량의 분산의 비가 x0이상일 확률이 0.05일 때, x0 = ? 남학생의 폐활량 ~ N(1, 1.2) 여학생의 폐활량 ~ N(2, 1.0) 남•여학생 각각 16명과 20명씩 임의로 추출할 경우, 추출된 남학생과 여학생의 폐활량의 분산의 비가 x0이상일 확률이 0.05일 때, x0 = ? 2 2 추출된 남학생의 표본분산 : S1 추출된 남학생의 표본분산 : S2 S1 / 1.2 S2 / 1.0 2 ~ F(15, 19) S1 / 1.2 S2 / 1.0 2 0.05 = P S1 / S2 1.2 > 2.23 = P(S1 / S2 > 2.676) = P x0 = 2.676

☞ [ ] 4) 동일한 모분산을 갖는 두 모집단에 대한 합동표본분산 Xi ~ N(1, 2) , i = 1, 2, …, n Yj ~ N(2, 2) , j =1, 2, …, m S2 =  (Xi – X )2 1 n-1 i = 1 n S2 =  (Yj – Y )2 j = 1 m 2 m-1 독립 n-1 2 S2 ~ 2(n-1) , 1 m-1 S2 ~ 2(m-1) 2 합동표본분산(pooled sample variance) : S2 = (Xi – X )2 +  (Yj – Y )2 i = 1 n j = 1 m 1 n+m-2 [ ] p

합동표본분산의 확률분포 S2 = (Xi – X )2 + (Yj – Y )2 n+m-2 2 1 = (Xi – X)2 p n+m-2 2 1 = (Xi – X)2 i=1 n-1 • + (Yj – Y)2 m-1 j=1 S2 + S2 2 =  2(n+m-2) ⊙ 합동표본분산의 다른 표현 방법 : Sp = [(n-1)S1 + (m-1)S2] 2 1 n+m-2

독립인 두 정규모집단 N(2, 25)와 N(5, 25)에서 각각 크기 5인 확률표본을 추출 P(Sp > 20.09) = ? 2 V = 8Sp / 25 ~ 2(8) 2 이므로 P(Sp > 20.09) = P 2 8Sp 25 8•(20.29) > ( ) = P(V > 6.4288) = 0.01

☞ ( ) ( ) 5) 합동표본표준편차에 관련된 확률분포 (미지의 모분산) X = Xi ~ N(1,  /n) 1 n 2 Y =  Yj ~ N(2,  /m) 1 m j = 1 2 1 n m + ( ) X – Y ~ N 1 - 2, 2 ( ) X - Y - (1 – 2) (1/n) + (1/m)  2 n +m -2 S2 n + m -2 p = Sp ~ t(n + m – 2)

예전 방식과 새로운 방법에 의한 수명에 대한 예비실험 : 평균수명이 동일하다 타이어 공정 방법 예전 방식과 새로운 방법에 의한 수명에 대한 예비실험 : 평균수명이 동일하다 새로운 방법에 의하여 생산된 타이어가 예전 방식에 의하여 생산된 타이어에 비하여 평균수명이 1,518㎞이상 더 클 확률  (단위 : 1,000㎞) 새로운 방법에 의한 평균 수명 : X예전 방식에 의한 평균 수명 : Y 새로운 방법 예전 방법 65.4 60.4 59.2 57.7 63.6 62.5 60.6 58.1 61.5 62.4 56.2   62.6 63.7 62.0 61.1 x = 62.58 , y = 58.84 s1 = (xi – 62.58)2 = 2.30 s2 = (yj – 58.84)2 = 3.76 2 1 8 6 sp = (8• s1 + 6•s2) = 2.926 , 2 1 9 + 7 - 2 합동표본분산 : sp = 2.926 = 1.71 0.254 1 n m + 9 7 = = 0.504 1 n m + sp• = (1.71)•(0.504) = 0.862

( ) 예비실험으로부터 두 모평균이 동일하다는 결론을 얻었으므로 X – Y = 0 ~ t(14) (1/n) + (1/m) Sp = X - Y 0.862 구하고자 하는 확률 : P(X - Y ≥ 1.518) = P X - Y 0.862 1.518 ≥ ( ) = P(T ≥ 1.761) = 0.05

4 표본비율의 분포 로그정규분포, t –분포, F-분포, 이변량정규분포의 확률밀도함수와 평균, 분산을 비롯한 특성에 대하여 알아본다.

▶ ▶ 모비율(population proportion) : 모집단을 형성하고 있는 표본비율(sample proportion) : 확률표본을 이루는 원소 수에 대한 특정한 성질을 갖는 원소 수의 비율 (p) ∧ 모집단의 원소의 수 : N 표본의 원소 수 : n 모집단이나 표본 안에 어느 특정한 성질을 갖는 원소의 수 : x p = x N n ∧ 모비율 : 표본비율 :

☞ 1) 표본비율에 관련된 확률분포 1 , 표본의 i번째 성분이 특정 성질을 갖는 경우 0 , 그렇지 않은 경우 Xi = 0 , 그렇지 않은 경우 X = X1 + X2 + … + Xn 표본에서 성공의 횟수 : 표본비율 : p = X n ∧ =  Xi 1 i=1

E(X) = np, Var(X) = np(1-p) 4•3절로부터 Xi ~ B(1, p), i = 1, 2, …, n E(Xi) = p, Var(Xi) = p(1-p) X ~ B (n, p) E(X) = np, Var(X) = np(1-p) 표본비율의 평균 : E(p) = E(X/n) = p 표본비율의 분산 : Var(p) = Var(X/n) = ∧ p(1-p) n ∧ 표본의 크기 n이 충분히 크다면, np > 5, n(1-p) > 5이면 중심극한정리에 의하여 특정한 성질을 갖는 성분의 수의 확률분포 : 표본비율의 확률분포 : X ~ N(np, np(1-p)) . p ~ N p, p(1-p) n ∧ ( )

지난 선거에서 A 후보자에 대한 지지도는 45.5%이었다. 이번에 보궐선거 실시 지지할 확률 (2) A 후보자에 대한 보궐선거 지지율이 45%와 46% 사이일 확률 2 2 (1) A 후보자를 지지하는 유권자의 수 : X n = 200, p = 0.455 np = 91, np(1-p) = 49.595 연속성수정에 의한 정규근사를 위하여 X ≈ N(91, 49.595) P(X ≥ 100) = P 49.595 X - 91 99.5 - 91 ≥ = P(Z ≥ 1.21) = 1 – 0.8869 = 0.1131 .

(2) 200명의 유권자에 대한 A 후보자의 지지율 : p p ~ N 0.455, = N(0.455, (0.035)2) ∧ ∧ p ~ N 0.455, = N(0.455, (0.035)2) (0.455)•(0.545) 200 . ∧ P(0.45 ≤ p ≤ 0.46) = P 0.45 – 0.455 0.035 p – 0.455 0.46 – 0.455 ≤ = P(-0.14 ≤ Z ≤ 0.14) = 2((0.14) – 0.5) = 2(0.5557 -0.5) = 0.1114 .