제9 강 표준정규분포 학습목표: 표준정규분포의 이해 학습내용: 표준정규분포의 계산방법과 실습 지난강의

Slides:



Advertisements
Similar presentations
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
Advertisements

제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
이항분포와 정규분포 이항분포 정규분포.
재료수치해석 HW # 박재혁.
표본분포.
제 4 장 정규분포로의 근사 단위변환 정규분포곡선 표준정규분포곡선 아래의 영역 찾기 자료에 대한 정규 근사 백분위수
제 7 장 함수 사용을 통해 엑셀 정복하기.
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
고장률 failure rate 어떤 시점까지 동작하여 온 품목이 계속되는 단위기간내에 고장을 일으키는 비율(횟수). 고장률은 확률이 아니며 따라서 1 보다 커도 상관없다. 고장이 발생하기 쉬운 정도를 표시하는 척도. 일반으로 고장률은 순간고장률과 평균고장률을 사용하고 있지만.
표본 이론.
Ⅱ. 측정(Measure) (2) Gage R&R (Crossed) – ANOVA 방법 [1] Data 입력
제9장 샘플링과 오차 표본: 시료, Sample 모집단 : 공정, Lot Sampling
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
제 3장. 수치를 통한 연속형 자료의 요약.
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다.
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
확률통계론 2장 : 확률변수.
Chapter 07. 기본 함수 익히기.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
ANOVA.
상관분석 (p , p ).
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
수학10-가 Ⅳ. 통 계 백암고등학교 수학교사 : 양상옥.
Keller: Stats for Mgmt & Econ, 7th Ed
(independent variable)
학습 주제 p 일률 측정하기.
10장 두 개의 모집단에 대한 추론 2019년 4월 5일 오후 4시 22분2019년 4월 5일 오후 4시 22분
9장 모집단이 한 개인 경우의 통계적 추론 2019년 4월 6일 오후 2시 22분2019년 4월 6일 오후 2시 22분
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
Term Projects 다음에 주어진 2개중에서 한 개를 선택하여 문제를 해결하시오. 기한: 중간 보고서: 5/30 (5)
자료의 표현.
T-test.
두 모집단에 대한 검정.
⊙ 이차방정식의 활용 이차방정식의 활용 문제 풀이 순서 (1)문제 해결을 위해 구하고자 하는 것을 미지수 로 정한다.
재료공학원리 II – 최종 보고서 및 최종 발표 1. 최종 보고서 2. 최종 발표 3. 평가 항목
논문작성을 위한 연구모형 설정 양동훈.
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
Excel 일차 강사 : 박영민.
감마분포 gamma distribution
1. 학교생활기록부 반영 비중 확대 (1) 학생부 신뢰도 현황과 제고 노력
Sampling Distributions
Excel 일차 강사 : 박영민.
홍수추적 담당교수명 : 서 영 민 연 락 처 :
기초 통계학 지도위원 이광희.
통계해석 및 오차의 제거.
Chapter 3: 확률변수와 분포함수 Pilsung Kang
2장 PHP 기초 PHP의 시작과 끝을 이해한다. 주석문에 대하여 이해한다. echo 문을 이용하여 화면에 출력하
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
제 16장 비율의 정확성 머리말 신뢰구간 신뢰구간의 해석.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
수치해석 ch3 환경공학과 김지숙.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
9장. spss statistics 20의 데이터 변수계산
어서와 C언어는 처음이지 제21장.
문제의 답안 잘 생각해 보시기 바랍니다..
Report #2 (기한: 3/16) 데이터 구조 과목의 수강생이 50명이라고 가정한다. 이 학생(학번은 2016????으로 표현됨)들의 중간 시험(0~100), 기말 시험(0~100) 성적을 성적 파일에 작성하라(프로그램을 통해서 또는 수작업으로). 성적 파일을 읽어들여서.
강화학습: 기초.
6 객체.
Survey Sampling Sangji University.
Presentation transcript:

제9 강 표준정규분포 학습목표: 표준정규분포의 이해 학습내용: 표준정규분포의 계산방법과 실습 지난강의 표본으로 모집단을 추론할 수 있는 근거는? 즉, 표본과 모집단은 동일하다고 할 수 있는 이론적 근거는?  중심극한정리

과제 Ex) 보험론 학과평균: 85점, 표준편차: 10점 보건통계학 학과평균: 60점, 표준편차: 8점 1. 미국의 평균소득: $35,000, 표준편차: $1,800 한국의 평균소득: $23,000, 표준편차: $1,200 Tom의 소득은 $36,000, 철수의 소득은 $26,000 이라면 누가 상대적으로 생활수준이 높은가? 0.55 2.5 2. 각종 국가고시 선택과목의 점수 편차가 심한 경우 단지 선택 과목에 따른 불공정의 문제가 제기된다. 이를 조정할수 있는방법은? 3. 인석이는 이번 중간고사에서 보험론 시험을 90점 받아 상위 1%에 속한다고 자랑하자, 이에 질세라 태호는 보건통계학은 70점을 받은 내가 더 잘했다고 서로 자랑하다가 싸움 일보 직전까지 갔다. 이를 지켜보고 있던 정훈이가 싸움을 말리면서 내가 판단해 주겠다면서 다음의 자료를 보고 인석이가 더 잘했다고 주장한다. 위 세 명중 누구의 말이 맞을 까. 보험론 학과평균: 85점, 표준편차: 10점 보건통계학 학과평균: 60점, 표준편차: 8점

과제 Ex) 보험론 학과평균: 85점, 표준편차: 10점 인석: (90-85)/10=0.5  0.69 1. 미국의 평균소득: $35,000, 표준편차: $1,800 한국의 평균소득: $23,000, 표준편차: $1,200 Tom의 소득은 $36,000, 철수의 소득은 $26,000 이라면 누가 상대적으로 생활수준이 높은가? Tom: (36000-35000)/1800=0.006, 한국: (26000-23000)/1200=2.5 2. 각종 국가고시 선택과목의 점수 편차가 심한 경우 단지 선택 과목에 따른 불공정의 문제가 제기된다. 이를 조정할수 있는방법은? 표준점수로 환산 3. 인석이는 이번 중간고사에서 보험론 시험을 90점 받아 상위 1%에 속한다고 자랑하자, 이에 질세라 태호는 보건통계학은 70점을 받은 내가 더 잘했다고 서로 자랑하다가 싸움 일보 직전까지 갔다. 이를 지켜보고 있던 정훈이가 싸움을 말리면서 내가 판단해 주겠다면서 다음의 자료를 보고 인석이가 더 잘했다고 주장한다. 위 세 명중 누구의 말이 맞을 까. 보험론 학과평균: 85점, 표준편차: 10점 인석: (90-85)/10=0.5  0.69 보건통계학 학과평균: 60점, 표준편차: 8점 태호: (70-60)/8= 1.25  0.89

제 9 강 정규분포의 이해

제 9 강 표준정규분포의 이해 확률밀도함수 이해 3. 표준화된 데이타 어떤 특정 자료값이 평균으로부터 표준편차의 몇 배만큼 떨어져 있는가를 측정 z-점수(z-score)=(X-μ) /б 이유) 분산 및 표준편차만으로 산포도를 비교하기 곤란. 이질적 집단의 관측치 비교(평균치나 표준편차가 상이한 두집단 비교) (Ex: 선진국과 후진국의 개인소득의 상대적 비교 과목별 상대적 성적비교 확률밀도함수 이해 표준정규분포표 해석방법

제 9 강 표준정규분포의 이해 4. 표준정규분포 이질적 집단의 관측치 비교에 사용 Ex) 1. 두 개의 집단에서 나온 각 개인의 상대적 소득 비교(선진국과 후진국) 2. 수능성적의 표준점수가 필요한 이유는? 평균치나 표준편차가 다른 두 분포의 점수들은 서로 직접 비교가 불가능. 따라서 표준점수는 어떤 측정치에서 평균을 빼고 이를 다시 표준편차로 나눈 값 Z= (X-μ)/δ, 즉, 표준점수 Z= 편차점수/표준편차

제 9 강 표준정규분포의 이해 4. 표준정규분포 이질적 집단의 관측치 비교에 사용, 즉, 여러 가지 분포들의 측정치 비교에 용이 평균치나 표준편차가 다른 두 분포의 점수들은 서로 직접 비교가 불가능하다. 따라서 표준점수는 어떤 측정치에서 평균을 빼고 이를 표준편차로 나눈 값 Z= (X-μ)/δ, 표준점수 Z= 편차점수/표준편차 Z는 N(0,1), 표준정규분포(Standard Normal distribution : 평균이 0, 표준편차가 1인 정규분포)를 따름. 확률변수 X가 평균 μ, 분산 δ2를 갖는 정규분포를 따를 때, 이 그래프는 μ에 대해 좌우 대칭이고 새로운 확률변수 Z=(X- μ)/δ는 평균이 0이고 분산이 1인 표준정규분포를 따름. N(μ, δ2) X-μ는 N(0, δ2)  X-μ/δ는 N(0, δ2/δ2)=N(0, 1)

제 9 강 표준 정규분포 실습 Ex) 우리 학과 남학생들의 체중의 몸무게 평균이 70kg, 표준편차가 5일 때 학생의 체중이 65-75사이에 올 확률은? 1. 계산 P(65<X<75) = P(65-70)/5<Z<(75-70)/5 =P(-1<Z<1) 0.3413*2=0.6826  68% 2. 엑셀 계산 NORMDIST {X=75, Mean=70, Std D=5, Cumu=true 0.8413} {X=65, Mean=70, Std D=5, Cumu=true 0.1587} = 0.6826

제 7 강 표준정규분포의 이해 정규분포를 표준정규분포로 만드는 계산방법 정규분포에서 확률변수 X-N(μ, δ2) X-N(0, 1) (X-μ)는 N(0, δ2) 다시 (X-μ)/δ는 N(0, 1)을 따르게 된다. 1. 어떤 분포에 상수를 더하면 더한 수만큼 평균이 증가하거나 감소, but 분산은 영향이 없음. Ex) 측정치: 1, 4, 7, 10, 13 평균: 7, 편차: -6, -3, 0, 3, 6, 표준편차: 4.74, 분산: 22.5 1) 평균에 상수 2를 더하면 측정치: 3, 6, 9, 12, 15 평균: 9, 편차: -6, -3, 0, 3, 6, 표준편차: 4.74, 분산: 22.5 * 어떤 분포에 상수배를 하면 분산은 원 분산에 상수배의 제곱을

제 7 강 표준정규분포의 이해 2. 어떤 분포에 상수배를 하면 분산은 원 분산에 상수배의 제곱을 곱해야 함. Ex) 측정치: 1, 4, 7, 10, 13 평균: 7, 편차: -6, -3, 0, 3, 6, 표준편차: 4.74, 분산: 22.5 평균에 상수 -3을 곱하면, 측정치: -3, -12, -21, -30, -39 평균: 7*(-3)=-21, 편차: -18, -9, 0, 9, 18 표준편차: 14.23=4.74*(-3), 분산: 202.5=22.5*(-3)2  X-N(μ, δ2) (X-μ)는 N(0, δ2) 다시 (X-μ)/δ는 N(0, 1)  Z= (X-μ)/δ N(0, 1)

제 9 강 표준정규분포 실습 예제 1) z-점수(z-score)=(X-μ)/б 풀이) 어떤 연구자가 혈중 콜레스테롤의 농도를 측정하기 위해 육식주의자 300명과 채식주의자 100명을 표본으로 추출하여 다음과 같은 조사결과를 얻었다, 평균 혈중콜레스테롤 표준편차 육식주의자 0.6 0.15 채식주의자 0.4 0.1 1) 채식주의자들의 혈중 콜레스테롤 농도가 0.6(육식 평균)보다 클 확률은? 2) 육식주의자들의 혈중 콜레스테롤 농도가 0.4(채식 평균)보다 낮을 확률은? z-점수(z-score)=(X-μ)/б 풀이) 1) 채식주의자 Z=(0.6-0.4)/0.1=2 0.4772 0.5-0.4772=0.0228 채식자들의 혈중 콜레스테롤 농도가 0.6(육식 평균)보다 클 확률은 2.3% 2) 육식주의자 Z=(0.4-0.6)/0.15=-1.330.4082 0.5-0.4082=0.0918  채식주의자들의 혈중 콜레스테롤 농도가 0.6(육식 평균)보다 클 확률은 9.2%

제 9 강 표준정규분포 실습 예제2) 타이어 평균 수명 μ=30,000km, 표준편차 δ=1,500km인 정규분포를 따른다고 할 때, 수명이 28,000km 이하인 제품의 비율은? P(X<28,000)= P(Z<(28,000-30,000)/1,500 = P(Z<1.33) = P(0<Z)-P(0<Z<1.33) = 0.5-0.4082(부록 표에서 추출: 1.3과 0.030.4082) = 0.0918  9.2%에 해당하는 제품의 수명이 28,000km 이하임을 입증. 엑셀이용 NORMDIST {X=28000, Mean=30000, Std D=1500, Cumu=true} 0.0912

제 9 강 표준정규분포 실습 보충연습 1 류마티스성 관절염을 앓고 있는 환자들은 1분에 81회의 심장박동을 하며, 분산은 9이다. 심장박동은 정규분포를 한다고 가정할 때 1) 무작위로 선정한 한 명의 환자가 1분당 84회 이하일 확률은? 2) 1분당 72회에서 90회 사이의 심장박동을 하는 환자의 비율은? 3) 임상실험을 위해 100명의 환자를 선택하였다면 이중에서 심장박동 수가 85회 이상인 환자의 수는? 1) (84-81)/3=1 0.841 Norm dist 84 81 3 true 0.8413 2) P(72<X<90)=P(X<90)-P(X<72) P(X<90)=0.99865, P(X<72)=0.00135 Norm dist 90 81 3 true- Norm dist 72 81 3 true=0.9987-0.0014=0.9973 3) 9.2명 P(X>85)=1-P(X<85) * 100=1-0.909=9.1*100=9.1

제 9 강 표준정규분포 실습 Ex)  맥도날드 에그머핀의 칼로리가 정규분포를 따르고 평균은 290칼로리이고 표준편차가 14칼로리라고 가정하자.  (a) 특정 머핀이 300칼로리 이하를 가질 확률은? (b) 250칼로리 이상일 확률은? (c) 275에서 310칼로리일 확률은? z-점수(z-score)=(X-μ)/б Pr(Z <= { (300-290) / 14 } )= Pr( Z <= 0.71) = 1- 0.2389 = 0.7611 B) Pr(Z >= { (250 -290) / 14 } )= Pr(Z >= -2.86 ) = 1 - 0.0021 = 0.9979 C) 275칼로리에서 310칼로리 사이일 확률은 전체확률 100%에서 275칼로리보다 작을 확률과 310칼로리보다 클 확률 275보다 작을 확률 Pr(Z < { (275 - 290) / 14 } ) = Pr( Z < -1.07 ) = 0.1423 310보다 클 확률 Pr(Z > { (310 - 290) / 14 } ) = Pr( Z > 1.43 ) = 0.0764 275칼로리에서 310칼로리 사이일 확률 = 1 - 0.1424 - 0.0764 = 0.7812   특정 머핀이 275칼로리에서 310칼로리 사이일 확률은 78.12%.

제 9 강 표준정규분포 실전문제 고객들이 특정 서비스를 제공하는 회사들에 대해 평가한 점수는 평균이 63이고, 분산이 100인 정규분포를 따른다.  50점 이하를 받은 서비스 제공 회사는 몇 %인가? 1) 엑셀 메뉴 중 " 홈 -> ∑ -> 함수 추가 -> 통계 -> NORMDIST "를 선택. 2) X 값에 구하고자 하는 확률변수 " 50 "을 입력.    Mean에 서비스 평균 " 63 "을 입력하고, Standard_dev(표준편차)에 " 10 "을 입력    Cumulative(누적)에 "True"를 입력합니다. 누적함수이기 때문에 True 확률밀도함수인 경우는 False    50점 이하를 받은 서비스를 제공하는 회사의 비율은 0.0968(9.68%)

제 9 강 표준정규분포 실전문제 8. 어느 생수회사에서 생산하는 생수 한병의 무게는 평균 500, 표준편차 10인 정규분포를 따른다고 한다. 이 생수 회사에서는 4병을 한 세트로 판매한다. 임의로 택한 한 세트의 무게가 2030 이상일 확률을 구하시오.  표본 4병 추출 중심극한정리에 의해 표본의 표준편차:10/√4 그래프에서 구할 넓이 ​ 평균: 507.5=2030/4 표본의 표준편차: 10/√4=5  P(x>507.5)=P{(507.5-500)/5}=1.5  0.5-0.4332=0.0668 NORMDIST {X=507.5, Mean=500, Std D=5, Cumu=true 0.9332  1-0.9332=0.0668