제9 강 표준정규분포 학습목표: 표준정규분포의 이해 학습내용: 표준정규분포의 계산방법과 실습 지난강의 표본으로 모집단을 추론할 수 있는 근거는? 즉, 표본과 모집단은 동일하다고 할 수 있는 이론적 근거는? 중심극한정리
과제 Ex) 보험론 학과평균: 85점, 표준편차: 10점 보건통계학 학과평균: 60점, 표준편차: 8점 1. 미국의 평균소득: $35,000, 표준편차: $1,800 한국의 평균소득: $23,000, 표준편차: $1,200 Tom의 소득은 $36,000, 철수의 소득은 $26,000 이라면 누가 상대적으로 생활수준이 높은가? 0.55 2.5 2. 각종 국가고시 선택과목의 점수 편차가 심한 경우 단지 선택 과목에 따른 불공정의 문제가 제기된다. 이를 조정할수 있는방법은? 3. 인석이는 이번 중간고사에서 보험론 시험을 90점 받아 상위 1%에 속한다고 자랑하자, 이에 질세라 태호는 보건통계학은 70점을 받은 내가 더 잘했다고 서로 자랑하다가 싸움 일보 직전까지 갔다. 이를 지켜보고 있던 정훈이가 싸움을 말리면서 내가 판단해 주겠다면서 다음의 자료를 보고 인석이가 더 잘했다고 주장한다. 위 세 명중 누구의 말이 맞을 까. 보험론 학과평균: 85점, 표준편차: 10점 보건통계학 학과평균: 60점, 표준편차: 8점
과제 Ex) 보험론 학과평균: 85점, 표준편차: 10점 인석: (90-85)/10=0.5 0.69 1. 미국의 평균소득: $35,000, 표준편차: $1,800 한국의 평균소득: $23,000, 표준편차: $1,200 Tom의 소득은 $36,000, 철수의 소득은 $26,000 이라면 누가 상대적으로 생활수준이 높은가? Tom: (36000-35000)/1800=0.006, 한국: (26000-23000)/1200=2.5 2. 각종 국가고시 선택과목의 점수 편차가 심한 경우 단지 선택 과목에 따른 불공정의 문제가 제기된다. 이를 조정할수 있는방법은? 표준점수로 환산 3. 인석이는 이번 중간고사에서 보험론 시험을 90점 받아 상위 1%에 속한다고 자랑하자, 이에 질세라 태호는 보건통계학은 70점을 받은 내가 더 잘했다고 서로 자랑하다가 싸움 일보 직전까지 갔다. 이를 지켜보고 있던 정훈이가 싸움을 말리면서 내가 판단해 주겠다면서 다음의 자료를 보고 인석이가 더 잘했다고 주장한다. 위 세 명중 누구의 말이 맞을 까. 보험론 학과평균: 85점, 표준편차: 10점 인석: (90-85)/10=0.5 0.69 보건통계학 학과평균: 60점, 표준편차: 8점 태호: (70-60)/8= 1.25 0.89
제 9 강 정규분포의 이해
제 9 강 표준정규분포의 이해 확률밀도함수 이해 3. 표준화된 데이타 어떤 특정 자료값이 평균으로부터 표준편차의 몇 배만큼 떨어져 있는가를 측정 z-점수(z-score)=(X-μ) /б 이유) 분산 및 표준편차만으로 산포도를 비교하기 곤란. 이질적 집단의 관측치 비교(평균치나 표준편차가 상이한 두집단 비교) (Ex: 선진국과 후진국의 개인소득의 상대적 비교 과목별 상대적 성적비교 확률밀도함수 이해 표준정규분포표 해석방법
제 9 강 표준정규분포의 이해 4. 표준정규분포 이질적 집단의 관측치 비교에 사용 Ex) 1. 두 개의 집단에서 나온 각 개인의 상대적 소득 비교(선진국과 후진국) 2. 수능성적의 표준점수가 필요한 이유는? 평균치나 표준편차가 다른 두 분포의 점수들은 서로 직접 비교가 불가능. 따라서 표준점수는 어떤 측정치에서 평균을 빼고 이를 다시 표준편차로 나눈 값 Z= (X-μ)/δ, 즉, 표준점수 Z= 편차점수/표준편차
제 9 강 표준정규분포의 이해 4. 표준정규분포 이질적 집단의 관측치 비교에 사용, 즉, 여러 가지 분포들의 측정치 비교에 용이 평균치나 표준편차가 다른 두 분포의 점수들은 서로 직접 비교가 불가능하다. 따라서 표준점수는 어떤 측정치에서 평균을 빼고 이를 표준편차로 나눈 값 Z= (X-μ)/δ, 표준점수 Z= 편차점수/표준편차 Z는 N(0,1), 표준정규분포(Standard Normal distribution : 평균이 0, 표준편차가 1인 정규분포)를 따름. 확률변수 X가 평균 μ, 분산 δ2를 갖는 정규분포를 따를 때, 이 그래프는 μ에 대해 좌우 대칭이고 새로운 확률변수 Z=(X- μ)/δ는 평균이 0이고 분산이 1인 표준정규분포를 따름. N(μ, δ2) X-μ는 N(0, δ2) X-μ/δ는 N(0, δ2/δ2)=N(0, 1)
제 9 강 표준 정규분포 실습 Ex) 우리 학과 남학생들의 체중의 몸무게 평균이 70kg, 표준편차가 5일 때 학생의 체중이 65-75사이에 올 확률은? 1. 계산 P(65<X<75) = P(65-70)/5<Z<(75-70)/5 =P(-1<Z<1) 0.3413*2=0.6826 68% 2. 엑셀 계산 NORMDIST {X=75, Mean=70, Std D=5, Cumu=true 0.8413} {X=65, Mean=70, Std D=5, Cumu=true 0.1587} = 0.6826
제 7 강 표준정규분포의 이해 정규분포를 표준정규분포로 만드는 계산방법 정규분포에서 확률변수 X-N(μ, δ2) X-N(0, 1) (X-μ)는 N(0, δ2) 다시 (X-μ)/δ는 N(0, 1)을 따르게 된다. 1. 어떤 분포에 상수를 더하면 더한 수만큼 평균이 증가하거나 감소, but 분산은 영향이 없음. Ex) 측정치: 1, 4, 7, 10, 13 평균: 7, 편차: -6, -3, 0, 3, 6, 표준편차: 4.74, 분산: 22.5 1) 평균에 상수 2를 더하면 측정치: 3, 6, 9, 12, 15 평균: 9, 편차: -6, -3, 0, 3, 6, 표준편차: 4.74, 분산: 22.5 * 어떤 분포에 상수배를 하면 분산은 원 분산에 상수배의 제곱을
제 7 강 표준정규분포의 이해 2. 어떤 분포에 상수배를 하면 분산은 원 분산에 상수배의 제곱을 곱해야 함. Ex) 측정치: 1, 4, 7, 10, 13 평균: 7, 편차: -6, -3, 0, 3, 6, 표준편차: 4.74, 분산: 22.5 평균에 상수 -3을 곱하면, 측정치: -3, -12, -21, -30, -39 평균: 7*(-3)=-21, 편차: -18, -9, 0, 9, 18 표준편차: 14.23=4.74*(-3), 분산: 202.5=22.5*(-3)2 X-N(μ, δ2) (X-μ)는 N(0, δ2) 다시 (X-μ)/δ는 N(0, 1) Z= (X-μ)/δ N(0, 1)
제 9 강 표준정규분포 실습 예제 1) z-점수(z-score)=(X-μ)/б 풀이) 어떤 연구자가 혈중 콜레스테롤의 농도를 측정하기 위해 육식주의자 300명과 채식주의자 100명을 표본으로 추출하여 다음과 같은 조사결과를 얻었다, 평균 혈중콜레스테롤 표준편차 육식주의자 0.6 0.15 채식주의자 0.4 0.1 1) 채식주의자들의 혈중 콜레스테롤 농도가 0.6(육식 평균)보다 클 확률은? 2) 육식주의자들의 혈중 콜레스테롤 농도가 0.4(채식 평균)보다 낮을 확률은? z-점수(z-score)=(X-μ)/б 풀이) 1) 채식주의자 Z=(0.6-0.4)/0.1=2 0.4772 0.5-0.4772=0.0228 채식자들의 혈중 콜레스테롤 농도가 0.6(육식 평균)보다 클 확률은 2.3% 2) 육식주의자 Z=(0.4-0.6)/0.15=-1.330.4082 0.5-0.4082=0.0918 채식주의자들의 혈중 콜레스테롤 농도가 0.6(육식 평균)보다 클 확률은 9.2%
제 9 강 표준정규분포 실습 예제2) 타이어 평균 수명 μ=30,000km, 표준편차 δ=1,500km인 정규분포를 따른다고 할 때, 수명이 28,000km 이하인 제품의 비율은? P(X<28,000)= P(Z<(28,000-30,000)/1,500 = P(Z<1.33) = P(0<Z)-P(0<Z<1.33) = 0.5-0.4082(부록 표에서 추출: 1.3과 0.030.4082) = 0.0918 9.2%에 해당하는 제품의 수명이 28,000km 이하임을 입증. 엑셀이용 NORMDIST {X=28000, Mean=30000, Std D=1500, Cumu=true} 0.0912
제 9 강 표준정규분포 실습 보충연습 1 류마티스성 관절염을 앓고 있는 환자들은 1분에 81회의 심장박동을 하며, 분산은 9이다. 심장박동은 정규분포를 한다고 가정할 때 1) 무작위로 선정한 한 명의 환자가 1분당 84회 이하일 확률은? 2) 1분당 72회에서 90회 사이의 심장박동을 하는 환자의 비율은? 3) 임상실험을 위해 100명의 환자를 선택하였다면 이중에서 심장박동 수가 85회 이상인 환자의 수는? 1) (84-81)/3=1 0.841 Norm dist 84 81 3 true 0.8413 2) P(72<X<90)=P(X<90)-P(X<72) P(X<90)=0.99865, P(X<72)=0.00135 Norm dist 90 81 3 true- Norm dist 72 81 3 true=0.9987-0.0014=0.9973 3) 9.2명 P(X>85)=1-P(X<85) * 100=1-0.909=9.1*100=9.1
제 9 강 표준정규분포 실습 Ex) 맥도날드 에그머핀의 칼로리가 정규분포를 따르고 평균은 290칼로리이고 표준편차가 14칼로리라고 가정하자. (a) 특정 머핀이 300칼로리 이하를 가질 확률은? (b) 250칼로리 이상일 확률은? (c) 275에서 310칼로리일 확률은? z-점수(z-score)=(X-μ)/б Pr(Z <= { (300-290) / 14 } )= Pr( Z <= 0.71) = 1- 0.2389 = 0.7611 B) Pr(Z >= { (250 -290) / 14 } )= Pr(Z >= -2.86 ) = 1 - 0.0021 = 0.9979 C) 275칼로리에서 310칼로리 사이일 확률은 전체확률 100%에서 275칼로리보다 작을 확률과 310칼로리보다 클 확률 275보다 작을 확률 Pr(Z < { (275 - 290) / 14 } ) = Pr( Z < -1.07 ) = 0.1423 310보다 클 확률 Pr(Z > { (310 - 290) / 14 } ) = Pr( Z > 1.43 ) = 0.0764 275칼로리에서 310칼로리 사이일 확률 = 1 - 0.1424 - 0.0764 = 0.7812 특정 머핀이 275칼로리에서 310칼로리 사이일 확률은 78.12%.
제 9 강 표준정규분포 실전문제 고객들이 특정 서비스를 제공하는 회사들에 대해 평가한 점수는 평균이 63이고, 분산이 100인 정규분포를 따른다. 50점 이하를 받은 서비스 제공 회사는 몇 %인가? 1) 엑셀 메뉴 중 " 홈 -> ∑ -> 함수 추가 -> 통계 -> NORMDIST "를 선택. 2) X 값에 구하고자 하는 확률변수 " 50 "을 입력. Mean에 서비스 평균 " 63 "을 입력하고, Standard_dev(표준편차)에 " 10 "을 입력 Cumulative(누적)에 "True"를 입력합니다. 누적함수이기 때문에 True 확률밀도함수인 경우는 False 50점 이하를 받은 서비스를 제공하는 회사의 비율은 0.0968(9.68%)
제 9 강 표준정규분포 실전문제 8. 어느 생수회사에서 생산하는 생수 한병의 무게는 평균 500, 표준편차 10인 정규분포를 따른다고 한다. 이 생수 회사에서는 4병을 한 세트로 판매한다. 임의로 택한 한 세트의 무게가 2030 이상일 확률을 구하시오. 표본 4병 추출 중심극한정리에 의해 표본의 표준편차:10/√4 그래프에서 구할 넓이 평균: 507.5=2030/4 표본의 표준편차: 10/√4=5 P(x>507.5)=P{(507.5-500)/5}=1.5 0.5-0.4332=0.0668 NORMDIST {X=507.5, Mean=500, Std D=5, Cumu=true 0.9332 1-0.9332=0.0668