연 속 확 률 분 포 5 1 균등분포 2 지수분포 3 감마분포 4 정규분포.

Slides:



Advertisements
Similar presentations
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
Advertisements

제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
Add Your Text 5. 지수함수와 로그함수 1. 지수함수 2. 로그함수 · 지수함수와 그 그래프 · 지수방정식과 지수부등식 · 로그 함수와 그 그래프 · 로그방정식과 로그부등식.
이항분포와 정규분포 이항분포 정규분포.
제 4 장 정규분포로의 근사 단위변환 정규분포곡선 표준정규분포곡선 아래의 영역 찾기 자료에 대한 정규 근사 백분위수
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
적분방법의 연속방정식으로부터 Q=AV 방정식을 도출하라.
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
제 4 장 여러 가지 분포.
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
고장률 failure rate 어떤 시점까지 동작하여 온 품목이 계속되는 단위기간내에 고장을 일으키는 비율(횟수). 고장률은 확률이 아니며 따라서 1 보다 커도 상관없다. 고장이 발생하기 쉬운 정도를 표시하는 척도. 일반으로 고장률은 순간고장률과 평균고장률을 사용하고 있지만.
각 행 (row) 에서 같은 첨자가 있는 곳은 비워두고, 그 밖에 cell에 수준수 (level) 또는 반복수를 기입
수치해석 6장 예제문제 환경공학과 천대길.
- 1변수 방정식의 solution 프로그램 (Bisection method, Newton-Raphson method)
결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값.
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
제 3장. 수치를 통한 연속형 자료의 요약.
가설검정 9 1 가설검정 2 모평균의 검정 3 모비율의 검정 4 c2-검정과 모분산의 검정.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
연 속 확 률 분 포 5 균등분포 지수분포 감마분포 웨이블분포 베타분포 정규분포 정규분포에 관련된 연속분포들
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
확률통계론 2장 : 확률변수.
상관함수 correlation function
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
제 4장 시스템 신뢰도와 중복설계.
제9 강 표준정규분포 학습목표: 표준정규분포의 이해 학습내용: 표준정규분포의 계산방법과 실습 지난강의
제4장 제어 시스템의 성능.
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
확 률 변 수 2 1 이산확률변수 2 연속확률변수 3 기대값.
수학10-가 Ⅳ. 통 계 백암고등학교 수학교사 : 양상옥.
Keller: Stats for Mgmt & Econ, 7th Ed
1.4 중첩된 한정기호 (Nested Quantifiers) 이산수학 (Discrete Mathematics)
(independent variable)
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
Metal Forming CAE Lab., Gyeongsang National University
Probability.
두 모집단에 대한 검정.
합집합과 교집합이란 무엇인가? 01 합집합 두 집합 A, B에 대하여 A에 속하거나 B에 속하는 모든 원소로 이루어진 집합을 A와 B의 합집합이라고 하며, 기호 A∪B로 나타낸다. A∪B ={x | x∈A 또는 x∈B}
1. 일반적인 지수.
양자상태수(Density of states)
Distribution(모의 실험에 자주 쓰이는 분포들)
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
제3장 함수와 배열수식 전진환
감마분포 gamma distribution
Sampling Distributions
제 3장 신뢰성 척도 3.1 개요 3.2 신뢰성의 척도 3.3 수명분포별 신뢰성 척도.
4장. 데이터 표현 방식의 이해. 4장. 데이터 표현 방식의 이해 4-1 컴퓨터의 데이터 표현 진법에 대한 이해 n 진수 표현 방식 : n개의 문자를 이용해서 데이터를 표현 그림 4-1.
기초 통계학 지도위원 이광희.
Chapter 3: 확률변수와 분포함수 Pilsung Kang
원의 방정식 원의 방정식 x축, y축에 접하는 원의 방정식 두 원의 위치 관계 공통접선 원과 직선의 위치 관계
1. 접선의 방정식 2010년 설악산.
결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값.
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
이산수학(Discrete Mathematics)  술어와 한정기호 (Predicates and Quantifiers)
제 16장 비율의 정확성 머리말 신뢰구간 신뢰구간의 해석.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
I. 수와 식 1. 유리수와 순환소수.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
수학10-나 1학년 2학기 Ⅱ.부등식의 영역 3. 부등식의 영역에서 최대, 최소(5/5) 부등식 영역 수업계획 수업활동.
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
문제의 답안 잘 생각해 보시기 바랍니다..
Survey Sampling Sangji University.
Presentation transcript:

연 속 확 률 분 포 5 1 균등분포 2 지수분포 3 감마분포 4 정규분포

균등분포(uniform distribution) 1 균등분포(uniform distribution) 균등분포의 확률밀도함수와 분포함수 및 평균, 분산 그리고 균등분포에 대한 백분위수와 사분위수 등에 대하여 알아본다.

☞ ☞  1) 확률밀도함수 2) 평균 X ~ U(a, b) f(x) = , a ≤ x ≤ b 1 b - a m = E(X) = x f(x)dx = dx x b - a  a b a+b 2 1 b - a x2 a b =

☞ ☞   3) 분산 4) 분포함수 E(X2) x2 f(x)dx = dx a2 +ab + b2 3 1 b - a x3 = s2 = Var(X) = E(X2) – E(X)2 - a2 +ab + b2 3 = a+b 2 (b – a)2 12 ☞ 4) 분포함수 x < a인 경우 : P(X ≤ x) = f(x)dx = 0 du = 0 -∞ x  x

  a ≤ x < b인 경우 : x P(X ≤ x) = f(x)dx = 0 dx + du 1 b - a x - a = -∞ x a  x ≥ b인 경우 : P(X ≤ x) = f(x)dx = 0 dx + du + 0 du 1 b - a = 1 -∞ x a b  분포함수 : x - a b - a F(x) = P(X ≤ x) = 0 , x < a , a ≤ x < b 1 , x ≥ b

☞ 5) 백분위수와 사분위수 0 < p < 1에 대하여 100p-백분위수 xp : [a, b]를 p : 1-p로 내분하는 점 xp=(1-p)a + pb 제1사분위수 Q1 = x0.25 = 0.75a + 0.25b 제2사분위수 Q2 = Me = x0.5 = 0.5a + 0.5b 제3사분위수 Q3= x0.75 = 0.25a + 0.75b 사분위수범위 I.Q.R = Q3 - Q1 = x0.75 - x0.25 = 0.5b – 0.5a

 X ~ U(0, 10)에 대하여 (1) X의 확률밀도함수와 분포함수 (2) X의 평균(m)와 분산(s2) (3) P(m - s < X < m + s ) (4) 사분위수 Q1 , Q2 , Q3 (5) X의 최빈값 Mo = ? (1) X의 확률밀도함수 : X ~ U(0, 10)이므로 f(x) = , 0 < x < 10 1 10 X의 분포함수 : 0 , x < 0 0 , x < 0 1 10 du x  x 10 , 0 ≤ x < 10 , 0 ≤ x < 10 F(x) = P(X ≤ x) = = 1 , x ≥ 10 1 , x ≥ 10

m = E(X) = = 5, 0+10 2 s2 = Var(X) = = 8.3333 (10 - 0)2 12 (2) (3) s2 = 8.3333이므로 s = = 2.89 (m - s , m + s ) = (5 – 2.89, 5 + 2. 89) = (2.11, 7.89) P(m - s < X < m +s) = = 0.578 5.78 10 (4) 제1사분위수 Q1 = (0.75)•0 + (0.25) •(10) = 2.5 제2사분위수 Q2 = (0.5)•0 + (0.5) •(10) = 5.0 제3사분위수 Q3= (0.25)•0 + (0.75) •(10) = 7.5 1 10 (5) [0, 10]에서 f(x) = 이므로 f(x)의 최대값이 존재하지 않음. X의 최빈값이 없다.

 X ~ U(0, 1)에 대하여 Y = a + (b – a)X (a < b)라 할 때, (1) Y의 분포함수 (3) Y의 평균(m)와 분산(s2) (4) Y의 중앙값 Me = ? (1) X ~ U(0, 1)이므로 X의 분포함수 : 0 , x < 0 0 , x < 0 x  , 0 ≤ x < 1 x , 0 ≤ x < 1 FX(x) = P(X ≤ x) = 1 du = 1 , x ≥ 1 1 , x ≥ 1 한편, y = a + (b – a)x이고 0 ≤ x ≤ 1이므로 a ≤ y ≤ b

a ≤ y < b에 대하여 P(Y ≤ y) = P[a + (b – a)X ≤ y] y - a b - a = = P X ≤ = F = y - a b - a FY(x) = 0 , y < a , a ≤ y < b 1 , y ≥ b Y의 분포함수 : (2) Y의 확률밀도함수 : dx d dx d b - a y - a 1 fY(y) = FY(y) = = , a ≤ y ≤ b b - a

(3) Y ~ U(a, b)이므로 a+b s2 = Var(Y) = (b – a)2 12 m = E(Y) = 2 (4) Y ~ U(a, b)이므로 F(y0) = 0.5 = y0 - a b - a a+b 2 Me = y0 =

지수분포 (exponential distribution) 2 지수분포 (exponential distribution) 지수분포의 확률밀도함수와 평균, 분산을 비롯한 비기억성 성질 그리고 포아송과정과의 관계에 대하여 알아본다.

l의 비율로 사고가 발생할 때까지 걸리는 시간 또는 비율 l인 포아송과정에 따라 발생하는 사건 사이의 대기시간 등에 응용되는 확률분포를 모수 l인 지수분포라 한다. ☞ 1) 확률밀도함수 X ~ Exp(l) f(x) = le-lx , x > 0 , l> 0

☞ ☞     2) 평균 3) 분산 m = E(X) = x f(x)dx = x le-lx dx lx + 1 l l 1 ∞  ∞  m = E(X) = x f(x)dx = x le-lx dx u lx + 1 l l 1 = lim - e-lx = u→∞ ☞ 3) 분산 ∞  ∞  E(X2) = x2 f(x)dx = x2 le-lx dx u l2x2 + 2lx + 2 l2 l2 2 = lim - e-lx = x→∞ s2 = Var(X) = E(X2) – E(X)2 - = 2 l2 l 1

  교차로에서 나타나는 교통사고 발생시간의 간격 X(단위:개월) (1) 사고가 관측된 이후로 한 달이 지난 후에 다음 사고가 발생할 확률 (2) 두 달 안에 사고가 발생할 확률 (3) 한 달을 30일이라 할 때, 평균 몇 일만에 사고가 나는가? f(x) = 3e-3x , x > 0 1 ∞  ∞ (1) P(X > 1) = 3e-3x dx = (-1)e-3x = e-3 = 0.0498 1 2  2 (2) P(X ≤ 2) = 3e-3x dx = (-1)e-3x = 1 - e-6 = 0.9975 (3) 사고일 수는 모수 l= 3인 기하분포이므로 월평균 사고발생 간격일 수는 m= 1/3, 즉 10일이다.

☞   4) 분포함수 x < 0인 경우 : P(X ≤ x) = f(x)dx = 0 dx = 0 x ≥ 0인 경우 : -∞ x  x x ≥ 0인 경우 : x P(X ≤ x) = f(x)dx = 0 dx + le-lu du = - e-lu = 1- e-lx x -∞  x

☞ ☞ 5) 생존함수(survival function) 분포함수 : F(x) = P(X ≤ x) = 0 , x < 0 1- e-lx , x ≥ 0 ☞ 5) 생존함수(survival function) S(x) = P(X > x) = 1 – F(x) = e-lx , x > 0 ☞ 6) 위험률(hazard rate function), 실패율(failure rate function) h(x) = = l S(x) f(x)

(1) X의 확률밀도함수와 분포함수를 구하여라. (2) X의 생존함수를 구하여라. (3) X의 위험률을 구하여라. X ~ Exp(1/600)에 대하여 (1) X의 확률밀도함수와 분포함수를 구하여라. (2) X의 생존함수를 구하여라. (3) X의 위험률을 구하여라. (4) X의 기대값과 분산 X ~ Exp(1/600) 이므로 ● X의 확률밀도함수 ● X의 분포함수 f(x) = e-x/600 , x > 0 600 1 F(x) = 1- e-x /600 , x ≥ 0 ● X의 생존함수 X의 위험률 ● h(x) = l = , x ≥ 0 600 1 S(x) = e-x/600 , x > 0 ● X의 평균 ● X의 분산 m = 1/ l = 600 s2 = 1/ l2 = 360000

P(X < 150) = F(150) = 1- e-150/100 = 1 – 0.2231 = 0.7769 환자의 생존시간 : X ~ Exp(1/100) (1) 이 환자가 150일 이내에 사망할 확률 (2) 이 환자가 200일 이상 생존할 확률 f(x) = e-x/100 , x > 0 100 1 X의 분포함수 X의 생존함수 F(x) = 1- e-x/100 , x ≥ 0 S(x) = e-x/100 , x > 0 (1) 이 환자가 150일 이내에 사망할 확률 : P(X < 150) = F(150) = 1- e-150/100 = 1 – 0.2231 = 0.7769 (2) 이 환자가 200일 이상 생존할 확률 : P(X ≥ 200) = S(200) = e-200/100 = e-2 = 0.1353

   정리 1 비기억성 성질(memorylessness property) X ~ Exp(l)에 대하여 다음이 성립한다. P(X > a+b | X > a) = P(X > b) , a, b > 0 정리 1 비기억성 성질(memorylessness property) P(X > a+b | X > a) = P(X > a) P(X > a+b) P(X > a+b, X > a) = 증명 ∞ ∞ P(X > a+b) = le-lx dx = (-1) e-lx = e-l(a+b)  a+b a+b ∞ ∞  P(X > a) = le-lx dx = (-1) e-lx = e-la a a ∞ ∞  P(X > b) = le-lx dx = (-1) e-lx = e-lb b b P(X > a+b | X > a) = P(X > a) P(X > a+b) = e-l(a+b) e-la = e-lb = P(X > b) 증명 끝

 어떤 기계의 일부 부품이 고장 날 때까지 걸리는 시간은 평균 1,000시간인 지수분포에 따른다고 한다. (1) 이 기계를 500시간 이상 아무런 문제없이 사용한 후, 그 후로 다시100시간 이상 사용할 확률을 구하여라. (2) (1)의 조건에 대하여, 앞으로 x시간 이상 사용할 확률이 0.3이라면 x = ? (1) 부품이 고장 날 때까지 걸리는 시간 X는 평균 m = 1000인 지수분포에 따르므로 X ~ Exp(1/1000) 1000 1 X의 확률밀도함수 : f(x) = e-x/1000 , x > 0 ∞ 100 P(X ≥ 600 | X ≥ 500) = P(X ≥ 100) = e-x/1000 dx 1000 1 = (-1)e-x/1000 = e-0.1 = 0.9048 

(2) (1)의 조건 아래서, 이 기계를 고장 없이 사용한 전체 시간 : 500 + x P(X ≥ 500 + x|X ≥ 500) = P(X ≥ x) = S(x) = e-x/1000 = 0.3 1000 x = ln (0.3) ; x = (-1000)ln (0.3) = 1203.97 -

감마분포 (gamma distribution) 3 감마분포 (gamma distribution) 감마분포의 확률밀도함수와 평균, 분산 그리고 카이제곱분포에 대하여 알아본다.

    일정한 비율로 발생하는 사고가 n건 발생할 때까지 걸리는 전체 시간에 관한 확률분포 감마함수 : ∞  감마함수 : G(a) = ta-1 e-t dt , a > 0 ∞  G(a) 1 ta-1 e-t dt = 1 t = x/b ∞  G(a) 1 x b a-1 1 b e-x/b dx = 1 p.d.f. 조건을 만족 또는 G(a) ba 1 ∞  xa-1 e-x/b dx = 1

☞ ☞ 감마함수의 성질 1) 확률밀도함수 G(1) = 1 G(a+1) = aG(a), a > 0 G(n+1) = nG(n)= n!, n 은 자연수 G(1) = 1 G(1/2) = p ● ● ● ● ☞ 1) 확률밀도함수 X ~ G(a, b) xa-1 e-x/b, x > 0, a, b > 0 G(a) ba 1 f(x) = a: 형상모수(shape parameter) b : 척도모수(scale

☞     2) 평균 X ~ G(1, b) e-x/b , x > 0, b > 0 f(x) = b X ~ Exp(1/b) 참고 ☞ 2) 평균 ∞  ∞  G(a) ba x m = E(X) = x f(x)dx = xa-1 e-x/b dx 1 = ∞  x(a+1)-1 e-x/b dx G(a) ba G(a+1) b ∞  1 = x(a+1)-1 e-x/b dx G(a) G(a+1) ba+1 G(a+1) b aG(a) b = = = a b G(a) G(a)

☞     3) 분산 E(X2) = x2 f(x)dx = xa-1 e-x/b dx = x(a+2)-1 e-x/b dx ∞  ∞  G(a) ba x2 E(X2) = x2 f(x)dx = xa-1 e-x/b dx 1 = ∞  x(a+2)-1 e-x/b dx G(a) ba G(a+2)b2 = ∞  1 x(a+2)-1 e-x/b dx G(a) G(a+2) ba+2 G(a+2)b2 a(a+1)G(a) b2 = = = a(a+1) b2 G(a) G(a) s2 = Var(X) = E(X2) – E(X)2 = a(a+1)b2 - (ab )2 = ab2

감마분포와 지수분포 그리고 포아송과정 X1, X2, …, Xn ~ i.i.d. Exp(l) S =X1 + X2 + …+ Xn ~ G(n, 1/l) (2) S : 비율 l인 포아송과정에 따라 n번째 사건이 발생할 때까지 걸리는 시간 비기억성 성질에 의하여 S ~ G(n, 1/l)

신호에 대한 응답이 끝나면 곧 바로 다음 신호를 접수 X : 오전 9:00부터 2건의 신호가 들어올 때까지 걸리는 시간 시스템의 응답시간 T는 평균 m=2인 지수분포 신호에 대한 응답이 끝나면 곧 바로 다음 신호를 접수 X : 오전 9:00부터 2건의 신호가 들어올 때까지 걸리는 시간 (1) X의 확률밀도함수 (2) 2건의 신호가 들어올 때까지 걸리는 평균 시간 (3) 2건의 검색요구가 3초 안에 이루어질 확률 (1) 시스템의 응답시간 T는 평균 m=2인 지수분포에 따르므로 T ~ Exp(1/2) T1 : 오전 9:00부터 처음 신호가 들어올 때까지 걸리는 시간 T2 : 처음 신호 이후에 두 번째 신호가 들어올 때까지 걸리는 시간 T1 ~ Exp(1/2) , T2 ~ Exp(1/2) X = T1 + T2 ~ G(2, 2) x2-1 e-x/2 = xe-x/2 , x > 0 G(2) 22 1 f(x) = 4

 (2) (3) P(X < 3) = xe-x/2 dx = - e-x/2 = 1 - e-3/2 = 0.4421 m = a b = 2•2 = 4 1 4 P(X < 3) = xe-x/2 dx = - e-x/2 = 1 - e-3/2 = 0.4421 x + 2 2 3 5 

카이제곱(c2)분포(chi-squared distribution) 모수 a = r/2, b = 2인 감마분포를 자유도(degree of freedom; d.f.) r 인 카이제곱분포라 하고, X ~ c2(r)로 나타낸다. ☞ 1) 확률밀도함수 X ~ c2(r) x(r/2)-1 e-x/2 , x > 0, r > 0 G(r/2) 2r/2 1 f(x) = 2) 평균 ☞ m = ab = • 2 = r r 2 3) 분산 s2 = ab2 = • 4 = 2r

☞ 카이제곱분포의 백분위수 카이제곱분포의 100(1-a)% 백분위수 ca(r) 2 P(X ≤ x0 ) = 1 – a인 x0을 100(1-a)% 백분위수라 하고, ca(r)로 나타낸다. 2

에 대하여 P(X > c0.05 ) = 0.05를 만족하는 c0.05 X ~ ca(7) 2 에 대하여 P(X > c0.05 ) = 0.05를 만족하는 c0.05 d.f. = 7인 행과 a = 0.05인 열이 만나는 위치의 수 14.07 c0.05 = 14.07 2

☞ 카이제곱분포의 성질 X ~ c2(5)에 대하여 P(X < x0) = 0.95 x0 = ? P(X < x0) = 0.95이므로 P(X > x0) = 0.05 이고, 따라서 카이제곱표에서 d.f. = 5와 a = 0.05인 백분위수 x0 = c0.05 (5) = 11.07 2 ☞ 카이제곱분포의 성질 X ~ c2(r1), Y ~ c2(r2)이고 독립이면, X + Y ~ c2(r1 + r2)이다. X ~ c2(2), Y ~ c2(4) 이고 독립일 때, P(X + Y > x0) = 0.01 x0 = ? X ~ c2(2), Y ~ c2(4) 이고 독립이므로 X + Y ~ c2(6)이다. 그러므로 x0 = c0.01 (6) = 16.81 2

정규분포 (normal distribution) 4 정규분포 (normal distribution) 정규분포, 표준정규분포의 확률밀도함수와 평균, 분산을 비롯한 특성과 중심극한정리, 이항분포의 정규근사 등에 대하여 알아본다.

☞     1) 확률밀도함수 부록 A-4.2로부터 e-z /2 dz = 피적분함수가 우함수이므로 e-z /2 dz = ∞  2 2 p 부록 A-4.2로부터 e-z /2 dz = 피적분함수가 우함수이므로 -∞ ∞  2 e-z /2 dz = 2 p -∞ ∞  1 2 e-z /2 dz = 1 x - m s z = p.d.f. 조건을 만족 -∞ < m < ∞, s > 0 ( x - m )2 2s2 -∞ ∞  1 s exp - dx = 1

☞ ☞ 2) 평균 : 3) 분산 : 확률밀도함수 : X ~ N(m, s2) ( x - m )2 1 f(x) = , -∞ < x< ∞, -∞ < m< ∞, s > 0 exp - s 2s2 모수 m과 s2 인 정규분포 ☞ 2) 평균 : m = m ※ 평균 m이고, 분산 s2 임을 보이는 것은 생략한다. ☞ 3) 분산 : s2 = s2 m = 0과 s2 = 1인 경우 확률밀도함수 : Z ~ N(0, 1) 표준정규분포 f(z) = e –z /2 , -∞ < z< ∞ 2 1 p

☞ ☞ 정규확률함수의 성질 표준정규확률함수의 성질 (1) f(x)는 x=m에 관하여 좌우대칭이고, 따라서 X의 중앙값은 Me = m이다. (2) f(x)는 x=m에서 최대값을 가지고, 따라서 X의 최빈값은 Mo = m이다. (3) x= m-s, m+s에서 f(x)는 변곡점을 가지며, x= m-3s, m+3s에서 x-축에 거의 접하는 모양을 가지고 x→ -∞, x→ +∞이면 f(x)→ 0이다. ☞ 표준정규확률함수의 성질 (1) f(z)는 z=0에 관하여 좌우대칭이고, 따라서 Z의 중앙값은 Me = 0이다. (2) f(z)는 z=0에서 최대값을 가지고, 따라서 Z의 최빈값은 Mo = 0이다. (3) z=-1, 1에서 f(z)는 변곡점을 가지며, z=-3, 3에서 z-축에 거의 접하는 모양을 가지고 z→ -∞, z→ +∞이면 f(z)→ 0이다.

모수 m는 분포의 중심을 나타내며, s는 흩어진 정도를 나타낸다. Note m1≠ m2 s1 = s2 m1= m2 s1≠ s2

☞ 표준정규분포의 성질 (1) P(Z ≤ 0 ) = P(Z ≥ 0 ) = 0.5 (2) P(Z ≤ -z0 ) = P(Z ≥ z0 ) = 1- P(Z < z0), z0 > 0 (3) P(Z ≤ z0 ) = 0.5 + P(0 < Z < z0 ), P(Z ≥ z0) = 0.5 - P(0 < Z < z0), z0 > 0 (4) P(|Z|≤ z0 ) = P(-z0 < Z < z0 ) = 2P(0 < Z < z0), z0 > 0 P(Z < z0), z0 > 0

(5) P(|Z|≤ 1.645 ) = 0.9, P(|Z|≤ 1.96 ) = 0.95, P(|Z|≤ 2.58 ) = 0.99 0.05 0.025 0.005

☞  표준정규분포의 분포함수 F(z) = f(u)du -∞ z  F(z) = f(u)du (7) 1 - F(z0 ) = P(Z ≥ z0 ) = P(Z ≤ -z0 ) = F(-z0 ) , z0 > 0 X - m s Z = (8) X ~ N(m, s2) ~ N(0, 1) x0 - m s z0 = (9) P(X < x0) = P(Z < z0) = F(z0) ,

( ) ( ) ( ) ( ) (10) P(a < X < b) = F - F b - m s a - m ( ) ; P(a < X < b) = P a - m s b - m ( ) X - m < < = P < Z < ( ) = F - F ( ) (11) P(m + as < X < m + bs) = P(a < Z < b) = F(b) – F(a) (12) P(m - s < X < m + s) = P(-1 < Z < 1) = 0.683 P(m - 2s < X < m + 2s) = P(-2 < Z < 2) = 0.954 P(m - 3s < X < m + 3s) = P(-3 < Z < 3) = 0.998

☞ 표준정규분포의 백분위수 표준정규분포의 100(1-a)% 백분위수 : za P(Z ≤ z0 ) = 1 – a인 z0을 100(1-a)% 백분위수라 하고, za로 나타낸다.

☞ 표준정규확률표 사용방법 P(Z ≤ 1.36) = ? Z < 1.36의 소숫점 이하 첫째 자리인 1.3을 z열에서 선택하고, 소숫점 이하 둘째 자리인 .06을 z행에서 선택하여 만나는 값 0.9131을 선택한다.

( ) ( ) 예 X ~ N(3, 4) (1) P(X ≤ 4.5) = F = F(0.75) = 0.7734 4.5 - 3 2 ( ) 4.5 - 3 2 F(-0.75) = 1 - F(0.75) = 1 – 0.7734 = 0.2266 P(1.5 ≤ X ≤ 5.5) = F(1.25) - F(-0.75) = 0.8944 – 0.2266 = 0.6678 5.5 - 3 2 1.5 - 3 ( ) (2) P(1.5 ≤ X ≤ 5.5) = F - F = F(1.25) - F(-0.75)

표준정규확률표를 이용하여 (1) P(0 < Z < 1.54) (2) P(-1.10 < Z < 1.10) (3) P(Z < -1.78) (4) P(Z > -1.23) (1) P(0 < Z < 1.54) = P(Z < 1.54) – 0.5 = 0.9382 – 0.5 = 0.4382 (2) P(-1.10 < Z < 1.10) = 2P(0 < Z < 1.10) = 2[P(Z < 1.10) – 0.5)] = 2(0.8643 - 0.5) = 0.7286 (3) P(Z < -1.78) = P(Z > 1.78) = 1 - P(Z < 1.78) = 1 – 0.9625 = 0.0375 (4) P(Z > -1.23) = P(Z < 1.23) = 0.8907

X ~ N(5, 4)에 대하여 (1) P(X < 6.4) (2) P(X < x0) = 0.9750인 x0 = ? (3) P(3 < X < x0) = 0.756인 x0 =? (1) m = 5, s = 2이므로 X를 표준화 하면 ( ) 6.4 - 5 2 P(X ≤ 6.4) = P Z < = F(0.70) = 0.7580 (2) X를 표준화 하면 ( ) x0 - 5 2 P(X < x0) = P Z < 표준정규확률표로부터 P(Z < 1.96) = 0.9750 x0 - 5 2 = 1.96 ; x0 = 5 + 2•(1.96) = 8.92

( ) x0 - 5 2 3 - 5 2 X - 5 2 (3) P(3 < X < x0) = P < < ( ) x0 - 5 = P -1 < Z < 2 x0 - 5 ( ) = P Z < - P(Z < -1) 2 한편, P(Z < -1) = P(Z > 1) = 1 – P( Z < 1) = 1 – 0.8413 = 0.1587 x0 - 5 2 ( ) P(3 < X < x0) = P Z < - 0.1587 = 0.756 x0 - 5 2 ( ) P Z < = 0.756 + 0.1587 = 0.9147 표준정규확률표로부터 P(Z < z0 ) = 0.9147에 대하여 약 z0 = 1.37 x0 - 5 2 = 1.37 ; x0 = 5 + 2•(1.37) = 7.74

( ) ( ) 성인의 혈압은 평균 128.4, 표준편차 19.6인 정규분포 (1) 임의로 선정된 사람의 혈압이 100 이하일 확률 (2) 임의로 선정된 사람의 혈압이 134 이상일 확률 (3) 임의로 선정된 사람의 혈압이 110에서 130 사이일 확률 (1) X ~ N(128.4, 19.62)이므로 P(X ≤ 100) = P ≤ ( ) X – 128.4 19.6 100 – 128.4 (2) P(X ≥ 134) = P ≥ ( ) 134 – 128.4 = P(Z ≥ 0.29) = 1 – P(Z < 0.29) = 1 – 0.6141 = 0.3859 = P(Z ≤ -1.45) = 1 – P(Z ≤ 1.45) = 1 – 0.9265 = 0.0735

(3) X ~ N(128.4, 19.62)이므로 = P(-0.94 ≤ Z ≤ 0.08) = P(Z ≤ 0.08) – P(Z < -0.94) = P(Z ≤ 0.08) – [1-P(Z < 0.94)] = 0.5319 – (1 - 0.8264) = 0.3583 P(110 ≤ X ≤ 130) = P ≤ ≤ ( ) X – 128.4 19.6 130 – 128.4 110 – 128.4

☞ 정규분포의 성질 X ~ N(m1, s2) , Y ~ N(m2, s2) : 독립이면 (aX + b) - (am1 + b) |a|s1 ~ N(0, 1) aX + b ~ N(am1 + b, a2 s2 ) X + Y ~ N(m1 + m2 , s2 + s2 ) X - Y ~ N(m1 - m2 , s2 + s2 ) (X + Y) –( m1 + m2 ) s2 + s2 - (1) (2) (3) (4) (5)

( ) ( ) 전자공학개론 교재의 무게 : X ~N(1.59, 0.582), 일반물리학 교재의 무게 : Y ~ N(2.18, 0.812) (1) 구입한 전자공학 개론 교재의 무게가 2.35(kg) 이하일 확률 (2) 구입한 두 교재의 전체 무게가 5.04(kg) 이상일 확률 (3) 일반물리학 교재와 전자공학개론 교재의 무게 차이가 0.35(kg) 이하일 확률 (1) X ~ N(1.59, 0.582)이므로 ( ) X – 1.59 0.58 2.35 – 1.59 0.58 P(X ≤ 2.35) = P ≤ = P(Z ≤ 1.31) = 0.9049 P(S ≥ 5.04) = P ≥ ( ) S – 3.77 0.9962 5.04 – 3.77 = P(Z ≥ 1.27) = 1 – P(Z < 1.27) = 1 – 0.8980 = 0.102 (2) S = X + Y ~ N(3.77, 0.99622)이므로

(3) D = Y - X ~ N(0.59, 0.99622)이므로 ( ) D – 0.59 0.35 – 0.59 P(D ≤ 0.35) = P ≤ 0.9962 0.9962 = P(Z ≤ -0.24) = 1 – P(Z < 0.24) = 1 – 0.5948 = 0.4052

☞ 표본평균(sample mean) X1 , X2 , …, Xn : 독립 확률변수 Xi ~ N(mi , si ), i = 1, 2, …, n 2 Y = a1X1 + a2X2 + … + anXn ~ N(m , s2 ) , m = a1 m1 + a2 m2 + … + an mn , s2 = a1 s1 + a2 s2 + … + an sn ai = , i = 1, 2, …, n 1 n Y = (X1 + X2 + … + Xn ) ~ N(m , s2 ) , m = ( m1 + m2 + … + mn ) , s2 = (s1 + s2 + … + sn ) n2

( ) ( ) 표본평균(sample mean) : Xi ~ i.i.d. N(m , s2 ), i = 1, 2, …, n 1 ( ) n s2 Y = (X1 + X2 + … + Xn ) ~ N m , 표본평균(sample mean) : 평균 m, 분산 s2인 i.i.d. 확률변수들 Xi , i = 1, 2, …, n 에 대하여 X = (X1 + X2 + … + Xn ) 1 n 을 표본평균이라 한다. Xi ~ i.i.d. N(m , s2), i = 1, 2, …, n 1 n ( ) n s2 X = (X1 + X2 + … + Xn ) ~ N m ,

( ) 정리 2 중심극한정리(central limit theorm) 평균 m, 분산 s2인 임의의 i.i.d. 확률변수들 Xi , i = 1, 2, …, n 에 대하여 n이 충분히 크다면, 표본평균 X는 평균 m, 분산 s2/n인 정규분포에 가까워진다. 즉, 다음이 성립한다. X = (X1 + X2 + … + Xn ) N m , 1 n s2 ( ) ~ X1 + X2 + … + Xn N( nm , ns2 ) ~ 평균 m, 분산 s2인 임의의 i.i.d. 확률변수들 Xi , i = 1, 2, …, n 에 대하여 n이 충분히 크다면, 중심극한정리로부터

예 X1 , X2 ~ i.i.d. f(x)= 1/6, x=1, 2, 3, 4, 5, 6 의 확률분포 ? X = (X1 + X2 ) 1 2 X1 , X2 의 결합분포

의 확률분포 ? X = (X1 + X2 + X3 ) 1 3 의 확률분포 ? X = (X1 + X2 + X3 + X4 ) 1 4

( ) 각 증권 당 연간 보험금 지급액이 평균 19,400(만원), 표준편차 5,000(만원) 보험회사는 올해 1,000개의 자동차보험증권을 판매 (1) 전체 보험 지급액에 대한 근사확률분포 (2) 전체 보험 지급액이 19,800,000(만원)을 초과할 근사확률 (3) 가입한 증권에 대한 평균 보험 지급액에 대한 근사확률분포 (4) 평균이 19,600(만원)을 초과할 확률 (1) Xi , i = 1, 2, …, 1000 : 각 증권 당 연간 지급액 각 증권 당 연간 보험금 지급액이 평균 19,400이고 표준편차 5,000이므로 중심극한정리에 의하여 X = S Xi ~ N[(19.4)•106, (2.5)•1010 ] i=1 1000 ~ ( ) X – (19.4)•106 (2.5)•1010 (19.8)•106 – (19.4)•106 (2.5)•1010 (2) P[X ≥ (19.8)•106 ] = P ≥ = P(Z ≥ 2.53) = 1 – F(2.53) = 1 – 0.9943 = 0.0057 .

( ) ( ) (3) 각 증권 당 연간 보험금 지급액이 평균 19,400이고 표준편차 5,000이므로 표본평균은 평균 19,400이고 분산 (5000)2/1000 = 25000 인 정규분포에 근사함. X P(19400, 25000) ~ P(X ≥ 19600) = P ≥ X – 19400 2.5 100 19600 – 19400 ( ) = P Z ≥ = P(Z ≥ 1.266) ( ) . = 1 - P(Z < 1.266) = 1- 0.89728 = 0.10272 (4) P(Z≤ 1.26) = 0.8962, P(Z ≤ 1.27) = 0.8980 편차 : P(Z ≤ 1.27) - P(Z≤ 1.26) = 0.0018 편차를 10등분하여 6번째 값 0.00108을 이용 P(Z < 1.266) = 0.8962 + 0.00108 = 0.89728

☞ 이항분포의 정규근사(normal approximation) 시행횟수 n이 커질수록 이항분포는 평균 m = np, 분산 s2 = np(1-p)인 정규분포에 가까워지며, 일반적으로 np ≥ 5, n(1-p) ≥ 5일 때 이항분포 B(n, p)와 정규분포 N(np, np(1-p))가 거의 일치한다. X N(np, np(1-p)) ~ X - np npq N(0, 1) 또는

( ) ( ) X ~ B(15, 0.4)에 대하여 (1) 이항확률표에 의한 P(7 ≤ X ≤ 9) = ? (1) P(7 ≤ X ≤ 9) = P(X ≤ 9) – P(X ≤ 6) = 0.9662 -0.6098 = 0.3564 (2) np = 6, npq = 3.6 X N(6, 3.6) ~ ~ ( ) P(7 ≤ X ≤ 9) = P ≤ ≤ X - 6 3.6 9 - 6 7 - 6 = P(0.527 ≤ Z ≤ 1.581) = P(Z ≤ 1.581) - P(Z ≤ 0.527) = 0.9429 – 0.7019 = 0.241 . P(6.5 ≤ X ≤ 9.5) = P ≤ ≤ X - 6 3.6 9.5 - 6 6.5 - 6 ( ) = P(0.263 ≤ Z ≤ 1.845) = P(Z ≤ 1.845) - P(Z ≤ 0.263) = 0.9675 – 0.6040 = 0.3635 (3) .

( ) ( ) 결 론 X ~ B(n, p), Z ~ N(0, 1)에 대하여 np ≥ 5, n(1-p) ≥ 5이면 . 결 론 X ~ B(n, p), Z ~ N(0, 1)에 대하여 np ≥ 5, n(1-p) ≥ 5이면 . P(a≤ X ≤ b) = F - F b -np npq a -np ( ) F - F ( ) b + 0.5 -np a - 0.5 -np ; 정규근사 ; 연속성 수정 정규근사

( ) ( ) ( ) X ~ B(30, 0.2)에 대하여 (1) 확률질량함수를 이용한 P(X = 4) = ? f(x) = (0.2)x (0.8)30-x , x = 0, 1, 2, …, 30 30 x ( ) P(X = 4) = f(4) = (0.2)4 (0.8)26 = 0.1325 30 x ( ) P(X = 4) = P(3.5 ≤ X ≤ 4.5) ( ) = P ≤ ≤ X - 6 4.8 4.5 - 6 3.5 - 6 = F(-0.68) – F(-1.14) = 0.8729 – 0.7517 = 0.1212 . (2) np = 6, npq = 4.8 X N(6, 4.8) ~

( ) ( ) ☞ 포아송분포의 정규근사 포아송분포의 평균 m가 충분히 커지면, 정규분포 N(m, m)에 가까워진다. X – m ~ m X N(m, m) ~ 또는 X ~ P(m), Z ~ N(0, 1)에 대하여 m가 충분히 커지면 . P(a≤ X ≤ b) = F - F b - m a - m ( ) F - F ( ) b + 0.5 - m a - 0.5 - m ; 정규근사 ; 연속성 수정 정규근사 m

X ~ P(20)과 X ~ N(20, 20)의 비교 9,500명의 각 보험 종류별로 가입자 수와 가입 기간에 따른 보험금 청구 횟수 표 1년 동안 이들 보험에 가입한 2,000명 중에서 보험금을 청구한 가입자가 228명 이하일 근사확률 ? 단, 보험의 종류는 독립적이고, 보험금 청구 횟수 ~ 포아송 분포

이변량정규분포(bivariate normal distribution) 상수 sX > 0, sY > 0, -∞ < mX , mY < ∞, -1 < r < 1에 대하여 Q = 1 – r2 1 ( ) x - mX sX 2 y - mY sY -2r + [ ] ☞ 1) 결합확률밀도함수 (X, Y ) ~ N(mX, mY, sX, sY, r) 2 2 f(x, y) = 1 - r2 2p sX sY 1 e-Q/2 , -∞ < x, y < ∞ 여기서, r = Corr(X, Y )

[ ] X와 Y가 독립인 경우 : f(x, y) = 2p sX sY 1 , -∞ < x, y < ∞ exp (x – mX )2 2sX (y – mY )2 2sY 2 - [ ] mX =0, mY = 0, sX =1, sY =1, r =0

☞ 이변량정규분포의 성질 (1) r > 0이면, X와 Y가 양의 상관관계에 있으므로 X와 Y의 결합밀도함수는 직선 y = x에 근접하는 영역에 집중된다. (2) r < 0이면, X와 Y가 음의 상관관계에 있으므로 X와 Y의 결합밀도함수는 직선 y = -x에 근접하는 영역에 집중된다. mX =0, mY = 0, sX =1, sY =1, r =0.8 mX =0, mY = 0, sX =1, sY =1, r = -0.8

☞ ( ) ☞ ( ) 2) 주변확률밀도함수 3) 조건부 확률밀도함수 fX(x) = 1 , -∞ < x < ∞ exp sX 2p (x – mX )2 2sX 2 ( ) - ~ N(mX, sX ) fY(y) = , -∞ < y < ∞ sY (y – mY )2 2sY ~ N(mY, sY ) ☞ 3) 조건부 확률밀도함수 , -∞ < x < ∞ exp f(x|y) = = fY(y) f(x, y) 1 - r2 sX 2p 1 ( ) (x – bX )2 2sX (1 – r2) 2 - , -∞ < y < ∞ f(y|x) = = fX(x) 1 -r2 sY (y – bY )2 2sY (1 – r2) bX = mX + r (y – mY) sX sY bY = mY + r (x – mX) sY sX

☞ ☞ 4) 조건부 평균 5) 조건부 분산 sX E(X|Y=y) = mX + r (y – mY) sY sY E(Y|X=x) = mY + r (x – mX) sY sX ☞ 5) 조건부 분산 Var(X|Y=y) = sX (1 – r2) 2 Var(Y|X=x) = sY (1 – r2)

( ) 신혼부부를 대상으로 한 모집단에서 남편의 키(X)와 아내의 키(Y) (X, Y ) ~ N(176, 160, 1.0, 1.52, 0.6) (1) 남편의 키가 173cm일 때, Y의 조건부 확률분포 (2) P(154 < Y < 158|X = 173) = ? (1) (X, Y ) ~ N(176, 160, 1.0, 1.52, 0.6) 이므로 E(Y|X=173) = mY + r (x – mX) sY sX = 160 + (0.6)•(1.5)•(173 – 176) = 157.3 Y의 조건부 평균 : Y의 조건부 분산 : Var(Y|X=173) = sY (1 – r2) = (2.25)•(0.64) = 1.44 2 Y의 조건부 확률분포 : Y|X=173 ~ N(157.3, 1.44) ( ) 154 – 157.3 1.2 158 – 157.3 1.2 (2) P(154 < Y < 158|X = 173) = P < Z < = P(-2.75 < Z< 0.58) = F(0.58) – F(-2.75) = 0.7190 + 0.9970 -1 = 0.7160

제 5 장