Presentation is loading. Please wait.

Presentation is loading. Please wait.

제 4 장 여러 가지 분포.

Similar presentations


Presentation on theme: "제 4 장 여러 가지 분포."— Presentation transcript:

1 제 4 장 여러 가지 분포

2 § 4.1 이산형 균일분포 이고 이면 X는 이산형 균일분포(discrete uniform distribution)를 따른다고 한다. 특히 , 즉 X가 정수값을 가지면 -1-

3 <예제 4.1> X : 주사위 한번 던져 나오는 눈 <예제 4.2> 동전 1개와 주사위 1개 표본공간
동전 앞면  눈의 수만큼 돈을 받음 뒷면  눈의 수만큼 돈을 줌 -2-

4 X=받게 될 돈의 액수 <연습문제 #6> 주사위 3번 던질 때 최대값 M (a) 한번 던질 때 눈이 k 이하일 확률
(b) M이 홀수일 확률 -3-

5 (주) 균등표본공간 상에 정의된 확률변수라 하여 반드시 이산형 균일분포를 따르는 것은 아니다.
(주) 균등표본공간 상에 정의된 확률변수라 하여 반드시 이산형 균일분포를 따르는 것은 아니다. <예> 동전 2번 던지기 는 균등표본공간 X를 H의 수라 정의하면 가 된다고 하여 가 되는 것은 아니다 x 1 2 -4-

6 § 4.2 베르누이 시행과 이항분포 1. 베르누이 실험(Bernoulli experiment): 나올 수 있는 결과가 2개 뿐인 실험 동전 던지기  앞면과 뒷면 각종 시험  합격과 불합격 결과가 여럿이라도 이들을 두 부류로 분류 <예>  성공(s) 과 실패(f) 예: 주사위 던지기  짝수와 홀수  표본공간 라 정의하자 -5-

7 일 때, 확률변수 X는 모수가 p인 베르누이 분포 (Bernoulli distribution)를 따른다고 한다
확률함수가 일 때, 확률변수 X는 모수가 p인 베르누이 분포 (Bernoulli distribution)를 따른다고 한다 베르누이 분포는 매우 단순해서 그 자체로서 보다는 베르누이 실험을 반복해서 얻어지는 분포들을 유도하는 바탕으로서의 의미를 갖는다. -6-

8 2. 베르누이 시행(Bernoulli trials) : 동일한 베르누이 실험을 반복하는 것
<예> 베르누이 시행을 독립적으로 10번 반복할 때 성공이 4번 실패가 6번 나올 확률 표본점의 수 성공이 4번인 경우: 가지 각 경우의 확률  성공이 4번 나올 확률 -7-

9 일반적으로 n번 시행해서 s가 x 번 f 가 번 나올 확률:
특정순서 경우의 수  성공횟수 X 의 확률함수 이때 X 는 모수가 n 과 p 인 이항분포(binomial distribution)을 따른다 하고 로 표기 이항정리 (식 3.2a)에 의해 의 이항전개에서 나오는 항들  이항분포, 이항확률 등의 용어 -8-

10 -9-

11 <예제 4.4> 4지선다형 10문항, 문항당 10점, 40점 미만 낙제 과목지식이 없는 학생이 낙제를 면할 확률은?
<예제 4.4> 4지선다형 10문항, 문항당 10점, 40점 미만 낙제 과목지식이 없는 학생이 낙제를 면할 확률은? (a) 감점이 없는 경우 맞은 문항의 수 점수 -10-

12 (c) 점수의 기대값이 0 이 되도록 하는 채점규칙
(b) (c) 점수의 기대값이 0 이 되도록 하는 채점규칙  틀린 문항 10/3 점 감점 (d) -11-

13 이항분포표 (부록 표 B.1) : i) <예> <예제 4.4> ii) -12-

14 <예제 4.6> 불량률이 5%라 알려진 공정에서 제품 10개 검사
<예제 4.5> <예제 4.6> 불량률이 5%라 알려진 공정에서 제품 10개 검사 불량률이 실제로 5%라면 이 일어날 확률 약 1%  실제로 10개중 불량품이 3개 나왔다면 불량률이 커졌다고 판단 -13-

15 <연습문제 #7> 전자파와 태아의 성별이 무관하다면
<연습문제 #7> 전자파와 태아의 성별이 무관하다면  전자파와 태아의 성별이 무관하다고 판단. n=10, p=0.5 일 때 n=10, p=0.1 n=10, p=0.9 <이항분포> -14-

16 §4.3 초기하분포 <예제 4.7> 검은돌(B) 7개와 흰돌(W) 3개 무작위로 2개를 꺼낼때 흰돌의 수 X
복원추출 : 베르누이 시행 비복원 추출 :  베르누이 시행이 아니다 N 개의 개체 중 속성 A 를 가진 것 M개 N 개 중 n 개를 비복원으로 뽑을 때 X = n 개중 속성 A 를 가진 것의 수 개의 서로 다른 조합 각 조합이 뽑힐 확률 -15-

17 n 개 중 속성 A를 가진 것이 x 개 포함될 경우의 수
이때 X는 모수가 N, M, n 인 초기하분포(hypergeometric distribution)를 따른다고 하고 X ~ HG(N, M, n) 으로 표기 <예제 3.14> (b) 에 의해 일 때 -16-

18  x 의 범위 따질 필요없이 x=0,1,…,n 이라 할 수 있다.
-17-

19 X의 평균 * 식 (3.3)에서 로 대체하면 -18-

20 은 유한수정계수 (finite population correction: fpc)
X의 분산 비슷한 방법으로 (연습문제 #11*) binomial 경우와 비교 여기서 은 유한수정계수 (finite population correction: fpc) -19-

21  N이 크면 초기하분포의 확률 ≈ 이항분포의 확률
(연습문제 #12*)  N이 크면 초기하분포의 확률 ≈ 이항분포의 확률 <예제 4.8> 이면 이항분포확률로 근사해도 별 차이가 없다. -20-

22 §4.4 포아송분포 <예> 어느 교차로에서 1주일 동안 일어나는 교통사고의 수
<예> 어느 교차로에서 1주일 동안 일어나는 교통사고의 수 1주일을 n개의 구간으로 나누되 한 구간에서는 사고가 2번 이상 안 일어나도록 즉 P(사고 2번 이상)≈0 이 되도록 n을 충분히 크게 사고발생여부의 관찰은 베르누이 시행을 독립적으로 반복하는 것  일주일 동안의 사고 건수  구간을 짧게 (n을 크게) 나누면 p 는 작아진다. 로 고정시키고 n을 크게하면 X의 p(x)는 어떻게 될까? -21-

23 여기서 -22-

24 일 때, X 는 모수가 인 포아송분포(Poisson distribution)를 따른다고 하고
(4.18) 일 때, X 는 모수가 인 포아송분포(Poisson distribution)를 따른다고 하고 포아송분포는 rare events를 모형화 하는데 주로 쓰인다. <예> 일정지역에서 일정기간에 일어나는 교통사고건수/자살건수 일정기간에 교환대에 걸려오는 전화횟수 교과서 페이지당 오타수  n은 크고 p 는 작다 -23-

25 n 이 크고 p 가 작되 np<5 이면 이항분포확률의 포아송근사화가 좋다.
<예제 4.10> n 이 크고 p 가 작되 np<5 이면 이항분포확률의 포아송근사화가 좋다. -24-

26 * 확률함수 식 (4.18)로부터 직접구하면 (연습문제 #10) 포아송분포표 (부록의 표 B.2) -25-

27 (a) <예제 4.12> x x -26- p(x) p(x) (b) [그림 4.2] 포아송분포
p(x) x p(x) x (a) (b) [그림 4.2] 포아송분포 -26-

28 §4.5 기하분포와 음이항분포 기하분포 첫번째 성공( s )이 나올 때 까지 베르누이 시행 반복
X = 첫번째 성공 ( s )이 나올 때까지의 실패( f ) 회수 이때 X 는 모수가 p 인 기하분포(geometric distribution)를 따른다고 하고, X ~ Geo(p) 로 표기 -27-

29 <예제 4.13> 윷놀이에서 9구간이상 말을 옮길 확률
(식 (3.5) a) <예제 4.13> 윷놀이에서 9구간이상 말을 옮길 확률 윷 또는 모가 나올 확률 윷이나 모가 연속 x 번 나올 확률 윷놀이에서 말을 9구간 이상 옮김 -28-

30 기하분포의 무기억성 (memoryless property)
<예제 4.14> 합격할 때까지 떨어지는 횟수 -29-

31 * 식(3.5c)에서 k=1, k=2로 놓아 얻은 식을 이용하여 직접구하면
(연습문제 #9) -30-

32 <예> password (key) k 개중 하나만 맞는 것 맞는 것을 찾을 때까지 하나씩 맞추어본다.
(식 3.10) (식 3.11) (N의 분포를 기하분포라 부르기도 한다.) <예> password (key) k 개중 하나만 맞는 것 맞는 것을 찾을 때까지 하나씩 맞추어본다. 비복원: -31-

33 복원: -32-

34 이때 X 는 모수가 r 과 p 인 음이항분포(negative binomial distribution)를
독립 이때 X 는 모수가 r 과 p 인 음이항분포(negative binomial distribution)를 따른다고 하고, X~NB(r, p)로 표기 -33-

35 -34-

36 한 게임에서 A가 이길 활률을 p, B가 이길 확률 q
(N의 분포를 음이항분포라 부르기도 한다) <연습문제 #6> 한국시리즈 A, B 두팀 한 게임에서 A가 이길 활률을 p, B가 이길 확률 q -35-

37 n 4 5 6 7 p(n) 2/16 4/16 5/16 5/16 -36-

38 3번의 성공(충격)이 일어날 때까지의 실패횟수
<예제 4.16> 충격이 3번 이상이면 고장 나는 기계 3번의 성공(충격)이 일어날 때까지의 실패횟수 이고, 기계를 7년 이상 고장 없이 쓸 수 있을 확률은? -37-

39 §4.6 연속형 균일분포와 베타분포 연속형 균일분포 연속형 확률변수 X에 관한 확률
가 구간 (a, b)의 위치에 무관하고 구간의 폭 (b-a)에 비례한다면 f(x)의 높이가 같을 수 밖에 없다. -38-

40 -39-

41 균일분포는 다른 연속형 확률변수의 모의(simulation) 관측값들을 생성하는데 쓰인다.
<예제 4.17> 균일분포는 다른 연속형 확률변수의 모의(simulation) 관측값들을 생성하는데 쓰인다. <정리 4.1> -40-

42 * 정리 4.1, 4.2 에서 F가 비감소함수일 경우도 성립 (보충문제 #23*)
<정리 4.2> * 정리 4.1, 4.2 에서 F가 비감소함수일 경우도 성립 (보충문제 #23*) <예제 4.18> -41-

43 화학약품의 불순률, 기계의 가동률, 공정의 불량률 등
베타분포 베르누이 시행에서 성공비율 화학약품의 불순률, 기계의 가동률, 공정의 불량률 등  일정하게 고정되어있지 않고 (0,1) 사이에서 변하는 확률변수로서의 속성을 가질 경우의 분포모형 필요 -42-

44 <예> -43-

45 [그림 4.4] 베타분포 -44-

46 -45-

47 베타분포의 확률계산 <예제 4.20> -46-

48 확률계산 : ① ② (4.42) <예제 4.21> <예제 4.20>에서 식 (4.12)를 이용하면
-47-

49 §4.7 정규분포 자연현상에 대한 관측자료 자연과학, 의학, 공학적 실험자료 사회, 경제 현상에 대한 조사자료
히스토그램(histogram) (§11.3.1)을 그려보면 좌우대칭이고 bell-shaped 인 경우가 많다. 히스토그램이 한쪽으로 치우친(skewed) 경우라도 자료가 많으면 산술평균의 히스토그램은 좌우대칭이고 bell-shaped (§ 7.4) -48-

50 식 (3.7d)를 이용하면 -49-

51 (연습문제 #9) -50-

52 -51-

53 그림 4.5 정규분포 -52-

54 표준정규분포 (부록의 표 B.3) <예제 4.23> -53-

55 N(0,1)의 분포가 0을 중심으로 대칭이므로 ① ② ③ 이항분포의 근사화 <예제 4.25> (a) 이항분포표 :
(b) 정규분포표 : -54-

56 <예제 4.26> (a) 포아송분포표: (b) 정규분포표 : -55-

57 이를 연속성보정(continuity correction)이라 한다.
a b 그림 4.6 정규근사화 X: 원래의 이산형 확률변수 Y: X에 대응되는 정규확률변수 이를 연속성보정(continuity correction)이라 한다. -56-

58 <예제 4.27> 연속성 보정을 한 경우 <예제 4.25> <예제 4.26> 
(연습문제 #11) -57-

59 그림 4.7 정규분포의 상위 100p 백분위수 자연계열 성적분포 <예제 4.28> 인문계열 “
인문계열 “ <예제 4.28> 자연계열 330점의 표준화 인문계열 330점의 표준화 -58-

60 <정리 3.5> -59-

61 <예제 4.29> -60-

62 §4.8 지수분포와 감마분포 지수분포 § 4.4 : 단위시간(1주일)동안 일어나는 교통사고 횟수 :
몇가지 기본 조건하에 포아송분포 단위시간 대신 t 시간이라면? 기본조건 i) (0,t]를 n개의 구간으로 나눌 수 있고, 서로 중첩되지 않는 구간에서는 사건들이 독립적으로 발생 ii) 충분히 짧은 구간에서 사건이 2 번이상 일어날 확률은 0 iii) 한 구간에서 사건이 일어날 확률은 구간의 길이에 비례  이러한 조건을 만족하는 현상 : 포아송 과정 (Poisson process) -61-

63 (0,t]를 n개의 짧은 구간으로 나누면 한 구간에서
기본조건 iii) 기본조건 ii) (0,t]동안 사건 발생횟수 기본조건 i) 첫 사건이 일어날 때까지 경과시간 T: -62-

64 이때 T는 모수가 인 지수분포(exponential distribution)를 따른다고 하고, 로 표기
하고, 로 표기 <예제 3.34>로부터 -63-

65 전자부품이나 시스템의 고장현상 : 포아송과정을 형성하는 경우 많다.
 고장날 때까지의 경과시간 : 지수분포 모형이 잘 맞는다. 2.0 1.0 1.5 0.5 그림 4.8 지수분포 -64-

66 5년 이내에 고장이 나서 못쓰게 될 확률 = P(T<5)
<예제 4.30> 어느 전자제품의 수명(단위:년) 5년 이내에 고장이 나서 못쓰게 될 확률 = P(T<5)  약 63%가 평균수명 내에 고장나서 못쓰게 된다. -65-

67  무기억성 (memoryless property)
이산형 분포 중에 기하분포 연속형 분포 중에 지수분포 유일하게 무기억성을 갖는다. <예제 4.31> <예제 4.30>에서 10년 된 것이 앞으로 5년 내에 고장날 확률  10년 쓴 제품과 새 제품의 수명이 같다? 지수분포의 고장률이 로서 일정하다는 가정에 따른 것  지수분포 : 마모나 노후화 고장은 거의 없고 우발적 고장이 대부분인 경우 수명분포의 모형 -66-

68 이때 T는 모수가 n과 인 얼랑분포(Erlang distribution)를 따른다고 한다.
감마분포 포아송과정에서 (0,t] 사이의 사건수 T : 사건이 n번 일어날 때까지의 경과시간 (연습문제 #11*) 이때 T는 모수가 n과 인 얼랑분포(Erlang distribution)를 따른다고 한다. -67-

69 <예제 4.32> n이 정수가 아닐 수 있는 일반적인 경우: -68-

70 감마함수: 식(3.7a) 식(3.7b) 식(3.7c) 식(3.7d) 감마분포 pdf의 모양 -69-

71 f(x) x 그림 4.9 감마분포 -70-

72 (연습문제 #9) -71-

73 불완전 감마함수(incomplete gamma function) :
감마분포의 확률계산 불완전 감마함수(incomplete gamma function) : 확률계산 : * 감마분포의 유도과정 ∙ 포아송과정에서 (0,t] 사이의 사건수 ∙ 사건이 n번 일어날 때까지의 경과시간 -72-

74  포아송 분포표를 써서 감마분포의 확률을 구할 수 있다.
식 (4.61) 여기서 라 바꾸어 쓰면 (보충문제 #26*)  포아송 분포표를 써서 감마분포의 확률을 구할 수 있다. <예제 4.33> -73-

75 -74-

76 §4.9* 와이블분포와 대수정규분포 대표적인 예 : 와이블분포 대수정규분포 : 기계부품 또는 동식물의 수명분포모형 -75-

77 일 때, T는 모수가 인 와이블분포(Weibull distribution)을 따른다고 하고,
T 의 pdf는 고장률함수 -76-

78 와이블분포의 pdf 1 -77-

79 (연습문제 #10*) <예제 4.34> -78-

80 이때, T는 모수가 인 대수정규포(lognormal distribution)을 따른다고 하고,
대수정규분포 T 의 pdf 이때, T는 모수가 인 대수정규포(lognormal distribution)을 따른다고 하고, -79-

81 대수정규분포의 pdf 1.6 1.2 0.8 0.4 0.0 0.5 1.0 1.5 2.0 2.5 3.0 f(x) -80-

82 (연습문제 #11*) <예제 4.35> -81-


Download ppt "제 4 장 여러 가지 분포."

Similar presentations


Ads by Google