제 4 장 여러 가지 분포.

Slides:



Advertisements
Similar presentations
10-7 부동소수점 (Floating-Point) 계산  컴퓨터에서 숫자를 표기하는 방법  가수 (Fraction) : 부호화된 고정소수점 숫자 지수 (Exponent) : 소수점의 위치를 표시 ( 예 )10 진수 를 표기하면 Fraction Exponent.
Advertisements

제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
Ⅱ 세포의 주기와 생명의 연속성 Ⅱ 세포의 주기와 생명의 연속성 - 1. 세포주기와 세포분열.
제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
이항분포와 정규분포 이항분포 정규분포.
제 4 장 정규분포로의 근사 단위변환 정규분포곡선 표준정규분포곡선 아래의 영역 찾기 자료에 대한 정규 근사 백분위수
패턴인식 개론 Ch.4 기초 통계와 확률 이론 Translated from “CSCE 666 Pattern Analysis | Ricardo Gutierrez-Osuna | “
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
제 2 장 확 률.
B4-1.
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
표본분포 Sampling Distribution
4.3.3 초기하분포 (Hypergeometric distribution)
고장률 failure rate 어떤 시점까지 동작하여 온 품목이 계속되는 단위기간내에 고장을 일으키는 비율(횟수). 고장률은 확률이 아니며 따라서 1 보다 커도 상관없다. 고장이 발생하기 쉬운 정도를 표시하는 척도. 일반으로 고장률은 순간고장률과 평균고장률을 사용하고 있지만.
베이즈 정리(Bayesian Theory)
수치해석 6장 예제문제 환경공학과 천대길.
Report #2 - Solution 문제 #1: 다음과 같이 프로그램을 작성하라.
제9장 샘플링과 오차 표본: 시료, Sample 모집단 : 공정, Lot Sampling
- 1변수 방정식의 solution 프로그램 (Bisection method, Newton-Raphson method)
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
제 3장. 수치를 통한 연속형 자료의 요약.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
연 속 확 률 분 포 5 균등분포 지수분포 감마분포 웨이블분포 베타분포 정규분포 정규분포에 관련된 연속분포들
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
확률통계론 2장 : 확률변수.
예: Spherical pendulum 일반화 좌표 : θ , Ф : xy 평면으로부터 높이 일정한 량 S 를 정의하면
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
제 4장 시스템 신뢰도와 중복설계.
일차방정식의 풀이 일차방정식의 풀이 순서 ① 괄호가 있으면 괄호를 먼저 푼다.
제4장 제어 시스템의 성능.
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
Keller: Stats for Mgmt & Econ, 7th Ed
학습 주제 p 역학적 에너지는 보존될까?(1).
군집 분석.
(independent variable)
이번 학기 공부할 내용 확률 확률변수 결합확률분포 이산확률분포 연속확률분포 기술통계학 표본분포 추정 가설검정 이재원
연 속 확 률 분 포 5 1 균등분포 2 지수분포 3 감마분포 4 정규분포.
Probability.
고체역학 2 - 기말고사 1. 단면이 정사각형이고 한번의 길이가 a 일 때, 최대굽힘응력과 최대전단응력의 비를 구하라(10).
두 모집단에 대한 검정.
Frequency distributions and Graphic presentation of data
Choi Seong Yun 컴퓨터 프로그래밍 기초 #06 : 반복문 Choi Seong Yun
6.4 삼원배치 (혼합모형, no replication)
Distribution(모의 실험에 자주 쓰이는 분포들)
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
제3장 함수와 배열수식 전진환
감마분포 gamma distribution
Sampling Distributions
2장 변형률 변형률: 물체의 변형을 설명하고 나타내는 물리량 응력: 물체내의 내력을 설명하고 나타냄
제 3장 신뢰성 척도 3.1 개요 3.2 신뢰성의 척도 3.3 수명분포별 신뢰성 척도.
Chapter 3: 확률변수와 분포함수 Pilsung Kang
DA :: 퀵 정렬 Quick Sort 퀵 정렬은 비교방식의 정렬 중 가장 빠른 정렬방법이다.
1. MTBF의 정의 평균고장간격시간 (Mean Time Between Failures)의 의미로 신뢰성을 나타내는 지표이다.
원의 방정식 원의 방정식 x축, y축에 접하는 원의 방정식 두 원의 위치 관계 공통접선 원과 직선의 위치 관계
SPL3D Printer If 조건문.
Ⅵ. 확 률 1. 확 률 2. 확률의 계산.
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
이산수학(Discrete Mathematics)  술어와 한정기호 (Predicates and Quantifiers)
제 16장 비율의 정확성 머리말 신뢰구간 신뢰구간의 해석.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
6. 확 률.
수치해석 ch3 환경공학과 김지숙.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
어서와 C언어는 처음이지 제21장.
문제의 답안 잘 생각해 보시기 바랍니다..
Presentation transcript:

제 4 장 여러 가지 분포

§ 4.1 이산형 균일분포 • 이고 이면 X는 이산형 균일분포(discrete uniform distribution)를 따른다고 한다. • 특히 , 즉 X가 정수값을 가지면  -1-

<예제 4.1> X : 주사위 한번 던져 나오는 눈 <예제 4.2> 동전 1개와 주사위 1개 표본공간 동전 앞면  눈의 수만큼 돈을 받음 뒷면  눈의 수만큼 돈을 줌 • -2-

X=받게 될 돈의 액수 <연습문제 #6> 주사위 3번 던질 때 최대값 M (a) 한번 던질 때 눈이 k 이하일 확률 (b) M이 홀수일 확률 -3-

(주) 균등표본공간 상에 정의된 확률변수라 하여 반드시 이산형 균일분포를 따르는 것은 아니다. (주) 균등표본공간 상에 정의된 확률변수라 하여 반드시 이산형 균일분포를 따르는 것은 아니다. <예> 동전 2번 던지기 는 균등표본공간 X를 H의 수라 정의하면 가 된다고 하여 가 되는 것은 아니다 x 1 2 -4-

§ 4.2 베르누이 시행과 이항분포 1. 베르누이 실험(Bernoulli experiment): 나올 수 있는 결과가 2개 뿐인 실험 동전 던지기  앞면과 뒷면 각종 시험  합격과 불합격 결과가 여럿이라도 이들을 두 부류로 분류 <예> • •  성공(s) 과 실패(f) • 예: 주사위 던지기  짝수와 홀수  표본공간 라 정의하자 -5-

일 때, 확률변수 X는 모수가 p인 베르누이 분포 (Bernoulli distribution)를 따른다고 한다 확률함수가 일 때, 확률변수 X는 모수가 p인 베르누이 분포 (Bernoulli distribution)를 따른다고 한다 • 베르누이 분포는 매우 단순해서 그 자체로서 보다는 베르누이 실험을 반복해서 얻어지는 분포들을 유도하는 바탕으로서의 의미를 갖는다. -6-

2. 베르누이 시행(Bernoulli trials) : 동일한 베르누이 실험을 반복하는 것 <예> 베르누이 시행을 독립적으로 10번 반복할 때 성공이 4번 실패가 6번 나올 확률 표본점의 수 개 성공이 4번인 경우: 가지 각 경우의 확률  성공이 4번 나올 확률 -7-

일반적으로 n번 시행해서 s가 x 번 f 가 번 나올 확률: • 특정순서 • 경우의 수  성공횟수 X 의 확률함수 이때 X 는 모수가 n 과 p 인 이항분포(binomial distribution)을 따른다 하고 로 표기 • 이항정리 (식 3.2a)에 의해  는 의 이항전개에서 나오는 항들  이항분포, 이항확률 등의 용어 -8-

-9-

<예제 4.4> 4지선다형 10문항, 문항당 10점, 40점 미만 낙제 과목지식이 없는 학생이 낙제를 면할 확률은?  • <예제 4.4> 4지선다형 10문항, 문항당 10점, 40점 미만 낙제 과목지식이 없는 학생이 낙제를 면할 확률은? (a) 감점이 없는 경우 맞은 문항의 수 점수 -10-

(c) 점수의 기대값이 0 이 되도록 하는 채점규칙 (b) (c) 점수의 기대값이 0 이 되도록 하는 채점규칙  틀린 문항 10/3 점 감점 (d) -11-

이항분포표 (부록 표 B.1) : i) <예> <예제 4.4> ii) -12-

<예제 4.6> 불량률이 5%라 알려진 공정에서 제품 10개 검사 <예제 4.5> <예제 4.6> 불량률이 5%라 알려진 공정에서 제품 10개 검사 불량률이 실제로 5%라면 이 일어날 확률 약 1%  실제로 10개중 불량품이 3개 나왔다면 불량률이 커졌다고 판단 -13-

<연습문제 #7> 전자파와 태아의 성별이 무관하다면 <연습문제 #7> 전자파와 태아의 성별이 무관하다면  전자파와 태아의 성별이 무관하다고 판단. n=10, p=0.5 일 때 n=10, p=0.1 n=10, p=0.9 <이항분포> -14-

§4.3 초기하분포 <예제 4.7> 검은돌(B) 7개와 흰돌(W) 3개 무작위로 2개를 꺼낼때 흰돌의 수 X 복원추출 : 베르누이 시행 비복원 추출 :  베르누이 시행이 아니다 N 개의 개체 중 속성 A 를 가진 것 M개 N 개 중 n 개를 비복원으로 뽑을 때 X = n 개중 속성 A 를 가진 것의 수 개의 서로 다른 조합 각 조합이 뽑힐 확률 -15-

n 개 중 속성 A를 가진 것이 x 개 포함될 경우의 수 이때 X는 모수가 N, M, n 인 초기하분포(hypergeometric distribution)를 따른다고 하고 X ~ HG(N, M, n) 으로 표기 <예제 3.14> (b) 에 의해 일 때 -16-

 x 의 범위 따질 필요없이 x=0,1,…,n 이라 할 수 있다. -17-

X의 평균 * 식 (3.3)에서 로 대체하면 -18-

은 유한수정계수 (finite population correction: fpc) X의 분산 비슷한 방법으로 (연습문제 #11*)  binomial 경우와 비교 여기서 은 유한수정계수 (finite population correction: fpc) -19-

 N이 크면 초기하분포의 확률 ≈ 이항분포의 확률 (연습문제 #12*)  N이 크면 초기하분포의 확률 ≈ 이항분포의 확률 <예제 4.8> 이면 이항분포확률로 근사해도 별 차이가 없다. -20-

§4.4 포아송분포 <예> 어느 교차로에서 1주일 동안 일어나는 교통사고의 수 <예> 어느 교차로에서 1주일 동안 일어나는 교통사고의 수 1주일을 n개의 구간으로 나누되 한 구간에서는 사고가 2번 이상 안 일어나도록 즉 P(사고 2번 이상)≈0 이 되도록 n을 충분히 크게 사고발생여부의 관찰은 베르누이 시행을 독립적으로 반복하는 것  일주일 동안의 사고 건수  구간을 짧게 (n을 크게) 나누면 p 는 작아진다.  로 고정시키고 n을 크게하면 X의 p(x)는 어떻게 될까? -21-

여기서 -22-

일 때, X 는 모수가 인 포아송분포(Poisson distribution)를 따른다고 하고 (4.18) 일 때, X 는 모수가 인 포아송분포(Poisson distribution)를 따른다고 하고 포아송분포는 rare events를 모형화 하는데 주로 쓰인다. <예> 일정지역에서 일정기간에 일어나는 교통사고건수/자살건수 일정기간에 교환대에 걸려오는 전화횟수 교과서 페이지당 오타수  n은 크고 p 는 작다 -23-

n 이 크고 p 가 작되 np<5 이면 이항분포확률의 포아송근사화가 좋다. <예제 4.10> n 이 크고 p 가 작되 np<5 이면 이항분포확률의 포아송근사화가 좋다. -24-

* 확률함수 식 (4.18)로부터 직접구하면 (연습문제 #10) 포아송분포표 (부록의 표 B.2) -25-

(a) <예제 4.12> x x -26- p(x) p(x) (b) [그림 4.2] 포아송분포 0 1 2 3 4 5 6 7 p(x) x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 p(x) x (a) (b) [그림 4.2] 포아송분포 -26-

§4.5 기하분포와 음이항분포 기하분포 첫번째 성공( s )이 나올 때 까지 베르누이 시행 반복 X = 첫번째 성공 ( s )이 나올 때까지의 실패( f ) 회수 이때 X 는 모수가 p 인 기하분포(geometric distribution)를 따른다고 하고, X ~ Geo(p) 로 표기 -27-

<예제 4.13> 윷놀이에서 9구간이상 말을 옮길 확률 (식 (3.5) a) <예제 4.13> 윷놀이에서 9구간이상 말을 옮길 확률 윷 또는 모가 나올 확률 윷이나 모가 연속 x 번 나올 확률 윷놀이에서 말을 9구간 이상 옮김 -28-

기하분포의 무기억성 (memoryless property)  <예제 4.14> 합격할 때까지 떨어지는 횟수 -29-

* 식(3.5c)에서 k=1, k=2로 놓아 얻은 식을 이용하여 직접구하면 (연습문제 #9) -30-

<예> password (key) k 개중 하나만 맞는 것 맞는 것을 찾을 때까지 하나씩 맞추어본다. (식 3.10) (식 3.11) (N의 분포를 기하분포라 부르기도 한다.) <예> password (key) k 개중 하나만 맞는 것 맞는 것을 찾을 때까지 하나씩 맞추어본다. 비복원: -31-

복원: -32-

이때 X 는 모수가 r 과 p 인 음이항분포(negative binomial distribution)를 독립 이때 X 는 모수가 r 과 p 인 음이항분포(negative binomial distribution)를 따른다고 하고, X~NB(r, p)로 표기 -33-

-34-

한 게임에서 A가 이길 활률을 p, B가 이길 확률 q (N의 분포를 음이항분포라 부르기도 한다) <연습문제 #6> 한국시리즈 A, B 두팀 한 게임에서 A가 이길 활률을 p, B가 이길 확률 q -35-

n 4 5 6 7 p(n) 2/16 4/16 5/16 5/16 -36-

3번의 성공(충격)이 일어날 때까지의 실패횟수 <예제 4.16> 충격이 3번 이상이면 고장 나는 기계 3번의 성공(충격)이 일어날 때까지의 실패횟수 이고, 기계를 7년 이상 고장 없이 쓸 수 있을 확률은? -37-

§4.6 연속형 균일분포와 베타분포 연속형 균일분포 연속형 확률변수 X에 관한 확률 가 구간 (a, b)의 위치에 무관하고 구간의 폭 (b-a)에 비례한다면 f(x)의 높이가 같을 수 밖에 없다. -38-

-39-

균일분포는 다른 연속형 확률변수의 모의(simulation) 관측값들을 생성하는데 쓰인다. <예제 4.17> 균일분포는 다른 연속형 확률변수의 모의(simulation) 관측값들을 생성하는데 쓰인다. <정리 4.1> -40-

* 정리 4.1, 4.2 에서 F가 비감소함수일 경우도 성립 (보충문제 #23*) <정리 4.2> * 정리 4.1, 4.2 에서 F가 비감소함수일 경우도 성립 (보충문제 #23*) <예제 4.18> -41-

화학약품의 불순률, 기계의 가동률, 공정의 불량률 등 베타분포 베르누이 시행에서 성공비율 화학약품의 불순률, 기계의 가동률, 공정의 불량률 등  일정하게 고정되어있지 않고 (0,1) 사이에서 변하는 확률변수로서의 속성을 가질 경우의 분포모형 필요 -42-

<예> -43-

[그림 4.4] 베타분포 -44-

-45-

베타분포의 확률계산 <예제 4.20> -46-

확률계산 : ① ② (4.42) <예제 4.21> <예제 4.20>에서 식 (4.12)를 이용하면 -47-

§4.7 정규분포 자연현상에 대한 관측자료 자연과학, 의학, 공학적 실험자료 사회, 경제 현상에 대한 조사자료 히스토그램(histogram) (§11.3.1)을 그려보면 좌우대칭이고 bell-shaped 인 경우가 많다. 히스토그램이 한쪽으로 치우친(skewed) 경우라도 자료가 많으면 산술평균의 히스토그램은 좌우대칭이고 bell-shaped (§ 7.4)   -48-

식 (3.7d)를 이용하면 -49-

(연습문제 #9) -50-

-51-

그림 4.5 정규분포 -52-

표준정규분포 (부록의 표 B.3)  <예제 4.23> -53-

N(0,1)의 분포가 0을 중심으로 대칭이므로 ① ② ③ 이항분포의 근사화 <예제 4.25> (a) 이항분포표 : (b) 정규분포표 : -54-

<예제 4.26> (a) 포아송분포표: (b) 정규분포표 : -55-

이를 연속성보정(continuity correction)이라 한다. a b 그림 4.6 정규근사화 X: 원래의 이산형 확률변수 Y: X에 대응되는 정규확률변수 이를 연속성보정(continuity correction)이라 한다. -56-

<예제 4.27> 연속성 보정을 한 경우 <예제 4.25> <예제 4.26>  (연습문제 #11) -57-

그림 4.7 정규분포의 상위 100p 백분위수 자연계열 성적분포 <예제 4.28> 인문계열 “ 인문계열 “ <예제 4.28> 자연계열 330점의 표준화 인문계열 330점의 표준화 -58-

<정리 3.5> -59-

<예제 4.29> -60-

§4.8 지수분포와 감마분포 지수분포 § 4.4 : 단위시간(1주일)동안 일어나는 교통사고 횟수 : 몇가지 기본 조건하에 포아송분포 단위시간 대신 t 시간이라면? 기본조건 i) (0,t]를 n개의 구간으로 나눌 수 있고, 서로 중첩되지 않는 구간에서는 사건들이 독립적으로 발생 ii) 충분히 짧은 구간에서 사건이 2 번이상 일어날 확률은 0 iii) 한 구간에서 사건이 일어날 확률은 구간의 길이에 비례  이러한 조건을 만족하는 현상 : 포아송 과정 (Poisson process) -61-

(0,t]를 n개의 짧은 구간으로 나누면 한 구간에서 기본조건 iii) 기본조건 ii) (0,t]동안 사건 발생횟수 기본조건 i) 첫 사건이 일어날 때까지 경과시간 T: -62-

이때 T는 모수가 인 지수분포(exponential distribution)를 따른다고 하고, 로 표기 하고, 로 표기 <예제 3.34>로부터 -63-

전자부품이나 시스템의 고장현상 : 포아송과정을 형성하는 경우 많다.  고장날 때까지의 경과시간 : 지수분포 모형이 잘 맞는다. 2.0 1.0 1.5 0.5 그림 4.8 지수분포 -64-

5년 이내에 고장이 나서 못쓰게 될 확률 = P(T<5) <예제 4.30> 어느 전자제품의 수명(단위:년) 5년 이내에 고장이 나서 못쓰게 될 확률 = P(T<5)  약 63%가 평균수명 내에 고장나서 못쓰게 된다. -65-

 무기억성 (memoryless property) 이산형 분포 중에 기하분포 연속형 분포 중에 지수분포 유일하게 무기억성을 갖는다. <예제 4.31> <예제 4.30>에서 10년 된 것이 앞으로 5년 내에 고장날 확률  10년 쓴 제품과 새 제품의 수명이 같다? 지수분포의 고장률이 로서 일정하다는 가정에 따른 것  지수분포 : 마모나 노후화 고장은 거의 없고 우발적 고장이 대부분인 경우 수명분포의 모형 -66-

이때 T는 모수가 n과 인 얼랑분포(Erlang distribution)를 따른다고 한다. 감마분포 포아송과정에서 (0,t] 사이의 사건수 T : 사건이 n번 일어날 때까지의 경과시간 (연습문제 #11*) 이때 T는 모수가 n과 인 얼랑분포(Erlang distribution)를 따른다고 한다. -67-

<예제 4.32>  n이 정수가 아닐 수 있는 일반적인 경우: -68-

감마함수: 식(3.7a) 식(3.7b) 식(3.7c) 식(3.7d) 감마분포 pdf의 모양 -69-

f(x) x 그림 4.9 감마분포 -70-

(연습문제 #9) -71-

불완전 감마함수(incomplete gamma function) : 감마분포의 확률계산 불완전 감마함수(incomplete gamma function) : 확률계산 : ① ② ③ * 감마분포의 유도과정 ∙ 포아송과정에서 (0,t] 사이의 사건수 ∙ 사건이 n번 일어날 때까지의 경과시간 -72-

 포아송 분포표를 써서 감마분포의 확률을 구할 수 있다. 식 (4.61) 여기서 라 바꾸어 쓰면 (보충문제 #26*)  포아송 분포표를 써서 감마분포의 확률을 구할 수 있다. <예제 4.33> -73-

① ② ③ -74-

§4.9* 와이블분포와 대수정규분포 대표적인 예 : 와이블분포 대수정규분포 : 기계부품 또는 동식물의 수명분포모형 -75-

일 때, T는 모수가 인 와이블분포(Weibull distribution)을 따른다고 하고, T 의 pdf는 고장률함수 -76-

와이블분포의 pdf 1 -77-

(연습문제 #10*) <예제 4.34> -78-

이때, T는 모수가 인 대수정규포(lognormal distribution)을 따른다고 하고, 대수정규분포 T 의 pdf 이때, T는 모수가 인 대수정규포(lognormal distribution)을 따른다고 하고, -79-

대수정규분포의 pdf 1.6 1.2 0.8 0.4 0.0 0.5 1.0 1.5 2.0 2.5 3.0 f(x) -80-

(연습문제 #11*) <예제 4.35> -81-