Probability and discrete probability distributions (확률과 이산확률분포)

Slides:



Advertisements
Similar presentations
Marketing Research 1  두 모집단 평균차이 검증 (t) : 두 개의 독립모집단 평균차이 검증에는 두 모집단이 정규분포를 이루며 분산이 같다는 가정 하에 (σ 1 2 =σ 2 2 ) t-test 를 사용하나 각각의 모 집단 크기가 크면 (n 1 ≥30,
Advertisements

제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
5.1 주관적 확률 컴퓨터 제조회사의 사장은 향후 5 년 동안 노트북 컴퓨터 수요 가 2 배 될 가능성을 70% 로 예측한다. 5.2 샘플공간은 2 개의 가능성을 가지고 있다. (1)A = Air France 는 아이오아주의 매일 포카텔로 로 운항하는 항공 편을 만들 예정이다.
P(B|A) P(A|B) 5.4 베이즈의 법칙(Bayes’ Law)…
재료수치해석 HW # 박재혁.
Eliminating noise and other sources of error
패턴인식 개론 Ch.4 기초 통계와 확률 이론 Translated from “CSCE 666 Pattern Analysis | Ricardo Gutierrez-Osuna | “
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
표본분포 Sampling Distribution
4.3.3 초기하분포 (Hypergeometric distribution)
고장률 failure rate 어떤 시점까지 동작하여 온 품목이 계속되는 단위기간내에 고장을 일으키는 비율(횟수). 고장률은 확률이 아니며 따라서 1 보다 커도 상관없다. 고장이 발생하기 쉬운 정도를 표시하는 척도. 일반으로 고장률은 순간고장률과 평균고장률을 사용하고 있지만.
1장 : 확률이론 확률통계론 TexPoint fonts used in EMF.
A SMALL TRUTH TO MAKE LIFE 100%
제12주 회귀분석 Regression Analysis
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
CHAPTER 21 UNIVARIATE STATISTICS
질의 사항 Yield Criteria (1) 소재가 평면응력상태에 놓였을 때(σ3=0), 최대전단응력조건과 전단변형에너지 조건은σ1 – σ2 평면에서 각각 어떤 식으로 표시되는가? (2) σ1 =σ2인 등이축인장에서 σ = Kεn로 주어지는 재료의 네킹시 변형율을 구하라.
Error Detection and Correction
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
A SMALL TRUTH TO MAKE LIFE 100%
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
일차방정식의 풀이 일차방정식의 풀이 순서 ① 괄호가 있으면 괄호를 먼저 푼다.
4-1 Gaussian Distribution
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
1.4 중첩된 한정기호 (Nested Quantifiers) 이산수학 (Discrete Mathematics)
문제 2명의 사형수가 있다. 둘에게는 검정색 모자와 흰색 모자를 임의로 씌우는데, 자기가 쓴 모자의 색은 절대로 알 수가 없다. 서로 상대의 모자색만을 볼 수 있고, 이들이 살기 위해선 자신의 쓴 색의 모자를 맞춰야 한다. 단, 둘 중 한명만이라도 자신이 쓴 모자의 색을.
Keller: Stats for Mgmt & Econ, 7th Ed 확률의 이해 Probability
Week 10:확률변수(Random Variable)
Week 6:확률(Probability)
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
이번 학기 공부할 내용 확률 확률변수 결합확률분포 이산확률분포 연속확률분포 기술통계학 표본분포 추정 가설검정 이재원
쉽게 배우는 알고리즘 7장. 상호 배타적 집합의 처리.
8장. 상호 배타적 집합의 처리.
경제통계학 개요 사공 용 서강대학교 경제학과.
Association between two measurement variables Correlation
Inferences concerning two populations and paired comparisons
Week 5:확률(Probability)
Analysis of frequencies
Probability.
먹이종류에 다른 구피의 성장변화.
고체역학 2 - 기말고사 1. 단면이 정사각형이고 한번의 길이가 a 일 때, 최대굽힘응력과 최대전단응력의 비를 구하라(10).
Statistical inference I (통계적 추론)
Frequency distributions and Graphic presentation of data
The normal distribution (정규분포)
3강. 컴퓨터와의 기본적인 소통수단 - I 연산자란? 컴퓨터와 소통하기 위한 다양한 방법들
Thevenin & Norton 등가회로 1등 : 임승훈 - Report 05 - 완소 3조 2등 : 박서연
Distribution(모의 실험에 자주 쓰이는 분포들)
감마분포 gamma distribution
Sampling Distributions
제2장 통계학의 기초 1절 확률 기본정의 확률의 기본 공리와 법칙 2절 확률변수와 확률분포 3절 정규분포와 관련 분포 정규분포
표지  수학 8-나  2학년 2학기 Ⅰ.확률 (1)경우의 수(2~5/15) 경우의 수.
Chapter 3: 확률변수와 분포함수 Pilsung Kang
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
Week 6:순열(Permutation)과 조합(Combination)
광합성에 영향을 미치는 환경 요인 - 생각열기 – 지구 온난화 해결의 열쇠가 식물에 있다고 하는 이유는 무엇인가?
Definitions (정의) Statistics란?
Ⅵ. 확 률 1. 확 률 2. 확률의 계산.
확률 Probability 3 Probability.
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
의미론적 관점 * TV에서 ‘푸른 빛이 아닌 청자빛’이란 표현을 들었을 경우
의학자료분석론 교재: 강의록 Rosner B, Fundamentals of Biostatistics, 7th ed. Brooks/Cole Cengage Learning, Canada, 강의 평가: 출석 20% 숙제 30% 기말고사 50%
상관계수.
제5장 태내발달과 태내환경 생명의 시작 1) 수정 2) 성의 결정.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
Where the Crossovers are: Recombination distributions in mammals
6. 확 률.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
CHAPTER 1 미생물과 미생물학.
(Permutations and Combinations)
문제의 답안 잘 생각해 보시기 바랍니다..
Presentation transcript:

Probability and discrete probability distributions (확률과 이산확률분포)

Probability 생활에서 일어나는 대부분의 사건은 불확실함 Probability rule은 사업, 경기, 도박을 예측하는데 도움을 줌 실제로 probability rule (확률의 법칙)들은 도박사들에 고용된 수학자들에 의해 발달 생물학에서는 특정 질병의 감염위험성 등을 확률의 법칙을 이용하여 예측할 수 있다 In this chapter, 기본적인 probability rule을 다룸

Probability and probability distributions 또는 0% - 100%로 표시 Probability near 1: the event is very likely Probability near 0: the event is very unlikely 확률이 결정되는 2가지 방법 1. Based on a theoretical consideration (이론적 근거) Classical probability or mathematical probability (수학적 확률)라 불림 Ex. 주사위의 숫자가 나올 확률: 1/6 or 0.1667 Mendel의 유전법칙 확률을 계산을 통하여 예측할 수 있다 확률을 얻기 위해 시도해 볼 필요가 없다

Probability and probability distributions 확률이 결정되는 2가지 방법 2. 그 사건이 일어날 빈도에 대한 이전 지식을 근거로 (Based on some prior knowledge of the relative frequency of the event;지식적 근거) Empirical probability (경험적 확률)라 불림 Ex.1. 산모의 나이에 따른 Down’s syndrome을 가진 신생아가 태어날 확률: Birth records로부터 알 수 있다 Ex.2. 흡연 정도에 따른 폐암발생률 Both classical and empirical probability는 비 (ratio)로부터 계산된다 Division rule: 어떤 사건이 일어날 확률은: (그 사건이 일어난 수) / (총사건의 수) 이다

Probability distributions 각 사건들이 일어날 확률의 listing Table이나 graph로 나타낸다 Ex. 동전의 앞, 뒷면이 나올 확률 Outcome Probability Head 0.5 Tail

Probability distributions Ex. 주사위의 숫자가 나올 확률 Outcome 1 2 3 4 5 6 Probability 1/6

Discrete probability distribution (이산확률분포) 생물학에서 주로 사용되는 2가지 이산확률분포 Binominal distribution (이항분포) Poisson distribution (포아슨분포)

Binominal distribution (이항분포) 사물이나 사건은 2 mutually exclusive categories (상호배타적 범주)중 하나에 속한다 Ex. 동전의 head and tail, asleep and awake, male and female, present and absent 2개 이상의 범주를 가지더라도 2개의 범주로 묶을 수 있다 One category and everything else as the other category Ex. Color: red and not red

Binominal probability distribution의 특성 1. event 나 trial 의 총 수: k로 표시 2. 사건이 일어날 때마다 2 mutually exclusive outcomes (상호배타적 결과) 중 하나가 나옴 하나의 outcome이 나올 확률: p로 표시 The other outcome이 나올 확률: q로 표시 p + q = 1 and q = 1 – p 3. 사건들은 독립적이다 한 사건의 일어나는 것이 다른 사건이 일어나는데 영향을 미치지 않는다 4. 총 사건 수 k 중 관심을 가지는 사건의 수: x로 표시 x가 일어날 확률: p(x)로 표시

Binominal probability distribution Ex. 두 개의 동전을 동시 던질 때 나올 수 있는 결과 2 heads, 1 head and 1 tail, or 2 tails 위의 3 결과가 나올 확률은? Head 가 나올 확률 = ½, tail이 나올 확률 = ½ 둘 다 head 일 확률 = ½ × ½ = 0.25 둘 다 tail 일 확률 = ½ × ½ = 0.25 1 head and 1 tail이 나올 경우 2가지, 따라서 확률은: 0.25 + 0.25 = 0.5 Multiplication and addition rules (곱의 법칙, 합의 법칙)

Binominal probability distribution 1. The multiplication rule (the ‘and’ rule) 확률의 곱셈법칙 독립적인 사건이 동시에 일어날 확률은 각 사건이 일어날 확률의 곱이다 Ex. a가 일어날 확률: p(a), b가 일어날 확률: p(b)라면 a와 b가 동시에 일어날 확률 p(a) × p(b) 2. The addition rule (the ‘or’ rule) 여러 개의 사건 중 적어도 하나의 사건이 일어날 확률은 각 사건이 일어날 확률의 합이다 Ex. A와 B는 mutually exclusive events A나 B가 일어날 확률: p(A or B) = p(A) + p(B)

Binominal probability distribution Binominal distribution의 probability를 다음 식으로 일반화할 수 있다. (p + q)k = 1 한 결과가 나올 확률: p The other outcome이 나올 확률: q k: the number of events Ex. 3개의 동전을 던질 경우 Head가 나올 확률: p = 0.5, tail이 나올 확률: q = 0.5 (p + q)3 = 1 (k = 3) p3 + 3p2q + 3pq2 + q3 = 1 0.125 + 0.375 + 0.375 + 0.125 = 1 모두 head가 나올 확률: 0.125, 2head and 1 tail: 0.375…. k값이 클 경우 (계수)계산이 복잡하다

Binominal probability distribution k가 클 경우 (> 30) binominal formula (이항식)을 사용하면 편리함 kCx: k개에서 x개를 추출하는 경우의 수 Ex. 1. 동전을 3번 던져 head 가 1번 나올 확률 x = 1, k = 3, p = 0.5, q = 0.5 p(x) = 3! / 1! (3-1)! *(0.51)(0.52) = 0.375 Ex. 2. 2개의 주사위를 던져 1이 하나 나올 확률? x = 1, k = 2, p = 1/6 = 0.1667, q = 5/6 = 0.8333 p(x) = 2! / 1! (2-1)! *(0.16671)(0.83331) = 0.2778

Binominal probability distribution Example 5.2 Bush hogs (야생돼지) 는 항상 한배 (litters)에 6마리의 새끼를 낳는다 100 litters 중 수컷 새끼의 수가 5마리 이상인 경우는 몇 litters일까? 새끼가 수컷일 확률: 0.5, 암컷일 확률: 0.5 5마리가 수컷일 확률 (k = 6, x = 5, p = 0.5, q = 0.5) p(5) = 6! / 5! (6-5)! *(0.55)(0.51) = 0.0937 6마리 다 수컷일 확률 (k = 6, x = 6, p = 0.5, q = 0.5) p(6) = 6! / 6! (6-6)! *(0.56)(0.50) = 0.0156 p(5) + p(6) = 0.0937 + 0.0156 = 0.1093 수컷이 5마리 이상인 litters의 수: 0.1093 × 100 = 10.93 약 11 litters

Binominal probability distribution Example 5.3 실제로 조사했을 때 만약에 수컷이 5마리 이상인 경우가 20 litters 이고, 암컷이 5마리 이상인 경우가 20 litters였다면 추정해 볼 수 있는 현상은? 암수가 X, Y chromosome의 random combination에 의해 결정되지 않을 것이다 다른 factor가 성의 결정에 영향을 미칠 것이다

Exercises Heterozygous sickle-cell gene을 가진 부부가 질병을 가진 아이를 낳을 확률이 0.25이다. 이들 부부가 6명의 아이를 낳았을 때 모두 정상일 확률은?

Exercises 새로 개발된 약이 병을 고칠 확률이 50%. 5명의 환자에게 이 약을 투여했을 경우 4명 이상이 치료될 확률은?

The Poisson distribution Rare events 가 발생하는 확률을 예측하는데 주로 사용된다 Events의 발생이 서로 독립적인가를 결정할 때 사용됨 사건이 단순히 chance (우연)에 의해 발생하는가? 실제 측정된 frequency distribution을 Poisson distribution으로 예측된 frequencies와 비교하여 측정된 사건의 발생이 독립적인지 아닌지를 판단할 수 있다

The Poisson distribution Example 5.4 Maple seedling sample in Chapter 3 (Table 5.2) Maple seedling의 분포가 독립적인가? 만약 그렇다면 frequency distribution은 Poisson distribution을 따른다 아니라면 1. 하나의 maple seedling의 occurrence는 다른 maple seedling occurrence에 영향을 받는다는 의미 2. maple seedling의 분포가 random distribution이 아님. Chance가 아닌 다른 환경요인에 의해 seedling의 분포가 영향을 받음

The Poisson distribution p(x): x events의 확률 e: 자연로그상수 (2.7183) μ: population mean, 일반적으로 population mean을 알 수 없으므로 sample mean을 사용한다

The Poisson distribution Example 5.4 Maple seedling sample in Chapter 3 (Table 5.2) 100 quadrats, 141 seedlings in 100 quadrats = 141/100 = 1.41 Ex. One seedling per quadrat p(x = 1) = (1.411)(e-1.41)/ 1! = 1.41 * 0.244 143 = 0.344

The Poisson distribution = 141/100 = 1.41 1) 0 seedling per quadrat p(x = 0) = (1.4100)(e-1.41)/ 0! = 0.244143 2) 1 seedling per quadrat p(x = 1) = (1.411)(e-1.41)/ 1! = 1.41 * 0.244143 = 0.344 3) 2 seedling per quadrat p(x = 2) = (1.412)(e-1.41)/ 2! = 1.412 * 0.244143 /2= 0.243 4) 3 seedling per quadrat p(x = 3) = (1.413)(e-1.41)/ 3! = 1.413 * 0.244143/6 = 0.114 5) 4 seedling per quadrat p(x = 4) = (1.414)(e-1.41)/ 4! = 1.414 * 0.244143/24 = 0.0402 6) 5 seedling per quadrat p(x = 5) = (1.415)(e-1.41)/ 5! = 1.415 * 0.244143/120 = 0.01134 7) 6 seedling per quadrat p(x = 6) = (1.416)(e-1.41)/ 6! = 1.416 * 0.244143/720 = 0.00266

The Poisson distribution Expected (using the Poisson distribution) and observed frequencies of maple seedling

The Poisson distribution Expected (using the Poisson distribution) and observed frequencies of maple seedling A goodness-of-fit test can be applied to determine the difference is likely real or not (in Chapter 14)

The Poisson distribution Example 5.5 Bacterial viruses의 bacteria cell 내로의 infection Bacteria cell 내로 들어가는 phage particles의 수는Poisson distribution을 따른다 2.5 × 106 phage particles were mixed with 106 bacteria cells 몇 개의 bacteria cells 들이 phage particles에 infection 되지 않았을까? Mean number of phage particles per bacterial cell: 2.5 p(0) = (2.50 × e-2.5) / 0! = 0.0821 0.0821 × 106 = 8.21 × 104 cells

Exercises Bacterial viruses 의 bacteria cell 내로의 infection Bacteria cell 내로 들어가는 phage particles의 수는Poisson distribution을 따른다 x phage particles were mixed with 106 bacteria cells Infection 되지 않은 bacteria cells 이 1% 이하가 되기 위해서는 얼마만큼의 phage particles을 넣어주어야 할까? (99% 이상의 bacteria cells이 virus에 의해 감염되기를 원함)

Exercises 어떤 혈청을 주사했을 경우 부작용이 나타날 확률이 0.001이다. 1000명의 환자에게 혈청을 주사했을 때 2명에게서 부작용이 나타날 확률은?

Exercises 어떤 혈청을 주사했을 경우 부작용이 나타날 확률이 0.001이다. 1000명의 환자에게 혈청을 주사했을 때 2명에게서 부작용이 나타날 확률은? k = 1000 x = 2, p = 0.001, q = 0.999 p(2) = 1000! / 2! (1000 - 2)! * 0.0012 * 0.999(1000-2) = 499500 * 0.000001 * 0.368431921 = 0.1840

Homework 1 다음 자료를 이용하여 x = 0 to 8까지의 Poisson probabilities를 구하라. Population mean 이 sample mean과 같다고 가정함 Expected probabilities를 observed probabilities와 비교하라

Homework 2 5 × 108 bacterial cells과 3 × 108 bacteriophages를 섞어주었을 때 phage particle이 3개 이상 흡수된 bacterial cells의 수는?