Probability and discrete probability distributions (확률과 이산확률분포)
Probability 생활에서 일어나는 대부분의 사건은 불확실함 Probability rule은 사업, 경기, 도박을 예측하는데 도움을 줌 실제로 probability rule (확률의 법칙)들은 도박사들에 고용된 수학자들에 의해 발달 생물학에서는 특정 질병의 감염위험성 등을 확률의 법칙을 이용하여 예측할 수 있다 In this chapter, 기본적인 probability rule을 다룸
Probability and probability distributions 또는 0% - 100%로 표시 Probability near 1: the event is very likely Probability near 0: the event is very unlikely 확률이 결정되는 2가지 방법 1. Based on a theoretical consideration (이론적 근거) Classical probability or mathematical probability (수학적 확률)라 불림 Ex. 주사위의 숫자가 나올 확률: 1/6 or 0.1667 Mendel의 유전법칙 확률을 계산을 통하여 예측할 수 있다 확률을 얻기 위해 시도해 볼 필요가 없다
Probability and probability distributions 확률이 결정되는 2가지 방법 2. 그 사건이 일어날 빈도에 대한 이전 지식을 근거로 (Based on some prior knowledge of the relative frequency of the event;지식적 근거) Empirical probability (경험적 확률)라 불림 Ex.1. 산모의 나이에 따른 Down’s syndrome을 가진 신생아가 태어날 확률: Birth records로부터 알 수 있다 Ex.2. 흡연 정도에 따른 폐암발생률 Both classical and empirical probability는 비 (ratio)로부터 계산된다 Division rule: 어떤 사건이 일어날 확률은: (그 사건이 일어난 수) / (총사건의 수) 이다
Probability distributions 각 사건들이 일어날 확률의 listing Table이나 graph로 나타낸다 Ex. 동전의 앞, 뒷면이 나올 확률 Outcome Probability Head 0.5 Tail
Probability distributions Ex. 주사위의 숫자가 나올 확률 Outcome 1 2 3 4 5 6 Probability 1/6
Discrete probability distribution (이산확률분포) 생물학에서 주로 사용되는 2가지 이산확률분포 Binominal distribution (이항분포) Poisson distribution (포아슨분포)
Binominal distribution (이항분포) 사물이나 사건은 2 mutually exclusive categories (상호배타적 범주)중 하나에 속한다 Ex. 동전의 head and tail, asleep and awake, male and female, present and absent 2개 이상의 범주를 가지더라도 2개의 범주로 묶을 수 있다 One category and everything else as the other category Ex. Color: red and not red
Binominal probability distribution의 특성 1. event 나 trial 의 총 수: k로 표시 2. 사건이 일어날 때마다 2 mutually exclusive outcomes (상호배타적 결과) 중 하나가 나옴 하나의 outcome이 나올 확률: p로 표시 The other outcome이 나올 확률: q로 표시 p + q = 1 and q = 1 – p 3. 사건들은 독립적이다 한 사건의 일어나는 것이 다른 사건이 일어나는데 영향을 미치지 않는다 4. 총 사건 수 k 중 관심을 가지는 사건의 수: x로 표시 x가 일어날 확률: p(x)로 표시
Binominal probability distribution Ex. 두 개의 동전을 동시 던질 때 나올 수 있는 결과 2 heads, 1 head and 1 tail, or 2 tails 위의 3 결과가 나올 확률은? Head 가 나올 확률 = ½, tail이 나올 확률 = ½ 둘 다 head 일 확률 = ½ × ½ = 0.25 둘 다 tail 일 확률 = ½ × ½ = 0.25 1 head and 1 tail이 나올 경우 2가지, 따라서 확률은: 0.25 + 0.25 = 0.5 Multiplication and addition rules (곱의 법칙, 합의 법칙)
Binominal probability distribution 1. The multiplication rule (the ‘and’ rule) 확률의 곱셈법칙 독립적인 사건이 동시에 일어날 확률은 각 사건이 일어날 확률의 곱이다 Ex. a가 일어날 확률: p(a), b가 일어날 확률: p(b)라면 a와 b가 동시에 일어날 확률 p(a) × p(b) 2. The addition rule (the ‘or’ rule) 여러 개의 사건 중 적어도 하나의 사건이 일어날 확률은 각 사건이 일어날 확률의 합이다 Ex. A와 B는 mutually exclusive events A나 B가 일어날 확률: p(A or B) = p(A) + p(B)
Binominal probability distribution Binominal distribution의 probability를 다음 식으로 일반화할 수 있다. (p + q)k = 1 한 결과가 나올 확률: p The other outcome이 나올 확률: q k: the number of events Ex. 3개의 동전을 던질 경우 Head가 나올 확률: p = 0.5, tail이 나올 확률: q = 0.5 (p + q)3 = 1 (k = 3) p3 + 3p2q + 3pq2 + q3 = 1 0.125 + 0.375 + 0.375 + 0.125 = 1 모두 head가 나올 확률: 0.125, 2head and 1 tail: 0.375…. k값이 클 경우 (계수)계산이 복잡하다
Binominal probability distribution k가 클 경우 (> 30) binominal formula (이항식)을 사용하면 편리함 kCx: k개에서 x개를 추출하는 경우의 수 Ex. 1. 동전을 3번 던져 head 가 1번 나올 확률 x = 1, k = 3, p = 0.5, q = 0.5 p(x) = 3! / 1! (3-1)! *(0.51)(0.52) = 0.375 Ex. 2. 2개의 주사위를 던져 1이 하나 나올 확률? x = 1, k = 2, p = 1/6 = 0.1667, q = 5/6 = 0.8333 p(x) = 2! / 1! (2-1)! *(0.16671)(0.83331) = 0.2778
Binominal probability distribution Example 5.2 Bush hogs (야생돼지) 는 항상 한배 (litters)에 6마리의 새끼를 낳는다 100 litters 중 수컷 새끼의 수가 5마리 이상인 경우는 몇 litters일까? 새끼가 수컷일 확률: 0.5, 암컷일 확률: 0.5 5마리가 수컷일 확률 (k = 6, x = 5, p = 0.5, q = 0.5) p(5) = 6! / 5! (6-5)! *(0.55)(0.51) = 0.0937 6마리 다 수컷일 확률 (k = 6, x = 6, p = 0.5, q = 0.5) p(6) = 6! / 6! (6-6)! *(0.56)(0.50) = 0.0156 p(5) + p(6) = 0.0937 + 0.0156 = 0.1093 수컷이 5마리 이상인 litters의 수: 0.1093 × 100 = 10.93 약 11 litters
Binominal probability distribution Example 5.3 실제로 조사했을 때 만약에 수컷이 5마리 이상인 경우가 20 litters 이고, 암컷이 5마리 이상인 경우가 20 litters였다면 추정해 볼 수 있는 현상은? 암수가 X, Y chromosome의 random combination에 의해 결정되지 않을 것이다 다른 factor가 성의 결정에 영향을 미칠 것이다
Exercises Heterozygous sickle-cell gene을 가진 부부가 질병을 가진 아이를 낳을 확률이 0.25이다. 이들 부부가 6명의 아이를 낳았을 때 모두 정상일 확률은?
Exercises 새로 개발된 약이 병을 고칠 확률이 50%. 5명의 환자에게 이 약을 투여했을 경우 4명 이상이 치료될 확률은?
The Poisson distribution Rare events 가 발생하는 확률을 예측하는데 주로 사용된다 Events의 발생이 서로 독립적인가를 결정할 때 사용됨 사건이 단순히 chance (우연)에 의해 발생하는가? 실제 측정된 frequency distribution을 Poisson distribution으로 예측된 frequencies와 비교하여 측정된 사건의 발생이 독립적인지 아닌지를 판단할 수 있다
The Poisson distribution Example 5.4 Maple seedling sample in Chapter 3 (Table 5.2) Maple seedling의 분포가 독립적인가? 만약 그렇다면 frequency distribution은 Poisson distribution을 따른다 아니라면 1. 하나의 maple seedling의 occurrence는 다른 maple seedling occurrence에 영향을 받는다는 의미 2. maple seedling의 분포가 random distribution이 아님. Chance가 아닌 다른 환경요인에 의해 seedling의 분포가 영향을 받음
The Poisson distribution p(x): x events의 확률 e: 자연로그상수 (2.7183) μ: population mean, 일반적으로 population mean을 알 수 없으므로 sample mean을 사용한다
The Poisson distribution Example 5.4 Maple seedling sample in Chapter 3 (Table 5.2) 100 quadrats, 141 seedlings in 100 quadrats = 141/100 = 1.41 Ex. One seedling per quadrat p(x = 1) = (1.411)(e-1.41)/ 1! = 1.41 * 0.244 143 = 0.344
The Poisson distribution = 141/100 = 1.41 1) 0 seedling per quadrat p(x = 0) = (1.4100)(e-1.41)/ 0! = 0.244143 2) 1 seedling per quadrat p(x = 1) = (1.411)(e-1.41)/ 1! = 1.41 * 0.244143 = 0.344 3) 2 seedling per quadrat p(x = 2) = (1.412)(e-1.41)/ 2! = 1.412 * 0.244143 /2= 0.243 4) 3 seedling per quadrat p(x = 3) = (1.413)(e-1.41)/ 3! = 1.413 * 0.244143/6 = 0.114 5) 4 seedling per quadrat p(x = 4) = (1.414)(e-1.41)/ 4! = 1.414 * 0.244143/24 = 0.0402 6) 5 seedling per quadrat p(x = 5) = (1.415)(e-1.41)/ 5! = 1.415 * 0.244143/120 = 0.01134 7) 6 seedling per quadrat p(x = 6) = (1.416)(e-1.41)/ 6! = 1.416 * 0.244143/720 = 0.00266
The Poisson distribution Expected (using the Poisson distribution) and observed frequencies of maple seedling
The Poisson distribution Expected (using the Poisson distribution) and observed frequencies of maple seedling A goodness-of-fit test can be applied to determine the difference is likely real or not (in Chapter 14)
The Poisson distribution Example 5.5 Bacterial viruses의 bacteria cell 내로의 infection Bacteria cell 내로 들어가는 phage particles의 수는Poisson distribution을 따른다 2.5 × 106 phage particles were mixed with 106 bacteria cells 몇 개의 bacteria cells 들이 phage particles에 infection 되지 않았을까? Mean number of phage particles per bacterial cell: 2.5 p(0) = (2.50 × e-2.5) / 0! = 0.0821 0.0821 × 106 = 8.21 × 104 cells
Exercises Bacterial viruses 의 bacteria cell 내로의 infection Bacteria cell 내로 들어가는 phage particles의 수는Poisson distribution을 따른다 x phage particles were mixed with 106 bacteria cells Infection 되지 않은 bacteria cells 이 1% 이하가 되기 위해서는 얼마만큼의 phage particles을 넣어주어야 할까? (99% 이상의 bacteria cells이 virus에 의해 감염되기를 원함)
Exercises 어떤 혈청을 주사했을 경우 부작용이 나타날 확률이 0.001이다. 1000명의 환자에게 혈청을 주사했을 때 2명에게서 부작용이 나타날 확률은?
Exercises 어떤 혈청을 주사했을 경우 부작용이 나타날 확률이 0.001이다. 1000명의 환자에게 혈청을 주사했을 때 2명에게서 부작용이 나타날 확률은? k = 1000 x = 2, p = 0.001, q = 0.999 p(2) = 1000! / 2! (1000 - 2)! * 0.0012 * 0.999(1000-2) = 499500 * 0.000001 * 0.368431921 = 0.1840
Homework 1 다음 자료를 이용하여 x = 0 to 8까지의 Poisson probabilities를 구하라. Population mean 이 sample mean과 같다고 가정함 Expected probabilities를 observed probabilities와 비교하라
Homework 2 5 × 108 bacterial cells과 3 × 108 bacteriophages를 섞어주었을 때 phage particle이 3개 이상 흡수된 bacterial cells의 수는?