P(B|A) P(A|B) 5.4 베이즈의 법칙(Bayes’ Law)… -베이즈의 법칙은 이 법칙을 발견한 18세기 수학자인 Thomas Bayes를 따라서 붙여진 이름이다. -베이즈 법칙은 사전확률P(A)과 우도확률P(B|A)를 안다 면 사후확률 P(A|B)를 알 수 있다는 것이다. P(B|A) P(A|B)
베이지안 이론이란 즉 사건이 발생하고 난 후, 사건발생의 원인에 대한 확률(사후)을 사건발생전에 이미 알고 있는 정보(사전)를 이용하여 구하는 것
확률분포(사전,사후) 사후확률분포 사건발생 후 그 사건의 원인이 발생할 수 있는 사건이 무엇인지를 추정하여 그 가능성을 나타내는 변수의 분포 를 의미 사전확률분포 사건발생 전에 사건의 원인이 될 수 있는 사건들에 관 한 분포를 의미 따라서 베이지안이론은 특정한 사건이 발생한 후 그 사건 의 원인이 될 수 있는 사건들에 대한 사전확률분포를 이 용하여 사후에 원인이 될 수 있는 사건들에 관한 사후확 률분포를 도출하는 방법을 말한다.
Bayesian Terminology… 용어/ -사전확률(prior probability): A(원인)가 발생할 확률 P(A) 와 같이 결과가 나타나기 전에 결정되어 있는 확률이다. -우도확률(likelihood probability): A (원인)가 발생하였다 는 조건하에서 B(결과)가 발생할 확률 P(B|A)을 나타낸다. -사후확률(posterior probability): 사후확률은 B(결과)가 발생하였다는 조건하에서 A(원인)가 발생하였을 확률을 나 타낸다.
확률분포(사전,사후)
베이즈의 법칙(Bayes’ Law)… -결과 B 를 발생시키는 원인들이 A1, A2, …, Ak 라고 하자. 사전확률 P(A1), P(A2), …, P(Ak) 과 우도확률 P(B|A1), P(B|A2),…, P(B|Ak) 가 알려져 있다고 하자. -사후확률 즉 결과 B가 발생하였다는 조건 하에서 원인 Ai 가 발생하였을 확률은 얼마인가?
베이즈의 법칙(Bayes’ Law)… ->따라서 사후확률은 사전확률들과 우도확률들로 나 타낼 수 있다.
베이즈정리
확률의법칙(덧셈.곱셈법칙)
베이즈정리
베이즈정리
베이즈정리의 확장
예5.9 MBA지원자는 GMAT준비과목을 수강하여야 하는가? -GMAT는 MBA프로그램의 모든 지원자들이 치뤄야 하는 시험이다. 2002점에서 800점까지의 점수를 가지고 있는 GMAT시험 점수를 높이는데 도움을 주는 다양한 준비과목 들이 있다. -MBA학생들을 대상으로 실시한 서베이에 의하면 650점 이상의 GMAT점수를 취득한 사람들 중에서 52%가 준비과 목을 수강한 반면 650점 미만의 GMAT점수를 취득한 사람 들 중에서 23%만이 준비과목을 수강하였다.
예5.9 MBA지원자는 GMAT준비과목을 수강하여야 하는가? -특정한 MBA프로그램을 지원하는 한 지원자가 이 MBA프로그램에 입학하기 위해서는 650점이상의 GMAT점수를 취득해야 한다. 그러나 그는 이와 같은 높은 점수를 취득할 확률은 10%라고 생각한다. 그는 $500의 비용이 드는 준비과목의 수강을 고려하고 있다. 만일 650점이상의 GMAT점수를 취득할 확률이 두배 증가한다면 그는 기꺼이 준비과목을 수강할 것이다. 그 는 어떻게 해야 하는가?
예제 5.9 – 통계기호로 전환… 사건 A = GMAT 650점 이상 취득, 따라서 사건 AC = GMAT 650점 미만 취득 이라고 하 자. 지원자가 준비과목을 수강하지 않고 GMAT 650점이 상 취득할 확률은 10%이므로 P(A) = .10 따라서 P(AC) = 1 – .10 = .90
예제 5.9 – 통계기호로 전환… -사전 B=준비과목을 수강하는 사건이고 사건 BC =준비과목을 수강하지 않는 사건이라고 하자. -서베이 정보로부터 P(B|A)=0.52, P(B|AC)=0.23 -지원자는 P(A | B)를 알기 원하며 P(A|B)>20%이면 준비과목수강을 위해 $500를 지불할 것이다.
예제 5.9 – 통계기호로 전환… -서베이 정보로부터 P(B|A)=0.52, P(B|AC)=0.23 이 므로 여사건법칙을 사용하면 P(BC | A) = 1 -.52 = .48 P(BC | AC ) = 1 -.23 = .77
예제5.9 MBA지원자는 GMAT준비과목을 수강하여야 하는가?… -확률나무를 사용하여 주어진 확률정보를 정리하면 Score ≥ 650 Prep Test B|A .52 A and B 0.052 A .10 BC|A .48 A and BC 0.048 B|AC .23 AC and B 0.207 AC .90 BC|AC .77 AC and BC 0.693
예제5.9 MBA지원자는 GMAT준비과목을 수강하여야 하는가?… >P(A | B) =P(A and B) / P(B)-> 베이즈의 법칙 적 용 ->확률나무로부터 P(A and B)=0.052, P(B)=P(A and B)+P(AC and B)=0.052+0.207=0.259 ->?? Score ≥ 650 Prep Test B|A .52 A and B 0.052 A .10 Marginal Prob. P(B) = P(A and B) + P(AC and B) = .259 BC|A .48 A and BC 0.048 B|AC .23 AC and B 0.207 AC .90 BC|AC .77 AC and BC 0.693
예제5.9 MBA지원자는 GMAT준비과목을 수강하여야 하는가?…
조건부확률(Conditional Probability)… -조건부 확률(conditional probability )은 다른 사건이 발생하였다는 조건하에서 한 사건이 발생할 확률로 정의된다. -사건B가 발생하였다는 조건하에서 사건A가 발생할 확률은 P(A | B) 로 나타내며 다음과 같이 계산된다. (->조건은 표본공간을 새롭게 정 의한다)
조건부확률(Conditional Probability)…
조건부확률(Conditional Probability)… 결합확률, 조건부 확률, 주변확률의 관계 P(A∩B) 결합확률 P(A|B) = P(B) 주변확률 • P(A|B)=P(A and B)/P(B) • P(B|A)=P(A and B)/P(A) • P(B and A)=P(A|B)*P(B)=P(B|A)*P(A)
조건부확률(Conditional Probability)… -P(A|B)와 P(B|A)의 관계
조건부확률(Conditional Probability)… -예제 5.2 뮤추얼펀드 매니저의 성공요인 2 (응용) 펀드매니저가 상위 20위 MBA프로그램을 졸업하였다는 조건하에서 뮤 추얼펀드의 수익률이 시장수익률보다 높을 확률은 얼마인가? “ P(B1 | A1) ?”
조건부확률(Conditional Probability)… P(Ai) A1 .11 .29 .40 A2 .06 .54 .60 P(Bj) .17 .83 1.00 따라서 펀드매니저가 상위 20위 MBA프로그램을 졸업하였다는 조건 하에서 뮤추얼펀드의 수익률이 시장수익률보다 높을 확률은 27.5%이다.
독립사건(Independence)… -조건부확률을 계산하는 목적 중의 하나는 두 사선들이 관련되어 있는 지를 결정하는 것이다. -특히, 두 사건들이 독립인가, 즉 한 사건의 확률이 다른 사건의 발생에 의해서 영향을 받지 않는지를 결정하는 것이다. -사건 A와 사건B가 다음의 조건을 충족시키면 독립이다. P(A|B) = P(A) or P(B|A) = P(B)
독립사건(Independence)… 예. 예제5.2에서 P(B1 | A1) = .275 이고 결합확률표로부터 한계확률 P(B1) = 0.17 이다. ->P(B1|A1) ≠ P(B1)이므로, 사건B1 and 사건A1은 독립이 아니다. 다 시 말하면 사건B1 and 사건A1 은 종속이다. 즉 사건B1의 확률은 사건A1 의 발생여부에 의해 영향을 받는다.
합사건(Union)… P(A or B) -예제 5.4. 뮤추얼펀드의 수익률이 시장수익률보다 높거나 또는 펀드 매니저가 상위 20위 MBA 프로그램을 졸업하였을 확률은 얼마인가? “P(A1 or B1)=?”
합사건(Union)… B1 B2 P(Ai) A1 A2 P(Bj) .11 .29 .40 .06 .54 .60 .17 .83 1.00 A1 P(A1 or B1) = .11 + .06 + .29 = .46
합사건(Union)… B1 B2 P(Ai) A1 A2 P(Bj) .11 .29 .40 .06 .54 .60 .17 .83 P(A1 and B1), P(A1 and B2), P(A2 and B1) B1 B2 P(Ai) A1 .11 .29 .40 A2 .06 .54 .60 P(Bj) .17 .83 1.00 P(A1 or B1) = P(A1 and B1)+P(A1 and B2)+P(A2 and B1) = .11 + .06 + .29 = .46
합사건(Union)… P(A2 and B2) B1 B2 P(Ai) A1 A2 P(Bj) .11 .29 .40 .06 .54 .60 P(Bj) .17 .83 1.00 A1 P(A1 or B1) = 1 – P(A2 and B2) = 1 – .54 = .46
5.3 확률법칙과 확률나무(Probability Trees)… -복잡한 사건의 확률을 계산하기 위한 3가지의 확률법칙 논의… 여사건법칙(Complement Rule), 곱셈법칙(Multiplication Rule) 덧셈법칙(Addition Rule)
여사건법칙(Complement Rule)… -여사건법칙은 사건A의 여사건인 AC의 확률 (사건A가 발생하지 않을 확률)을 제공한다. 즉 P(AC) = 1 – P(A) -예. 한 개의 주사위 던지기 실험에서 1이 나올 확률은 1/6이다. 1이 아 닌 다른 수가 나올 확률은 여사건 법칙을 적용하면 1-1/6=5/6이다.
곱셈법칙(Multiplication Rule)… -곱셈법칙은 두 사건의 결합확률을 계산하기 위해 사 용된다. 조건부 확률의 공식 또는 을 이용하면 또는 -사건A와 사건B가 독립이면,
예제 5.5 복원이 없는 두학생의 선택… - 한 대학원 통계학 과목을 수강하는 학생은 남학생 7 명과 여학생 3명이다. 이 과목의 교수는 연구프로젝트 의 수행을 돕기 위한 2명의 학생을 임으로 선발하기를 원한다. 선발된 2명의 학생이 모두 여학생일 확률은 얼 마인가? -A를 첫 번째 학생이 여학생일 사건이라고 하자. P(A) = 3/10 = .30
예제 5.5 복원이 없는 두학생의 선택… -B를 두 번째 학생이 여학생일 사건이라고 하자. 첫 번째 학생이 여학생이라는 조건 하에서 여학생이 선 발될 확률은 (나머지 9명중 여학생이 2명이므로) P(B | A) = 2/9 = .22 -따라서 선발된 2명이 모두 여학생일 확률은 P(A and B)이므로 P(A and B) = P(A)•P(B|A) = (3/10)(2/9) = 6/90 = .067
덧셈법칙
A B A B + – = 덧셈법칙(Addition Rule)… -덧셈법칙은 사건A와 사건B의 합사건 (A or B)의 확 률을 계산하기 위해 사용된다. P(A or B) = P(A) + P(B) – P(A and B) -사건A와 사건B가 상호배타적이면 P(A and B)=0이므로 P(A or B)=P(A)+P(B) A B A B + – =
예제 5.7 덧셈법칙의 적용… 한 대도시에서 두 개의 신문인 Sun 과 Post가 발간된다. 신문판매부서 는 이 도시 가구의 22%는 Sun을 구독하고 35%는 Post를 구독한다고 보고한다. 한 서베이는 이 도시 가구의 6%는 두 신문 모두를 구독한다 는 것으로 보여준다. 이 도시에서 임의로 선택된 가구가 어떤 신문이든 신문을 구독할 확률은 얼마인가? P(Sun or Post) = P(Sun) + P(Post) – P(Sun and Post) = .22 + .35 – .06 = .51 “ 이 도시에서 임의로 선택된 가구가 신문을 구독할 확률은 51%이다.”
확률나무(Probability Trees)… -확률법칙을 적용하는 간단한 방법은 확률나무이다. 확률나무에서 하나의 실험에서 발생되는 사건들은 선 으로 연결된다. 결과적으로 얻어지는 그림은 나무를 닮 았고 이에 따라 확률나무라는 이름이 붙여졌다.