P(B|A) P(A|B) 5.4 베이즈의 법칙(Bayes’ Law)…

Slides:



Advertisements
Similar presentations
1. 도형의 연결 상태 2. 꼭지점과 변으로 이루어진 도형 Ⅷ. 도형의 관찰 도형의 연결상태 연결상태가 같은 도형 단일폐곡선의 성질 연결상태가 같은 입체도형 뫼비우스의 띠.
Advertisements

제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
5.1 주관적 확률 컴퓨터 제조회사의 사장은 향후 5 년 동안 노트북 컴퓨터 수요 가 2 배 될 가능성을 70% 로 예측한다. 5.2 샘플공간은 2 개의 가능성을 가지고 있다. (1)A = Air France 는 아이오아주의 매일 포카텔로 로 운항하는 항공 편을 만들 예정이다.
재료수치해석 HW # 박재혁.
패턴인식 개론 Ch.4 기초 통계와 확률 이론 Translated from “CSCE 666 Pattern Analysis | Ricardo Gutierrez-Osuna | “
B4-1.
• 수학 • 6학년 나단계 • 7. 연비>1/9 홈 두 수의 대응 관계를 , 를 사용한 식으로 나타내기 수업활동 수업계획.
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
구간추정 (Interval Estimation)
고장률 failure rate 어떤 시점까지 동작하여 온 품목이 계속되는 단위기간내에 고장을 일으키는 비율(횟수). 고장률은 확률이 아니며 따라서 1 보다 커도 상관없다. 고장이 발생하기 쉬운 정도를 표시하는 척도. 일반으로 고장률은 순간고장률과 평균고장률을 사용하고 있지만.
앙금 생성 반응식(1) 누가 앙금을 만들었는지 쉽게 알려 줘! 앙금 생성 반응식.
밥 파이크의 창의적 교수법.
베이즈 정리(Bayesian Theory)
제 12 장 직교배열표에 의한 실험계획(1).
제9장 채널용량(Channel capacity)
질의 사항 Yield Criteria (1) 소재가 평면응력상태에 놓였을 때(σ3=0), 최대전단응력조건과 전단변형에너지 조건은σ1 – σ2 평면에서 각각 어떤 식으로 표시되는가? (2) σ1 =σ2인 등이축인장에서 σ = Kεn로 주어지는 재료의 네킹시 변형율을 구하라.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
몬티홀 문제 (Monty Hall Problem).
Tail-recursive Function, High-order Function
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
제 4장 시스템 신뢰도와 중복설계.
Ⅱ. 지구의 변동과 역사 1. 지구의 변동 2. 지구의 역사 3. 우리나라의 지질.
별의 밝기와 거리[2] 밝다고 가까운 별은 아니야! 빛의 밝기와 거리와의 관계 별의 밝기 결정.
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
프로그래밍 개요
어서와 C언어는 처음이지 제14장.
학습 주제 p 역학적 에너지는 보존될까?(1).
13. 포인터와 배열! 함께 이해하기 IT응용시스템공학과 김 형 진 교수.
벡터의 공간 이문현.
자료구조: CHAP 7 트리 –review 순천향대학교 컴퓨터공학과 하 상 호.
27장. 모듈화 프로그래밍.
[예제] 의사결정나무 현재의 공장을 기술적 진부화에 대비하여 현대화하는 문제를 고려 중인 상태에서,
문제 2명의 사형수가 있다. 둘에게는 검정색 모자와 흰색 모자를 임의로 씌우는데, 자기가 쓴 모자의 색은 절대로 알 수가 없다. 서로 상대의 모자색만을 볼 수 있고, 이들이 살기 위해선 자신의 쓴 색의 모자를 맞춰야 한다. 단, 둘 중 한명만이라도 자신이 쓴 모자의 색을.
Keller: Stats for Mgmt & Econ, 7th Ed 확률의 이해 Probability
이번 학기 공부할 내용 확률 확률변수 결합확률분포 이산확률분포 연속확률분포 기술통계학 표본분포 추정 가설검정 이재원
학습 주제 p 일률 측정하기.
Week 5:확률(Probability)
두 모집단에 대한 검정.
합집합과 교집합이란 무엇인가? 01 합집합 두 집합 A, B에 대하여 A에 속하거나 B에 속하는 모든 원소로 이루어진 집합을 A와 B의 합집합이라고 하며, 기호 A∪B로 나타낸다. A∪B ={x | x∈A 또는 x∈B}
학습 주제 p 운동 에너지란 무엇일까?(2).
3강. 컴퓨터와의 기본적인 소통수단 - I 연산자란? 컴퓨터와 소통하기 위한 다양한 방법들
보고서 #7 (기한: 6/2) 2개의 스택, stk1, stk2를 이용하여 큐를 구현하라.
논문작성을 위한 연구모형 설정 양동훈.
표지 수학8-나 2학년 2학기  Ⅲ.도형의 닮음 (4) 삼각형의 중점연결정리 (13/21) 삼각형의 중점연결정리.
객체기반 SW설계 팀활동지 4.
끓는점을 이용한 물질의 분리 (1) 열 받으면 누가 먼저 나올까? 증류.
Distribution(모의 실험에 자주 쓰이는 분포들)
Keller: Stats for Mgmt & Econ, 7th Ed 회귀모형의 정형화 Model Building
01 로그의 정의 ⑴ 일 때, 양수 에 대하여 을 만족시키는 실수 는 오직 하나 존재한다. 이때 를
디버깅 관련 옵션 실습해보기 발표 : 2008년 5월 19일 2분반 정 훈 승
감마분포 gamma distribution
Sampling Distributions
1학기 수학 연산 풀이 (3학년) 와이즈캠프 담임선생님.
바넘효과 [Barnum effect] 사람들이 보편적으로 가지고 있는 성격이나 심리적 특징을 자신만의 특성으로 여기는 심리적 경향. 19세기 말 곡예단에서 사람들의 성격과 특징 등을 알아 내는 일을 하던 바넘(P.T. Barnum)에서 유래하였다. 1940년대 말 심리학자인.
Week 6:순열(Permutation)과 조합(Combination)
광합성에 영향을 미치는 환경 요인 - 생각열기 – 지구 온난화 해결의 열쇠가 식물에 있다고 하는 이유는 무엇인가?
Ⅵ. 확 률 1. 확 률 2. 확률의 계산.
확률 Probability 3 Probability.
5.1-1 전하의 흐름과 전류 학습목표 1. 도선에서 전류의 흐름을 설명할 수 있다.
상관계수.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
수치해석 ch3 환경공학과 김지숙.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
확 률 1 1 사건 2 확률 3 조건부 확률.
(Permutations and Combinations)
13. 포인터와 배열! 함께 이해하기.
얼마나 많은가? Lezhin.
문제의 답안 잘 생각해 보시기 바랍니다..
Report #2 (기한: 3/16) 데이터 구조 과목의 수강생이 50명이라고 가정한다. 이 학생(학번은 2016????으로 표현됨)들의 중간 시험(0~100), 기말 시험(0~100) 성적을 성적 파일에 작성하라(프로그램을 통해서 또는 수작업으로). 성적 파일을 읽어들여서.
Presentation transcript:

P(B|A) P(A|B) 5.4 베이즈의 법칙(Bayes’ Law)… -베이즈의 법칙은 이 법칙을 발견한 18세기 수학자인 Thomas Bayes를 따라서 붙여진 이름이다. -베이즈 법칙은 사전확률P(A)과 우도확률P(B|A)를 안다 면 사후확률 P(A|B)를 알 수 있다는 것이다. P(B|A) P(A|B)

베이지안 이론이란 즉 사건이 발생하고 난 후, 사건발생의 원인에 대한 확률(사후)을 사건발생전에 이미 알고 있는 정보(사전)를 이용하여 구하는 것

확률분포(사전,사후) 사후확률분포 사건발생 후 그 사건의 원인이 발생할 수 있는 사건이 무엇인지를 추정하여 그 가능성을 나타내는 변수의 분포 를 의미 사전확률분포 사건발생 전에 사건의 원인이 될 수 있는 사건들에 관 한 분포를 의미 따라서 베이지안이론은 특정한 사건이 발생한 후 그 사건 의 원인이 될 수 있는 사건들에 대한 사전확률분포를 이 용하여 사후에 원인이 될 수 있는 사건들에 관한 사후확 률분포를 도출하는 방법을 말한다.

Bayesian Terminology… 용어/ -사전확률(prior probability): A(원인)가 발생할 확률 P(A) 와 같이 결과가 나타나기 전에 결정되어 있는 확률이다. -우도확률(likelihood probability): A (원인)가 발생하였다 는 조건하에서 B(결과)가 발생할 확률 P(B|A)을 나타낸다. -사후확률(posterior probability): 사후확률은 B(결과)가 발생하였다는 조건하에서 A(원인)가 발생하였을 확률을 나 타낸다.

확률분포(사전,사후)

베이즈의 법칙(Bayes’ Law)… -결과 B 를 발생시키는 원인들이 A1, A2, …, Ak 라고 하자. 사전확률 P(A1), P(A2), …, P(Ak) 과 우도확률 P(B|A1), P(B|A2),…, P(B|Ak) 가 알려져 있다고 하자. -사후확률 즉 결과 B가 발생하였다는 조건 하에서 원인 Ai 가 발생하였을 확률은 얼마인가?

베이즈의 법칙(Bayes’ Law)… ->따라서 사후확률은 사전확률들과 우도확률들로 나 타낼 수 있다.

베이즈정리

확률의법칙(덧셈.곱셈법칙)

베이즈정리

베이즈정리

베이즈정리의 확장

예5.9 MBA지원자는 GMAT준비과목을 수강하여야 하는가? -GMAT는 MBA프로그램의 모든 지원자들이 치뤄야 하는 시험이다. 2002점에서 800점까지의 점수를 가지고 있는 GMAT시험 점수를 높이는데 도움을 주는 다양한 준비과목 들이 있다. -MBA학생들을 대상으로 실시한 서베이에 의하면 650점 이상의 GMAT점수를 취득한 사람들 중에서 52%가 준비과 목을 수강한 반면 650점 미만의 GMAT점수를 취득한 사람 들 중에서 23%만이 준비과목을 수강하였다.

예5.9 MBA지원자는 GMAT준비과목을 수강하여야 하는가? -특정한 MBA프로그램을 지원하는 한 지원자가 이 MBA프로그램에 입학하기 위해서는 650점이상의 GMAT점수를 취득해야 한다. 그러나 그는 이와 같은 높은 점수를 취득할 확률은 10%라고 생각한다. 그는 $500의 비용이 드는 준비과목의 수강을 고려하고 있다. 만일 650점이상의 GMAT점수를 취득할 확률이 두배 증가한다면 그는 기꺼이 준비과목을 수강할 것이다. 그 는 어떻게 해야 하는가?

예제 5.9 – 통계기호로 전환… 사건 A = GMAT 650점 이상 취득, 따라서 사건 AC = GMAT 650점 미만 취득 이라고 하 자. 지원자가 준비과목을 수강하지 않고 GMAT 650점이 상 취득할 확률은 10%이므로 P(A) = .10 따라서 P(AC) = 1 – .10 = .90

예제 5.9 – 통계기호로 전환… -사전 B=준비과목을 수강하는 사건이고 사건 BC =준비과목을 수강하지 않는 사건이라고 하자. -서베이 정보로부터 P(B|A)=0.52, P(B|AC)=0.23 -지원자는 P(A | B)를 알기 원하며 P(A|B)>20%이면 준비과목수강을 위해 $500를 지불할 것이다.

예제 5.9 – 통계기호로 전환… -서베이 정보로부터 P(B|A)=0.52, P(B|AC)=0.23 이 므로 여사건법칙을 사용하면 P(BC | A) = 1 -.52 = .48 P(BC | AC ) = 1 -.23 = .77

예제5.9 MBA지원자는 GMAT준비과목을 수강하여야 하는가?… -확률나무를 사용하여 주어진 확률정보를 정리하면 Score ≥ 650 Prep Test B|A .52 A and B 0.052 A .10 BC|A .48 A and BC 0.048 B|AC .23 AC and B 0.207 AC .90 BC|AC .77 AC and BC 0.693

예제5.9 MBA지원자는 GMAT준비과목을 수강하여야 하는가?… >P(A | B) =P(A and B) / P(B)-> 베이즈의 법칙 적 용 ->확률나무로부터 P(A and B)=0.052, P(B)=P(A and B)+P(AC and B)=0.052+0.207=0.259 ->?? Score ≥ 650 Prep Test B|A .52 A and B 0.052 A .10 Marginal Prob. P(B) = P(A and B) + P(AC and B) = .259 BC|A .48 A and BC 0.048 B|AC .23 AC and B 0.207 AC .90 BC|AC .77 AC and BC 0.693

예제5.9 MBA지원자는 GMAT준비과목을 수강하여야 하는가?…

조건부확률(Conditional Probability)… -조건부 확률(conditional probability )은 다른 사건이 발생하였다는 조건하에서 한 사건이 발생할 확률로 정의된다. -사건B가 발생하였다는 조건하에서 사건A가 발생할 확률은 P(A | B) 로 나타내며 다음과 같이 계산된다. (->조건은 표본공간을 새롭게 정 의한다)

조건부확률(Conditional Probability)…

조건부확률(Conditional Probability)… 결합확률, 조건부 확률, 주변확률의 관계 P(A∩B) 결합확률 P(A|B) = P(B) 주변확률 • P(A|B)=P(A and B)/P(B) • P(B|A)=P(A and B)/P(A) • P(B and A)=P(A|B)*P(B)=P(B|A)*P(A)

조건부확률(Conditional Probability)… -P(A|B)와 P(B|A)의 관계

조건부확률(Conditional Probability)… -예제 5.2 뮤추얼펀드 매니저의 성공요인 2 (응용) 펀드매니저가 상위 20위 MBA프로그램을 졸업하였다는 조건하에서 뮤 추얼펀드의 수익률이 시장수익률보다 높을 확률은 얼마인가? “ P(B1 | A1) ?”

조건부확률(Conditional Probability)… P(Ai) A1 .11 .29 .40 A2 .06 .54 .60 P(Bj) .17 .83 1.00 따라서 펀드매니저가 상위 20위 MBA프로그램을 졸업하였다는 조건 하에서 뮤추얼펀드의 수익률이 시장수익률보다 높을 확률은 27.5%이다.

독립사건(Independence)… -조건부확률을 계산하는 목적 중의 하나는 두 사선들이 관련되어 있는 지를 결정하는 것이다. -특히, 두 사건들이 독립인가, 즉 한 사건의 확률이 다른 사건의 발생에 의해서 영향을 받지 않는지를 결정하는 것이다. -사건 A와 사건B가 다음의 조건을 충족시키면 독립이다. P(A|B) = P(A) or P(B|A) = P(B)

독립사건(Independence)… 예. 예제5.2에서 P(B1 | A1) = .275 이고 결합확률표로부터 한계확률 P(B1) = 0.17 이다. ->P(B1|A1) ≠ P(B1)이므로, 사건B1 and 사건A1은 독립이 아니다. 다 시 말하면 사건B1 and 사건A1 은 종속이다. 즉 사건B1의 확률은 사건A1 의 발생여부에 의해 영향을 받는다.

합사건(Union)… P(A or B) -예제 5.4. 뮤추얼펀드의 수익률이 시장수익률보다 높거나 또는 펀드 매니저가 상위 20위 MBA 프로그램을 졸업하였을 확률은 얼마인가? “P(A1 or B1)=?”

합사건(Union)… B1 B2 P(Ai) A1 A2 P(Bj) .11 .29 .40 .06 .54 .60 .17 .83 1.00 A1 P(A1 or B1) = .11 + .06 + .29 = .46

합사건(Union)… B1 B2 P(Ai) A1 A2 P(Bj) .11 .29 .40 .06 .54 .60 .17 .83 P(A1 and B1), P(A1 and B2), P(A2 and B1) B1 B2 P(Ai) A1 .11 .29 .40 A2 .06 .54 .60 P(Bj) .17 .83 1.00 P(A1 or B1) = P(A1 and B1)+P(A1 and B2)+P(A2 and B1) = .11 + .06 + .29 = .46

합사건(Union)… P(A2 and B2) B1 B2 P(Ai) A1 A2 P(Bj) .11 .29 .40 .06 .54 .60 P(Bj) .17 .83 1.00 A1 P(A1 or B1) = 1 – P(A2 and B2) = 1 – .54 = .46

5.3 확률법칙과 확률나무(Probability Trees)… -복잡한 사건의 확률을 계산하기 위한 3가지의 확률법칙 논의… 여사건법칙(Complement Rule), 곱셈법칙(Multiplication Rule) 덧셈법칙(Addition Rule)

여사건법칙(Complement Rule)… -여사건법칙은 사건A의 여사건인 AC의 확률 (사건A가 발생하지 않을 확률)을 제공한다. 즉 P(AC) = 1 – P(A) -예. 한 개의 주사위 던지기 실험에서 1이 나올 확률은 1/6이다. 1이 아 닌 다른 수가 나올 확률은 여사건 법칙을 적용하면 1-1/6=5/6이다.

곱셈법칙(Multiplication Rule)… -곱셈법칙은 두 사건의 결합확률을 계산하기 위해 사 용된다. 조건부 확률의 공식 또는 을 이용하면 또는 -사건A와 사건B가 독립이면,

예제 5.5 복원이 없는 두학생의 선택… - 한 대학원 통계학 과목을 수강하는 학생은 남학생 7 명과 여학생 3명이다. 이 과목의 교수는 연구프로젝트 의 수행을 돕기 위한 2명의 학생을 임으로 선발하기를 원한다. 선발된 2명의 학생이 모두 여학생일 확률은 얼 마인가? -A를 첫 번째 학생이 여학생일 사건이라고 하자. P(A) = 3/10 = .30

예제 5.5 복원이 없는 두학생의 선택… -B를 두 번째 학생이 여학생일 사건이라고 하자. 첫 번째 학생이 여학생이라는 조건 하에서 여학생이 선 발될 확률은 (나머지 9명중 여학생이 2명이므로) P(B | A) = 2/9 = .22 -따라서 선발된 2명이 모두 여학생일 확률은 P(A and B)이므로 P(A and B) = P(A)•P(B|A) = (3/10)(2/9) = 6/90 = .067

덧셈법칙

A B A B + – = 덧셈법칙(Addition Rule)… -덧셈법칙은 사건A와 사건B의 합사건 (A or B)의 확 률을 계산하기 위해 사용된다. P(A or B) = P(A) + P(B) – P(A and B) -사건A와 사건B가 상호배타적이면 P(A and B)=0이므로 P(A or B)=P(A)+P(B) A B A B + – =

예제 5.7 덧셈법칙의 적용… 한 대도시에서 두 개의 신문인 Sun 과 Post가 발간된다. 신문판매부서 는 이 도시 가구의 22%는 Sun을 구독하고 35%는 Post를 구독한다고 보고한다. 한 서베이는 이 도시 가구의 6%는 두 신문 모두를 구독한다 는 것으로 보여준다. 이 도시에서 임의로 선택된 가구가 어떤 신문이든 신문을 구독할 확률은 얼마인가? P(Sun or Post) = P(Sun) + P(Post) – P(Sun and Post) = .22 + .35 – .06 = .51 “ 이 도시에서 임의로 선택된 가구가 신문을 구독할 확률은 51%이다.”

확률나무(Probability Trees)… -확률법칙을 적용하는 간단한 방법은 확률나무이다. 확률나무에서 하나의 실험에서 발생되는 사건들은 선 으로 연결된다. 결과적으로 얻어지는 그림은 나무를 닮 았고 이에 따라 확률나무라는 이름이 붙여졌다.