확률 Probability 3 Probability
표본공간과 사건 실험으로부터 실현된 결과를 실험의 결과(sample outcome)라고 한다. 실험에서 발생 가능한 모든 결과들의 집합을 표본공간(sample space)이라 하고 S로 표기한다. 전체 표본공간 S 중에서 일부 혹은 전부를 골라서 모아 놓은 것을 사건(Event)이라고 한다. 3 Probability
동전 던지기의 예 동전을 두 번 던질 경우 가능한 결과 : HH, HT, TH, TT 이 결과들은 표본공간 : S = { HH, HT, TH, TT}. 사건 A를 앞면이 나온 경우로 정의하면 A = {HH, HT, TH}가 된다. 3 Probability
집합의 연산 합사건 union : A∪B로 표기 곱사건 intersection : A ∩ B로 표기 여사건(보집합) complements : 두 개의 사건 A와 B가 동일한 결과를 포함하고 있지 않다면 이 두 사건은 상호배타적(mutually exclusive)이라고 한다. A∩B = 또한 두 사건이 독립(Independent)인 경우도 있다. 이는 추후 다시 설명할 것임. 로 표기 3 Probability
예 A는 x2 + 2x = 8을 만족시키는 x의 집합이다. B는 x2 + x = 6을 만족시키는 x의 집합이다. x2 + 2x – 8 = (x + 4)(x - 2) = 0, A = {-4, 2} x2 + x - 6 = (x + 3)(x - 2) = 0, B = {-3, 2} A∩B = { 2 }, A∪B = {-4, -3, 2} 3 Probability
확률 (Probability) 확률은 어떤 사건이 발생할지 확실히 모르는 경우 일어날 가능성을 숫자로 표시한 것이다. 확률이 0인 사건은 일어날 수 없으며 확률이 1인 사건은 반드시 일어난다. 확률 : 수학적 확률, 통계적(경험적) 확률, 기하학적 확률 수학적 확률 : 통계적 확률 : ; n번 시행, 사건 A가 r 번 기하학적 확률 : 3 Probability
두 주사위 X와 Y를 동시에 던질 때 눈의 합이 7이 될 확률 ? 수학적 확률의 예 두 주사위 X와 Y를 동시에 던질 때 눈의 합이 7이 될 확률 ? 눈의 합이 7이 될 사건 : A 3 Probability
앞면이 나올 횟수의 비율(통계적 확률)은 전체의 1/2 에 가까워진다. 2. 통계적(경험적) 확률의 예 동전을 100번 던져 앞면이 46번 나왔다면 임의로 한 번 동전을 던졌을 때 앞면이 나올 통계적 확률 ? 그러나 동전을 던지는 횟수가 많으면 많을수록 앞면이 나올 횟수의 비율(통계적 확률)은 전체의 1/2 에 가까워진다. 즉 3 Probability
수학적 확률 : unknown 통계적 확률 이용 단 수학적 확률 값에 근접하게 하기 위해서는 실험의 횟수를 가능한 크게 한다. 찌그러진 동전이 앞면이 나올 확률 ? 우리 나라 유권자 중에서 A 후보를 지지할 확률 ? 유전적으로 암을 유발할 확률 ? 3 Probability
3. 기하학적 확률 3 Probability
예 : 길이가 2a인 선분 AB 위에 임의로 두 점 C, D를 잡을 때, CD의 길이가 a 이하가 될 확률 ? y x A C D B y 2a a a 2a x 3 Probability
확률 P의 기본적 성질 - P(AC) = 1 - P(A). - P() = 0. - 만약 A⊂B라면 P(A) P(B). 만약 세 사건 0 만약 상호배타적 3 Probability
조건부 확률 Conditional Probability 계산하면 보다 정확한 확률을 계산할 수 있다. 사건 A가 일어났을 경우, 사건 B의 조건부 확률 (conditional probability of B given A) 3 Probability
조건부 확률의 예 1 2개 추출 Let 사건 A : 첫 번째 흰 돌 사건 B : 두 번째 흰 돌 흰 돌 : 40개 검은 돌 : 60개 첫 번째 흰 돌(혹은 검은 돌)인 것을 알고 있는 상황에서 두 번째 흰 돌이 나올 확률 3 Probability
조건부 확률의 예 2 우리 나라 주식가격은 전날 장이 마감하는 미국 주식의 영향을 받는다 미국의 주식가격이 급격히 상승(사건 A)하였을 때 오늘의 주식가격이 상승(사건 B)할 확률을 계산한다고 하자 3 Probability
2개 추출 사건 A: 첫 번째 흰 돌 사건 B: 두 번째 흰 돌 흰 돌 : 40개 검은 돌 : 60개 혹은 중에서 의 비중 중에서 의 비중 3 Probability
세 사건(A, B, C)에 대한 확률 예 : 3개 추출할 때, 세 개가 모두 흰 돌일 확률 흰 돌 : 40개 검은 돌 : 60개 3 Probability
E(전동) M(수동) 합 N(새것) 40 30 70 U(헌것) 20 10 60 100 예: 타자기 100대 E(전동) M(수동) 합 N(새것) 40 30 70 U(헌것) 20 10 60 100 어느 임의로 선택한 타자기가 새 것일 때 이 타자기가 전동일 확률 ? P(E|N) =? 혹은 새 타자기 70대 중에 전동인 40대의 비율=40/70 3 Probability
S A2 A5 A1 A4 A6 A3 A7 전 확률(total probability) 의 계산 한 표본공간 S에서 개의 사건 and for 만약 S A2 A5 A1 A4 A6 A3 A7 3 Probability
B A2 S A5 A1 . . . A4 A3 Ak ; 전 확률의 법칙 Rule of total probability
예 불량품 3개 합격품 7개 불량품 1개 합격품 9개 상자 1 상자 2 1개 추출 불량품일 확률 ? A1 : 상자 1을 선택 A2 : 상자 2를 선택하는 경우 B : 불량품을 꺼낼 사건 이고 3 Probability
조건부 확률과 비(무)조건부 확률 Card 52 중에서 한 장을 빼고, 두 번째 card가 ace일 확률? 첫 번째 card가 ace일 사건 : A1 두 번째 card가 ace일 사건 : A2 P(A2) 와 P(A2|A1)의 차이 ? P(A2) = P(A1)P(A2|A1) + P(A1 )P(A2|A1 ) C C = (4/52)(3/51) + (48/52)(4/52) = 1/13 Card를 빼지 않고 다시 집어 넣을 때 두 번째 ace가 나올 확률과 동일하다. 반면에 조건부 확률 P(A2|A1) = 3/51 = 1/17 3 Probability
두 번째 ace가 나오면 15배인 15만원을 받는 게임이 있다. 게임에 참여하는 대가로 1만원을 지불해야 하고 두 번째 ace가 나오면 15배인 15만원을 받는 게임이 있다. 첫 번째 card의 정보가 없는 사람은 승률을 1/13으로 계산 그러나 첫 번째 card가 ace였다는 정보를 가지고 있는 사람은 승률을 1/17로 계산한다. 따라서 어떤 사건의 확률을 구할 때 주어진 정보를 이용하여 확률을 계산해야 보다 더 정확한 의사결정을 할 수 있을 것이다. 3 Probability
Bayes 정리 Bayes 정리 원인에 의해 결과가 일어날 확률 ? 앞의 예에서 불량품이 나올 확률을 구하는 것이 아니라 불량품이라는 결과를 알고 이것이 상자 1에서 나올 확률 ? 3 Probability
이미 알고 있는 사실 : 1. 2. 한 표본공간 S에서 개의 사건 and for 만약 ; 전확률의 법칙 ; Bayes 정리 3 Probability ; Bayes 정리
예 불량품 3개 합격품 7개 불량품 1개 합격품 9개 상자 1 상자 2 1개 추출 불량품일 확률 ? A1 : 상자 1을 선택 A2 : 상자 2를 선택하는 경우 B : 불량품을 꺼낼 사건 P(B) = 1/5 : 이미 계산되었음 불량품이 A1 상자에서 나왔을 확률 ? 3 Probability
P(A1)=0.4, P(A2) = 0.6, P(F|A1)=0.3, P(F|A1)=0.40 예 : 갑 후보 지지 : 유권자의 40% 을 후보 지지 : 유권자의 60% 갑 지지자 중 여자 : 30% 을 지지자 중 여자 : 40% 임의로 한 여자를 선택했을 때 이 여자가 갑을 지지할 확률 ? A1 : 갑 지지할 사건 A2 : 을 지지할 사건 M : 남자일 사건 F : 여자일 사건 P(A1)=0.4, P(A2) = 0.6, P(F|A1)=0.3, P(F|A1)=0.40 P(A1|F) = ? P(A1|F)= P(F) P(A1)P(F|A1) = 0.4*0.3+0.6*0.4 0.4*0.3 3 1 3 Probability
독립(Independent) 사건 사건 : A와 B 사건 A가 일어나든 일어나지 않든 간에 사건 B의 확률에 영향을 주지 않을 때 사건 A와 사건 B는 독립이라고 한다. and 3 Probability
상호 배타적 vs. 독립 두 사건 : A와 B 1. 상호 배타적 : 2. 독립 : P(A|B) = P(A) and P(B|A) = P(B) 3 Probability
두 사건 A, B : 상호배타적 두 사건 A, B : 독립 3 Probability
; 두 개 짝, 세개 짝, ……, n개 짝의 곱사건의 확률이 각 사건의 확률의 곱과 같이 나와야 한다. 일반화 n개 사건인 경우 : 서로 독립이 되기 위한 조건 사건 ; 두 개 짝, 세개 짝, ……, n개 짝의 곱사건의 확률이 각 사건의 확률의 곱과 같이 나와야 한다. 3 Probability
세 사건 A, B, C 가 독립이 되기 위한 조건 3 Probability
인 예 : B A 0.24 0.06 0.18 0.24 0.06 0.14 0.06 C 3 Probability
인 예 3 Probability
독립성을 이용한 계산의 예 1 어떤 회사의 한 부서(3명)가 단체 생명 보험을 들었다. 세 명의 부서원이 2050년까지 살아 남을 확률은 각각 0.7, 0.9, 0.3이다. 이 사망 확률은 서로 독립적이라고 할 때, 2050년 이전에 정확히 한 사람이 사망할 사건(E )의 확률은 ? 를 가 생존할 사건이라고 하자. 1 사람만이 사망하거나, 2 사람만이 사망하거나, 3사람만이 사망하는 사건이다. 그리고 이 세 사건은 상호 배타적이다 3 Probability
3 Probability
독립성을 이용한 계산의 예 2 한국 프로 야구 연타수 안타 기록은 87년 5월 10일 한국 프로 야구 연타수 안타 기록은 87년 5월 10일 과 5월 14일 사이에 삼성 유중일 선수가 세운 11 연속 안타이다. 한국 프로야구 최고의 타율은 1982년 백인천 선수의 0.412이다. 1982년 어느 특정한 날에서 시작해서 백인천 선수가 같은 기록을 세울 수 있었던 확률은? 3 Probability
각 타석에서 안타를 칠 확률이 동일하고, 서로 독립이라고 가정하고 i번째 타석에서 안타를 칠 확률을 Hi라고 하면 3 Probability
독립성을 이용한 계산의 예 3 k명의 사람이 모였을 경우 최소한 두 명의 생일이 같을 확률은 얼마인가? 윤년을 제외하면 k명에게 생일을 배정하는 방법은 365k가지이다. => 1에서 생일이 모두 다를 확률을 빼면 됨 k 15 22 23 40 50 70 P(A) 0.253 0.476 0.507 0.891 0.970 0.999 3 Probability
만약 사건 A, B, . . . . , Z가 서로 독립사건 독립사건의 점검 이면 A, B는 독립 3 Probability
Conditional probability 전확률 (혹은 주변확률) Total probability 결합확률 Joint probability 조건부 확률 Conditional probability 전확률 (혹은 주변확률) Total probability (Marginal probability) 3 Probability
라면사리를 추가하고, 80%가 만두사리를 추가하며, 65%가 라면사리와 만두사리를 모두 추가한다는 사실을 알았다. (각자 풀어 볼 것) 즉석 떡볶이를 파는 어떤 가게에서 손님의 75%가 라면사리를 추가하고, 80%가 만두사리를 추가하며, 65%가 라면사리와 만두사리를 모두 추가한다는 사실을 알았다. 어떤 손님이 떡볶이를 주문하면서 라면사리나 만두사리 중 적어도 하나를 추가할 확률은 ? 답 : 0.90 3 Probability
한 자문회사가 두 사립대학(A, B)의 장기발전 계획안을 수립하는 용역을 얻기 위해 공개입찰에 응하였다고 하자. (각자 풀어 볼 것) 한 자문회사가 두 사립대학(A, B)의 장기발전 계획안을 수립하는 용역을 얻기 위해 공개입찰에 응하였다고 하자. 이 자문회사는 A 대학으로부터 용역을 얻어 낼 확률이 0.45, A대학으로부터 용역을 얻어 냈을 때 B 대학의 용역을 얻어 낼 확률이 0.90이라고 분석하고 있다. 이 자문회사가 두 대학으로부터 용역을 모두 얻어 낼 확률은 ? 답 : 0.405 3 Probability
한 자동차 회사는 엔진생산에 필요한 부품의 20%는 A하청회사, 50%는 B하청회사, 30%는 C하청회사로부터 (각자 풀어 볼 것) 한 자동차 회사는 엔진생산에 필요한 부품의 20%는 A하청회사, 50%는 B하청회사, 30%는 C하청회사로부터 구입하며, 세 하청회사로부터 구입한 부품 중 불량품의 비율이 각각 0.001, 0.0003, 0.0007이다. 만약 불량품이 발견되었다면 이 불량품을 생산했을 확률이 가장 높은 회사는 ? A 하청회사의 확률 = 0.357 B 하청회사의 확률 =0.268 C 하청회사의 확률 = 0.375 따라서 C하청회사 3 Probability
A 은행 대출 담당부서의 자료에 의하면 대출자들 중 5%는 대출금을 갚지 않으며, 대출금을 갚지 않은 (각자 풀어 볼 것) A 은행 대출 담당부서의 자료에 의하면 대출자들 중 5%는 대출금을 갚지 않으며, 대출금을 갚지 않은 사람 중 92%는 개인신용평가기관에서 신용불량자로 분류된 사람들이다. 한편 대출금을 갚은 대출자들 중 2%는 개인신용 평가기관 에서 신용불량자로 분류된 사람들이다. 이때 개인신용 평가기관에서 신용불량자로 분류된 사람이 실제로 대출금을 갚지 않을 확률은 ? 답 : 0.707692 3 Probability
왼손잡이 (L) 오른손잡이 (R) 남자(M) 0.06 0.44 0.50 여자(F) 0.04 0.46 0.10 0.90 전확률 : P(M)=0.5, P(F)=0.5, P(L)=0.1, P(R)=0.9 결합확률 : P(M L)=0.06, P(M R)=0.44 등 조건부확률 : P(L|M)=0.06/0.50=0.12 등 3 Probability
경제학부 경영학부 문,사회 이공학부 비중 50% 20% 10% 여학생비중 40% 60% 임의로 선택한 학생이 여학생일 때 그 학생이 이공학부생일 확률은 ? 3 Probability