결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값.

Slides:



Advertisements
Similar presentations
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
Advertisements

제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
Add Your Text 5. 지수함수와 로그함수 1. 지수함수 2. 로그함수 · 지수함수와 그 그래프 · 지수방정식과 지수부등식 · 로그 함수와 그 그래프 · 로그방정식과 로그부등식.
[ 예제 ] 시장수익률의 확률분포 확률변수의 분포. 목적 내년 시장수익률의 확률분포에 대한 평균, 분산, 표준편차 계산.
Chapter 2 1계 미분방정식.
확률변수의 기대값, 분산 등.
패턴인식 개론 Ch.4 기초 통계와 확률 이론 Translated from “CSCE 666 Pattern Analysis | Ricardo Gutierrez-Osuna | “
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
표본분포 Sampling Distribution
4.3.3 초기하분포 (Hypergeometric distribution)
제8장 일반함수모형의 비교정태분석.
제 12 장 직교배열표에 의한 실험계획(1).
수치해석 6장 예제문제 환경공학과 천대길.
제12주 회귀분석 Regression Analysis
제 6 장. 수치미분과 수치적분.
수학 I 2. 방정식과 부등식.
패턴인식 개론 Ch.5 확률 변수와 확률 분포.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
선형대수학 부정적분과 정적분 적분의 응용 Prof. Jae Young Choi
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
연 속 확 률 분 포 5 균등분포 지수분포 감마분포 웨이블분포 베타분포 정규분포 정규분포에 관련된 연속분포들
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
확률통계론 2장 : 확률변수.
상관함수 correlation function
A Moments of Areas.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
일차방정식의 풀이 일차방정식의 풀이 순서 ① 괄호가 있으면 괄호를 먼저 푼다.
제4장 제어 시스템의 성능.
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
확 률 변 수 2 1 이산확률변수 2 연속확률변수 3 기대값.
Keller: Stats for Mgmt & Econ, 7th Ed
1.4 중첩된 한정기호 (Nested Quantifiers) 이산수학 (Discrete Mathematics)
Week 10:확률변수(Random Variable)
수학 I Week 7. Differentiation
(independent variable)
이번 학기 공부할 내용 확률 확률변수 결합확률분포 이산확률분포 연속확률분포 기술통계학 표본분포 추정 가설검정 이재원
수학8가 대한 92~95 쪽 Ⅳ. 연립방정식 1. 연립방정식과 그 풀이 및 활용 >끝내기전에(9/9) 끝내기 전에.
Week 5:확률(Probability)
Metal Forming CAE Lab., Gyeongsang National University
연 속 확 률 분 포 5 1 균등분포 2 지수분포 3 감마분포 4 정규분포.
Probability.
합집합과 교집합이란 무엇인가? 01 합집합 두 집합 A, B에 대하여 A에 속하거나 B에 속하는 모든 원소로 이루어진 집합을 A와 B의 합집합이라고 하며, 기호 A∪B로 나타낸다. A∪B ={x | x∈A 또는 x∈B}
다면체 다면체 다면체: 다각형인 면만으로 둘러싸인 입체도 형 면: 다면체를 둘러싸고 있는 다각형
1. 2진 시스템.
2. Boole 대수와 논리 게이트.
논문작성을 위한 연구모형 설정 양동훈.
Distribution(모의 실험에 자주 쓰이는 분포들)
수학10-나 1학년 2학기 Ⅳ.삼각함수 3. 삼각함수의 그래프(7/12) 삼각함수 수업계획 수업활동.
01 로그의 정의 ⑴ 일 때, 양수 에 대하여 을 만족시키는 실수 는 오직 하나 존재한다. 이때 를
감마분포 gamma distribution
선 그리기.
Sampling Distributions
표지  수학 8-나  2학년 2학기 Ⅰ.확률 (1)경우의 수(2~5/15) 경우의 수.
Chapter 3: 확률변수와 분포함수 Pilsung Kang
원의 방정식 원의 방정식 x축, y축에 접하는 원의 방정식 두 원의 위치 관계 공통접선 원과 직선의 위치 관계
1. 접선의 방정식 2010년 설악산.
3. 반/전 가산기, 반/전 감산기 제작 컴퓨터 구조 실습 안내서.
Ⅵ. 확 률 1. 확 률 2. 확률의 계산.
결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값.
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
Basic Function 김윤성 박로빈 이지호 천영재
상관계수.
이산수학(Discrete Mathematics)  술어와 한정기호 (Predicates and Quantifiers)
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
I. 수와 식 1. 유리수와 순환소수.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
수학10-나 1학년 2학기 Ⅱ.부등식의 영역 3. 부등식의 영역에서 최대, 최소(5/5) 부등식 영역 수업계획 수업활동.
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
퍼지 이론 (Lecture Note #12) 인공지능 이복주 단국대학교 컴퓨터공학과
Presentation transcript:

결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값

1 결합확률분포 결합확률분포, 주변확률분포 및 결합확률분포함수의 개념과 2변량 확률 계산 방법을 알아본다.

A와 B 두 회사에 대한 투자액(단위; 백만 원) X와 Y의 비율 1 2 3 4 0.02 0.04 0.08 0.15 0.05 0.06 0.10 0.01 0.00 A와 B 두 회사에 각각 1백만 원씩 투자할 비율 : 0.02 A 회사에 3백만 원 그리고 B 회사에 2백만 원을 투자할 비율 : 0.06 회사에 동시에 4백만 원씩 투자할 비율 : 0.00 투자자들이 회사 A와 회사 B에 투자한 투자액에 대한 확률 : P(X=1, Y=1) = 0.02, P(X=3, Y=2) = 0.06, P(X=4, Y=4) = 0.00

▶ ▶ 결합확률분포(joint probability distribution) : 두 개 이상의 확률변수에 의하여 결합된 확률분포 ▶ 결합확률질량함수(joint p.m.f.) : 이산확률변수 X와 Y에 대하여, 상태공간 안의 (x, y)에서 확률 P(X=x, Y=y)에 대응 하고, 상태공간 밖의 (x, y)에서 0으로 대응하는 함수 SX = { x1, x2, … , xn } , SY = {y1, y2, …, ym } 에 대하여 P(X=x, Y=y) , x ∈ SX , y ∈ SY 0 , 다른 곳에서 f(x, y) =

S = { (x, y) : x = x1, x2, … , xn , y = y1, y2, … , ym } ☞ 결합확률질량함수의 성질 X와 Y의 결합상태공간 S = { (x, y) : x = x1, x2, … , xn , y = y1, y2, … , ym } 에 대하여 모든 x, y에 대하여 0 ≤ f(x, y) ≤ 1이다. S f(x, y) = 1 P(a< X≤ b, c< Y ≤ d ) = S S f(x, y) a<x≤ b c< y ≤ d

S HHH HHT HTH THH HTT THT TTH TTT X 3 2 1 Y 동전 3번 던지는 게임 X와 Y의 결합질량함수 f(x, y) 앞면의 수 : X , 뒷면의 수 : Y 확률 P(X ≥ 1 , Y ≥ 2) 동전 3번 던지는 게임 X : 관찰된 H의 수 Y : 관찰된 T의 수 S HHH HHT HTH THH HTT THT TTH TTT X 3 2 1 Y X와 Y 의 상태공간 : SX = { 0, 1, 2, 3 }, SY = { 0, 1, 2, 3 }

X와 Y 의 결합확률표 : X Y 1 2 3 1/8 3/8 결합확률질량함수 : 1/8 , (x, y) = (0,3), (3,0) 3/8 , (x, y) = (1,2), (2,1) 0 , 다른 곳에서 f(x, y) = 구하고자 하는 확률 : P(X ≥ 1 , Y ≥ 2) = f(1,2) + f(2,2) + f(3,2) + f(1,3) + f(2,3) + f(3 3) = + 0 + 0 + 0 + 0 + 0 = 3 8 3 8

결합상태공간의 분할 예제 1에서 Y=0 (0,0) (1,0) (2,0) (3,0) Y=1 (0,1) (1,1) (2,1) (3,1) Y=2 (0,2) (1,2) (2,2) (3,2) Y=3 (0,3) (1,3) (2,3) (3,3) S X=0 (0,0) (0,1) (0,2) (0,3) (3,3) (3,2) (3,1) (3,0) (2,3) (2,2) (2,1) (2,0) (1,3) (1,2) (1,1) (1,0) (0,3) (0,2) (0,1) (0,0) (3,3) (3,2) (3,1) (3,0) (2,3) (2,2) (2,1) (2,0) (1,3) (1,2) (1,1) (1,0) (0,3) (0,2) (0,1) (0,0) (0,0) (0,1) (0,2) (0,3) X=1 (1,0) (1,1) (1,2) (1,3) (1,0) (1,1) (1,2) (1,3) X=2 (2,0) (2,1) (2,2) (2,3) (2,0) (2,1) (2,2) (2,3) X=3 (3,0) (3,1) (3,2) (3,3) (3,0) (3,1) (3,2) (3,3)

동전을 세 번 던져서 나온 앞면의 수에 대한 확률분포 X 1 2 3 fX(x) 1/8 3/8 Y 1 2 3 합 X=0 1/8 사건 [X=0]일 확률 Y 1 2 3 합 X=1 3/8 사건 [X=1]일 확률 Y 1 2 3 합 X=2 3/8 사건 [X=2]일 확률 Y 1 2 3 합 X=3 1/8 사건 [X=3]일 확률

▶ 주변확률질량함수(marginal p.m.f.) : 이산확률변수 X, Y와 결합확률질량함수 f(x, y)에 대하여 X의 주변확률질량함수 : fX(x) = P(X=x) = S f(x, y), x=x1,…,xn Y의 주변확률질량함수 : fY(y) = P(Y=y) = S f(x, y), y=y1,…,ym x y 뒷면의 수 Y 1/8 3 3/8 2 1 합 1/8 3/8 X의 주변확률질량함수 앞면의 수 X 합 1/8 3/8 Y의 주변확률질량함수

X, Y의 결합확률표 (1) X와 Y의 주변확률질량함수 (2) P(X≤ 2) = ? X Y 1 2 3 0.02 0.04 0.08 0.15 0.05 0.06 0.10 0.01 0.00 (1) X, Y의 결합확률질량함수의 그림

X의 주변확률 : P(X=1) = f(1,1) + f(1,2) + f(1,3) + f(1,4) = 0.02 + 0.04 + 0.08 + 0.15 = 0.29 P(X=2) = f(2,1) + f(2,2) + f(2,3) + f(2,4) = 0.04 + 0.05 + 0.06 + 0.10 = 0.25 P(X=3) = f(3,1) + f(3,2) + f(3,3) + f(3,4) = 0.08 + 0.06 + 0.05 + 0.01 = 0.20 P(X=4) = f(4,1) + f(4,2) + f(4,3) + f(4,4) = 0.15 + 0.10 + 0.01 + 0.00 = 0.26 Y의 주변확률 : P(Y=1) = f(1,1) + f(2,1) + f(3,1) + f(4,1) = 0.02 + 0.04 + 0.08 + 0.15 = 0.29 P(Y=2) = f(1,2) + f(2,2) + f(3,2) + f(4,2) = 0.04 + 0.05 + 0.06 + 0.10 = 0.25 P(Y=3) = f(1,3) + f(2,3) + f(3,3) + f(4,3) = 0.08 + 0.06 + 0.05 + 0.01 = 0.20 P(Y=4) = f(1,4) + f(2,4) + f(3,4) + f(4,4) = 0.15 + 0.10 + 0.01 + 0.00 = 0.26

X의 주변확률질량함수 : Y의 주변확률질량함수 : 0.29 , x=1 0.25 , x=2 0.20 , x=3 0.26 , x=4 fX(x) = P(X=x) = 0.29 , y=1 0.25 , y=2 0.20 , y=3 0.26 , y=4 fY(y) = P(Y=y) = (2) 구하고자 하는 확률 : P(X≤ 2) = f(1,1) + f(1,2) + f(1,3) + f( 1,4) + f(2,1) + f(2,2) + f(2,3) + f( 2,4) = 0.02 + 0.04 + 0.08 + 0.15 + 0.04 + 0.05 + 0.06 + 0.10 = 0.54 또는 P(X≤ 2) = fX(1) + fX(2) = 0.29 + 0.25 = 0.54

▶  결합확률밀도함수(joint p.d.f.) : 연속확률변수 X와 Y에 대하여, 다음 조건을 만족하는 함수 f(x, y) f(x, y) ≥ 0 for all x, y  -∞ ∞ f(x, y) dxdy = 1 결합밀도함수의 개형

영역 A와 결합밀도함수 f(x, y)로 둘러싸인 입체의 부피 ☞ 연속형 결합확률 구하는 방법 A={ (x, y)|a ≤ X ≤ b , c ≤ Y ≤ d }에 대하여 확률 P[(X, Y) ∈ A]의 기하학적 의미  a b c d P[(X,Y) ∈ A] = f(x, y) dydx = f(x, y) dydx A 영역 A와 결합밀도함수 f(x, y)로 둘러싸인 입체의 부피

▶  주변확률밀도함수(margina p.d.f.) : 연속확률변수 X, Y와 결합밀도질량함수 f(x, y)에 대하여 X의 주변확률밀도함수 : fX(x) = f(x, y) dy Y의 주변확률밀도함수 : fY(y) = f(x, y) dx  -∞ ∞

[ ] [ ]   결합확률밀도함수 : x + y , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 0 , 다른 곳에서 (2) P(0≤ X ≤ ½, ½ ≤ Y ≤ 1) , P(0≤ X ≤ ½) , P(½ ≤ Y ≤ 1) , x + y , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 0 , 다른 곳에서 f(x, y) = (1) X의 주변확률밀도함수 : fX(x) = f(x, y) dy = (x + y) dy  -∞ ∞ 1 = xy + y2 = x + , 0 ≤ x ≤ 1 1 2 y=0 [ ] Y의 주변확률밀도함수 : fY(y) = f(x, y) dx = (x + y) dx  1 -∞ ∞ = x2 + xy = y + , 0 ≤ y ≤ 1 1 2 x=0 [ ]

[ ] ( ) ( ) [ ] ( ) [ ]    (2) 구하고자 하는 확률 : P(0 ≤ X ≤ 1/2, 1/2 ≤ Y ≤ 1) = (x + y) dydx  1/2 1 = xy + y2 dx = dx = 2 y=1/2 [ ] x 3 8 + ( ) 4 1/2 P(0 ≤ X ≤ 1/2) = x + dx = x2 + x =  1/2 1 2 ( ) [ ] 3 8 1 ( ) 1 2 [ ] 1 2 1 2 1  5 8 P(1/2 ≤ Y ≤ 1) = y + dy = y2 + y = 1/2 1/2

▶ S  결합분포함수(joint d.f.) : 임의의 실수 x, y에 대하여 F(x, y) = P(X ≤ x, Y ≤ y ) X의 주변분포함수 : FX(x) = P(X ≤ x ) Y의 주변분포함수 : FY(y) = P(Y ≤ y ) FX(x) = S t≤x fX(t)  -∞ x fX(t)dt 모든 y f(t, y) ∞ f(t, y)dydt = , X : 연속확률변수인 경우 , X : 이산확률변수인 경우

☞ 결합분포함수의 성질 (1) FX(x) = lim F(x, y) , FY(y) = lim F(x, y) (2) A={ (x, y)|a < X ≤ b , c < Y ≤ d }에 대하여 확률 P[(X, Y) ∈ A] P(a < X ≤ b , c < Y ≤ d ) = F(b,d) – F(a,d) - F(b,c) + F(a,c) 연속확률변수 X와 Y에 대하여 ∂ 2 ∂x∂y F(x, y) f(x, y) = (3) fX(x) = d dx FX(x) , fY(y) = dy FY(y) (4)

(1) X와 Y 의 결합확률밀도함수 : f(x, y) = ? 결합분포함수 : F(x, y) = (1-e-x ) (1- e-y ) , 0 < x < ∞ , 0 < y < ∞ (1) X와 Y 의 결합확률밀도함수 : f(x, y) = ? (2) X와 Y 의 주변확률밀도함수 : fX(x) = ? , fY(y) = ? (3) P(1 < X ≤ 2 , 1 < Y ≤ 2) = ? (1) X와 Y 의 결합확률밀도함수 : ∂2 ∂x∂y f(x, y) = F(x, y) ∂2 ∂x∂y = (1 – e-x ) (1 – e-2y ) = (e-x) (2e-2y) = 2e-(x+2y) , 0 < x < ∞ , 0 < y < ∞ X와 Y 의 주변분포함수 : FX(x) = lim F(x, y) = lim (1 – e-x ) (1 – e-2y ) = 1 – e-x , 0 < x < ∞ FY(y) = lim F(x, y) = lim (1 – e-x ) (1 – e-2y ) = 1 – e-2y , 0 < y < ∞ y→∞ x→∞

(2) X와 Y의 주변확률밀도함수 : fX(x) = FX(x) = (1 – e-x) = e-x , 0 < x < ∞ d dx d dy d dy fY(y) = FY(y) = (1 – e-2y) = 2e-2y , 0 < y < ∞ (3) P(1 < X ≤ 2, 1 < Y ≤ 2) = F(2, 2) – F(1, 2) – F(2, 1) + F(1, 1) = (1 - e-2) (1 - e-4) - (1 - e-1) (1 - e-4) - (1 - e-2)2 - (1 - e-1) (1 - e-2) = 0.0272

결합확률질량함수 : 결합분포함수 : F(x, y) 0.10 0.15 0.04 2 0.30 0.05 1 0.01 3 Y X F(x, y) = P(X ≤ x, Y ≤ y ) 이므로 Y X 1 2 3 0.01 0.06 0.10 0.11 0.21 0.30 0.61 0.15 0.40 0.59 1.00

2 조건부 확률분포 조건부 확률분포, 확률변수의 독립성과 종속성 및 항등분포에 대하여 알아본다.

A = { X=x }, B = { Y=y } A∩B = { X = x, Y = y } 조건부 확률 Review P(A|B) = P(A∩B) P(B) , P(B) > 0 f(x, y) : 이산확률변수 X 와 Y의 결합확률질량함수 f(x, y) = P(X = x, Y = y) fX(x) : 이산확률변수 X 의 주변확률질량함수 fX(x) = P(X = x) fY(y) : 이산확률변수 Y 의 주변확률질량함수 fY(y) = P(Y = y) A = { X=x }, B = { Y=y } A∩B = { X = x, Y = y } P(A) = P(X=x) = fX(x) P(B) = P(Y=y) = fY(y) P(A∩B) = P(X=x, Y=y) = f(x, y) P(A∩B) f(x, y) P(B) fY(y) P(A|B)=P(X=x|Y=y) = =

▶ ▶ 조건부확률질량함수(conditional p.m.f.) : 이산확률변수 f(x, y) X와 Y에 대하여, P(Y = y) > 0일 때 를 Y=y일 때 X의 조건부확률질량함수라 하고, f(x|y)로 나타낸다. P(X=x|Y=y) = f(x, y) fY(y) f(y|x)= f(x, y) fX(x) X=x일 때 Y의 조건부확률질량함수 : ▶ 조건부확률밀도함수(conditional p.d.f.) : 연속확률변수 X와 Y에 대하여, fY(y) > 0일 때 f(x|y) = f(x, y) fY(y)

☞ 조건부 확률분포의 의미 P(X=x, Y=y) P(X=x) P(X=x,Y=y) P(Y=y) y x

S X와 Y의 결합확률질량함수 : (1) Y의 주변확률질량함수 : fY(y) = ? (2) Y=y인 X의 조건부확률질량함수 : f(x|y) = ? (3) Y=2인 X의 조건부확률질량함수 : f(x|y=2) = ? (4) 조건부 확률 : P(X=3|Y=2) = ? 0 , 다른 곳에서 f (x, y) = , x = 1, 2, 3, y = 1, 2, 3 x + y 36 fY(y) = S x=1 3 f(x, y) = x + y 36 = y + 2 12 , y = 1, 2, 3 (1) f(x|y) = f(x, y) fY(y) (x + y) /36 (y + 2) / 12 x + y 3(y + 2) = , x = 1, 2, 3 (2) f(x|y = 2) = x + 2 12 , x = 1, 2, 3 (3) P(X=3|Y=2) = f(3|2) = 3 + 2 12 5 = (4)

☞ S 조건부 확률 구하는 방법 P(Y ∈ B|X = x) = f(y|x) = P(X = x, Y ∈ B) P(X = x) P(X ∈ A|Y = y) = x ∈ A f(x|y) P(X ∈ A, Y = y) P(Y = y)

 P(Y ∈ B|X = x) = = P(X = x, Y ∈ B) fX(x) P(X ∈ A|Y = y) = fY(y) f(y|x)dy  c d f(x|y)dx a b

X, Y의 결합확률 : (1) X와 Y의 주변확률질량함수 (2) Y=2인 X의 조건부 확률질량함수 (3) Y=2인 조건 아래서 X=1 또는 X=3 일 확률 Y X 1 2 3 4 0.12 0.08 0.07 0.05 0.15 0.21 0.13 0.01 0.02 (1) X와 Y의 주변확률질량함수 : fX(x) = 0.32 , x = 1 0.57 , x = 2 0.11 , x = 3 Y X 1 2 3 4 fX(x) 0.12 0.08 0.07 0.05 0.32 0.15 0.21 0.13 0.57 0.01 0.02 0.11 fY(y) 0.24 0.30 0.25 1.00 fY(y) = 0.21 , y = 1 0.24 , y = 2 0.30 , y = 3 0.25 , y = 4

(2) Y=2인 X의 조건부 확률질량함수 : 조건부 확률질량함수의 정의로부터 f(x|y = 2) = f(x, 2) fY(2) 0.24 = , x = 1, 2, 3 f(1|y = 2) = = 0.333 0.08 0.24 X의 조건부 확률질량함수 : f(x|y) = 0.333 , x = 0 0.625 , x = 1 0.042 , x = 2 0 , 다른 곳에서 f(2|y = 2) = = 0.625 0.15 0.24 f(3|y = 2) = = 0.042 0.01 0.24 (3) 구하고자 하는 확률 : P(X = 1 또는 X = 3|Y = 2) = f(1|y = 2) + f(3|y = 2) = 0.333 + 0.042 = 0.375

P(A|B)=P(X = x|Y = y) = f(x|y) 독립 사건 Review P(A) = P(A|B) , P(B) > 0 이산확률변수 X와 Y에 대하여 A = { X = x }, B = { Y = y } P(A) = P(X = x) = fX(x) P(A|B)=P(X = x|Y = y) = f(x|y) f(x|y) = fX(x) ?

▶ ☞ 독립(independent) : 임의의 실수 x와 y에 대하여, 독립 확률변수의 성질 fX(x) > 0, fY(y) > 0일 때 fX(x) = f(x|y) 또는 fY(y) = f(y|x) 이면, 두 확률변수 X와 Y를 독립이라 하고, 독립이 아닌 경우에 종속(dependent)이라 한다. ☞ 독립 확률변수의 성질 확률변수 X와 Y가 독립이면, f(x, y) = fX(x) fY(y)

[ ]  결합확률밀도함수 : f(x, y)=6xy2 , 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 (1) X의 주변확률밀도함수 : fX(x) = ? (2) Y=1/2인 조건 아래서 X의 조건부 확률밀도함수 : f (x|y=1/2) = ? (3) Y=1/2인 조건 아래서 확률 : P(1/2 ≤ X ≤ 1) = ? (4) X와 Y의 독립성 (1) X의 주변확률밀도함수 : (2) Y의 주변확률밀도함수 : fY(y) = f(x, y) dx = 6xy2 dx = (3y2)x2 = 3y2 , 0 ≤ y ≤ 1  -∞ ∞ x=0 1 [ ] fX(x) = f(x, y) dy = 6xy2 dy = (2x)y3 = 2x , 0 ≤ x ≤ 1 y=0

( )  fY(1/2)=3/4이므로 Y=1/2인 조건 아래서 X의 조건부 확률밀도함수 : f(x|y = ½) = = 2x , 0 ≤ x ≤ 1 (3/2)x 3/4 P ≤ X ≤ 1|Y = = 1 2 ( ) P ≤ X ≤ 1 , Y = fY(1/2)  1/2 = 2x dx = x2 = 3 4 (3) (4) 모든 0 ≤ x ≤ 1에 대하여 fX(x) = 2x = f(x|y = 1/2) X와 Y는 독립

[ ] ( ) [ ]   다음 결합분포에 대한 X와 Y의 독립성 (1) f(x, y) = x + y , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 (2) f(x, y) = 2e-(x+2y) , x > 0, y > 0 (3) 1/8, (x, y) = (0, 3), (3, 0) 3/8, (x, y) = (1, 2), (2, 1) 0 , 다른 곳에서 f(x, y) = (1) X와 Y의 주변확률밀도함수 : ∞ 1 2 fX(x) = f(x, y) dy = (x + y) dy = xy + y2 = x + , 0 ≤ x ≤ 1  -∞ y=0 [ ] 모든 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1에 대하여 1 2 f(x, y) = x + y ≠ fX(x) fY(y) = x + y + ( ) • 1 2 fY(y) = f(x, y) dx = (x + y) dx = x2 + xy = y + , 0 ≤ y ≤ 1  -∞ ∞ x=0 [ ] X와 Y는 종속

f(x, y) =2e-(x+2y) = fX(x) fY(y) , x > 0, y > 0 fX(x) = 2e-(x+2y) dy = e-x e-2y = e-x , x > 0  ∞ y=0 [ ] fY(y) = 2e-(x+2y) dx = 2e-2y e-x = 2e-2y , y > 0 x=0 X와 Y는 독립 (3) X와 Y의 주변확률질량함수 : 1/8, x = 0, 3 3/8, x = 1, 2 0 , 다른 곳에서 fX(x) = 1/8, y = 0, 3 3/8, y = 1, 2 fY(y) = f(1, 1) = 0 ≠ fX(x) fY(y) = 1 8 64 • = X와 Y는 종속

▶ 쌍마다 독립(pairwisely independent) : 임의의 실수 x, y,z에 대하여, fX(x) > 0, fY(y) > 0, fZ(z)일 때 f(x, y) = fX(x) fY(y), f(y, z) = fY(y) fZ(z) , f(x, z) = fX(x) fZ(z) 이면, 확률변수 X, Y와 Z를 쌍마다 독립이라 하고, f(x, y, z) = fX(x) fY(y) fZ(z) 이면 독립이라 한다.

f(x, y, z) = fX(x) fY(y) fZ(z) f(x, y, z) = 6e-(x+2y+3z) , x > 0, y > 0, z >0에 대하여, 확률변수 X, Y, Z의 독립성 조사 예 (X, Y), (Y, Z), (X, Z)의 j.p.d.f. : X, Y, Z의 m.p.d.f. : fX(x) = e-x , x > 0 fY(y) = 2e-2y , y > 0 fZ(z) = 3e-3z , z > 0 f(x, y) = 2e-(x+2y) , x > 0, y > 0 f(y, z) = 6e-(2y+3z) , y > 0, z > 0 f(x, z) = 3e-(x+3z) , x > 0, z > 0 f(x, y, z) = fX(x) fY(y) fZ(z) X, Y와 Z : 독립 f(x, y) = fX(x) fY(y), f(y, z) = fY(y) fZ(z) , f(x, z) = fX(x) fZ(z) X, Y와 Z : 쌍마다 독립

( ) ( )    정리 1 임의의 두 확률변수 X와 Y에 대하여 다음은 동치이다. (1) X, Y : 독립 (2) 모든 x, y에 대하여 F(x, y) = FX(x) FY(y) (3) P(a < X ≤ b, c < Y ≤ d ) = P(a < X ≤ b ) P(c < Y ≤ d ) 증명 X와 Y가 연속확률변수인 경우 (1) (2)  -∞ y x  -∞ y x F(x, y) = f(u, v)dvdu = fX(u)fY(v)dvdu = fX(u) fY(v)dv du = fX(u) FY(y)du  -∞ x y ( ) = FY(y) fX(u)du = FX(x)FY(y) (2) (1) ∂2 ∂x ∂y f(x, y) = F(x, y) = FX(x)FY(y) = FX(x) FY(y) = FX(x)fY(y) ∂ ∂x ∂y ( ) = fY(y) FX(x) = fX(x)fY(y)

(1) X, Y : 독립 식 (3)이 성립 P(a < X ≤ b, c < Y ≤ d ) = F(b, d) – F(a, d) – F(b, c) + F(a, c) 이고, X, Y가 독립이면, F(x, y) = FX(x) FY(y)이므로 P(a < X ≤ b, c < Y ≤ d ) = FX(b)FY(d) – FX(a)FY(d) – FX(b)FY(c) + FX(a)FY(c) = (FX(b) - FX(a)) (FY(d) - FY(c)) = P(a < X ≤ b ) P(c < Y ≤ d ) 식 (3)이 성립 X, Y : 독립 a, b, c, d가 임의의 수이므로 a = -∞ , c = -∞ , b = x, d = y라 하면, F(x, y) = P(a < X ≤ b, c < Y ≤ d ) = P(a < X ≤ b ) P(c < Y ≤ d ) = FX(x) FY(y) 이고, 따라서 X와 Y는 독립이다.

S ( ) S ( ) 두 도시의 교통사고 건수 X와 Y의 결합확률함수 : (1) X와 Y의 주변확률함수 : (3) 두 도시의 교통사고 건수가 각각 1을 초과하지 못할 확률 : 2x3y e-5 (x!)(y!) , x = 0, 1, 2, …, y = 0, 1, 2, … f(x, y) = (1) X와 Y의 주변확률질량함수 : ( ) S y=0 ∞ fX(x) = f(x, y) = 2x3y (x!) (y!) e-5 = 2x x! e-5 3y y! = e-5 (e3) = e-2, x = 0, 1, 2, … ( ) S x=0 ∞ fY(y) = f(x, y) = 2x3y (x!) (y!) e-5 = 3y y! e-5 2x x! = e-5 (e2) = e-3, y = 0, 1, 2, …

(3) X와 Y가 독립이므로 P(X≤ 1, Y≤ 1)= P(X≤ 1) P(Y≤ 1)이고, 2x3y e-5 2x e-2 x! 3y e-3 y! • f (x, y) = = fX(x, y) fY(x, y) = (x!)(y!) X, Y : 독립 (3) X와 Y가 독립이므로 P(X≤ 1, Y≤ 1)= P(X≤ 1) P(Y≤ 1)이고, 20 0! 21 1! P(X ≤ 1) = e-2 + e-2 = 0.4060 P(X≤ 1, Y≤ 1) =(0.406)•(0.1991) = 0.08080 30 0! 31 1! P(Y ≤ 1) = e-3 + e-3 = 0.1991

fX(x) = fY(x) = fZ(x) = e-x ▶ 항등분포(identical distribution) : 임의의 실수 x에 대하여 fX(x) = fY(x) 일 때, 확률변수 X와 Y는 항등분포를 이룬다 하고, 항등적으로 독립인 분포를 이루는 확률변수를 간단히 i.i.d(independently, identically distributed)로 나타낸다. 예 f(x, y, z) = e-(x+y+z) , x > 0, y > 0, z >0에 대하여, 확률변수 X, Y, Z의 항등적인 독립성 조사 fX(x) = e-x , x > 0 fY(y) = e-y , y > 0 fZ(z) = e-z , z > 0 fX(x) = fY(x) = fZ(x) = e-x X, Y, Z : i.i.d

 X와 Y의 결합분포함수 : F(x, y) = (1-e-2x)(1-e-3y) , x >0 , y >0 X와 Y는 i.i.d. ? X와 Y의 결합밀도함수와 주변밀도함수 : f(x, y) = F(x, y) = 6e-(2x+3y) , 0 < x < ∞, 0 < y < ∞ ∂2 ∂x ∂y fX(x) = 6e-(2x+3y) dy = 2e-2x , 0 < x < ∞  ∞ fY(y) = 6e-(2x+3y) dx = 3e-3y , 0 < y < ∞ 모든 x >0 , y >0에 대하여 f(x, y) = fX(x) fY(y) X, Y : 독립 X, Y : i.i.d. 가 아니다. 모든 x >0 에 대하여 fX(x) = 2e-2x≠ fY (x) = 3e-3x X, Y : 항등분포가 아니다.

X와 Y의 결합확률함수 : X와 Y : i.i.d. ? 1/8, (x, y) = (0, 3), (3, 0) 3/8, (x, y) = (1, 2), (2, 1) 0 , 다른 곳에서 f(x, y) = X와 Y의 주변확률질량함수 : 1/8, x = 0, 3 3/8, x = 1, 2 0 , 다른 곳에서 1/8, y = 0, 3 3/8, y = 1, 2 0 , 다른 곳에서 fY(y) = fX(x) = 예제 4에서 X, Y : 종속 X, Y : i.i.d.가 아니다. 모든 x =0, 1, 2, 3 에 대하여 fX(x) = fY (x) X, Y : 항등분포

3 결합분포에 대한 기대값 결합분포의 기대값과 공분산, 상관관계 등에 대하여 알아본다.

☞ S S   2변량 확률변수의 함수 u(X, Y)의 기대값 확률변수의 함수에 대한 기대값 Review 확률변수의 함수 Y = g(X)의 기대값 : E(Y) = E[g(X)] = S x g(x) f(x)  -∞ ∞ g(x) f(x)dx ☞ 2변량 확률변수의 함수 u(X, Y)의 기대값 f(x, y) : X와 Y의 결합확률함수 u(x, y) : X와 Y의 함수 S 모든 y u(x, y) f(x, y)  -∞ ∞ u(x, y) f(x, y)dydx E[u(X, Y)] = 모든 x , (X, Y) : 이산확률변수인 경우 , (X, Y) : 연속확률변수인 경우

E[au(X, Y ) + bv(X, Y )] = aE[u(X, Y )] + bE[v(X, Y)] ☞ 2변량 기대값의 성질 E[au(X, Y ) + bv(X, Y )] = aE[u(X, Y )] + bE[v(X, Y)] S 모든 x S 모든 y mX = E(X) = x f(x, y) X의 기대값 : S 모든 x [ ] S 모든 y S 모든 x = x f(x, y) = x fX(x)  -∞ ∞ mX = x f(x, y)dydx = x fX(x)dx S 모든 y 모든 x = (x - mX)2 f(x, y) = (x - mX)2 fX(x) [ ] sX = E[(X - mX)2] = (x - mX)2 f(x, y) 2  -∞ ∞ sX = (x - mX)2 f(x, y)dydx = (x - mX)2 fX(x)dx X의 분산 :

S S 결합확률질량함수 : (1) E(X) = ? (2) E(Y) = ? (3) E(X + Y) = ? 0.09 0.07 0.05 0.04 2 0.10 1 0.15 0.11 0.08 3 Y X mX = E(X) = x f(x, y) S x=0 2 y=0 3 = 0•(0.08) + 0•(0.10) + 0•(0.11) + 0•(0.15) + 1•(0.05) + 1•(0.07) + 1•(0.09) + 1•(0.10) + 2•(0.04) + 2•(0.05) + 2•(0.07) + 2•(0.09) = 0.81 mY = E(Y) = y f(x, y) S x=0 2 y=0 3 = 0•(0.08) + 0•(0.05) + 0•(0.04) + 1•(0.10) + 1•(0.07) + 1•(0.05) + 2•(0.11) + 2•(0.09) + 2•(0.07) + 3•(0.15) + 3•(0.10) + 3•(0.09) = 1.78

E(X + Y) = (x + y) f(x, y) S x=0 2 y=0 3 = 0•(0.08) + 1•(0.10) + 2•(0.11) + 3•(0.15) + 1•(0.05) + 2•(0.07) + 3•(0.09) + 4•(0.10) + 2•(0.04) + 3•(0.05) + 4•(0.07) + 5•(0.09) = 2.59 E(X Y) = xy f(x, y) S x=0 2 y=0 3 = 0•(0.08) + 0•(0.10) + 0•(0.11) + 0•(0.15) + 0•(0.05) + 1•(0.07) + 2•(0.09) + 3•(0.10) + 0•(0.04) + 2•(0.05) + 4•(0.07) + 6•(0.09) = 1.47

[ ] ( ) S  정리 2 임의의 두 확률변수 X와 Y가 독립이면. 다음이 성립한다. E(X Y ) = E(X ) E(Y ) X와 Y가 이산확률변수인 경우 : 증명 S 모든 y E(X Y) = xy f(x, y) = xy fX(x)fY(y) 모든 x = x fX(x) y fY(y) = E(X)E(Y) [ ] X와 Y가 연속확률변수인 경우 : E(X Y) = xy f(x, y)dydx = xy fX(x)fY(y)dydx = xfX(x)dx yfY(y)dy = E(X)E(Y) ( )  -∞ ∞ 정리 2의 역은 성립하지 않는다. 주 의

( )  결합확률밀도함수 : f(x, y) = 6xy2 , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 E(X), E(Y ), E(X Y ) = ? E(X Y ) = E(X)E(Y ) = ? X, Y 의 주변확률밀도함수 : fX(x) = 2x , 0 ≤ x ≤ 1 , fY(y) = 3y2 , 0 ≤ y ≤ 1 mX = xfX(x)dx = 2x2dx = x3 = 2 3 1 mY = yfY(y)dy = 3y3dy = y4 = 4 E(X Y) = xyf(x, y)dydx = 6x2y3dydx = 6x2 y4 dx = x2 dx = x3 = ( )  E(X Y ) = E(X)E(Y)가 성립한다.

   결합밀도함수 : E(X), E(Y ), E(X Y ) = ? X, Y의 독립성 ? f(x, y) = 4 f(x, y) = , -1 ≤ x ≤ 1, -1 ≤ y ≤ 1 X, Y 의 주변확률밀도함수 :  -1 1 1 + xy(x2 – y2) 4 1 2 fX(x) = dy = , -1 ≤ x ≤ 1  -1 1 1 + xy(x2 – y2) 4 1 2 fY(y) = dx = , -1 ≤ y ≤ 1 mY = dy = 0 y 2 mX = dx = 0 ; E(XY) = dydx = 0 1 + xy(x2 – y2) 4  -1 1 E(XY ) = E(X) E(Y ) f(x, y) = ≠ fX(x) fX(x) = 1 4 1 + xy(x2 – y2) X, Y는 독립이 아니다.

Cov(X, Y) = E[(X – mX ) (Y – mY )] ▶ 공분산(covariance) : mX=E(X), mY=E(Y)에 대하여 E[(X – mX ) (Y – mY )] 을 공분산이라 하고, Cov(X, Y)로 나타낸다. Cov(X, Y) = E[(X – mX ) (Y – mY )] (x – mX ) (y – mY ) f(x, y) , (X, Y) : 이산형인 경우 (x – mX ) (y – mY ) f(x, y)dxdy , (X, Y) : 연속형인 경우 = S 모든 x 모든 y  -∞ ∞ ☞ 공분산의 간편 계산 방법 Cov(X, Y) = E[(X – mX) (Y - mY)] = E(X Y - mXY - mYX + mX mY) = E(X Y) - mXE(Y) - mYE(X) + mY mY = E(X Y) - mY mY

☞ 공분산의 성질 (1) Cov(X, Y ) = E(X Y ) - mX mY (2) X, Y가 독립이면, Cov(X, Y ) = 0 (역은 성립하지 않는다) (3) Cov(X, X ) = Var(X) (4) Cov(aX + b, cY + d ) = ac Cov(X, Y ) (5) Var(X + Y ) = Var(X) + Var(Y ) +2 Cov(X, Y ) (6) Var(X - Y ) = Var(X) + Var(Y ) -2 Cov(X, Y ) (7) X, Y가 독립이면, Var(X + Y ) = Var(X) + Var(Y ) Var(X - Y ) = Var(X) + Var(Y ) Var(X + Y) = E[{(X + Y) – (mX + mY)}2] = E[(X - mX)2 + 2(X - mX)(Y - mY) + (Y - mY)2 ] = E[(X - mX)2 ] + 2E[(X - mX)(Y - mY) ] + E[(Y - mY)2] = Var(X) + Var(Y) + 2Cov(X, Y)

( ) ( ) ( ) ( )  결합밀도함수 : f(x, y) = x+y, 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 (2) E(X+Y ), Var(X+Y ) (1) X와 Y의 주변확률밀도함수 : fX(x) = x + , 0 ≤ x ≤ 1 ; fY(y) = y + , 0 ≤ y ≤ 1 1 2 1 2 ( ) 1 E(X) = x x + dx = x2+ dx = x3 + x2 = 2 x 3 4 ( ) 7 12 ( ) E(Y) = y y + dy = y2+ dy = y3 + y2 = y y=0 E(XY) = xy(x + y)dydx = x xy2 + y3 dx ( ) = x x + dx =  Cov(X, Y) = E(XY) - mX mY = - • = - 1 3 7 12 144

( ) ( ) ( ) ( ) ( )  E(X + Y) = E(X) + E(Y) = + = 7 12 E(X + Y) = E(X) + E(Y) = + = 6 ( ) 1 E(X2) = x2 x + dx = x3+ dx = x4 + x3 = 2 x2 4 ( ) ( ) 5 E(Y2) = y2 y + dy = y3+ dy = y4 + y3 = y2  (2) X와 Y의 분산 : ( ) Var(X) = E(X2) – E(X)2 = - = 7 12 11 144 5 2 ( ) Var(Y) = E(Y2) – E(Y)2 = - = 7 12 11 144 5 2 X+Y의 분산 : 5 36 Var(X + Y) = Var(X) + Var(Y) + 2Cov(X, Y) = + - = 11 144 2

▶ ☞ 상관계수(correlation coefficient) : 두 확률변수 사이의 상관계수의 특징 상호 종속관계를 나타내는 계수 Cov(X, Y ) sX sY r = Corr(X, Y ) = r > 0인 경우 r < 0인 경우 r = 0인 경우 상관계수의 특징 ☞ -1 ≤ r ≤ 1

☞ 상관계수의 성질 r = 1인 경우 r = -1인 경우 (1) E(X Y) = mX mY + rXY sX sY (2) Corr(aX+b, cY+d ) = Corr(X, Y ) -Corr(X, Y ) , ac > 0 인 경우 , ac < 0 인 경우

공정한 동전을 3번 던지는 실험 X : 처음 두 번에서 앞면이 나오는 개수 Y : 세 번째에서 앞면이 나오는 개수 (1) Cov(X, Y) = ? (2) rXY = ? (3) E(X+Y ) = ?, Var(X+Y ) = ? 표본공간 HHH HHT HTH THH HTT THT TTH TTT X 2 1 Y 확 률 1/8 X와 Y의 결합질량함수 : f(x, y) = 1/8 , (x, y) = (0, 0), (0, 1), (2, 0), (2, 1) 2/8 , (x, y) = (1, 0), (1, 1) 0 , 다른 곳에서

Cov(X, Y) = E(XY ) – E(X)E(Y ) = 0 fX(x) = 1/4 , x = 0, 2 1/2 , x = 1 0 , 다른 곳에서 fY(y) = 1/2 , y = 0, 1 0 , 다른 곳에서 (1) Cov(X, Y) : S 모든 (x,y) E(XY) = xyf(x, y) = 2•1• + 1•1• = 1 8 2 모든 x E(X) = xfX(x) = 1• + 2• = 1 4 모든 y E(Y) = yfY(y) = 1• = Cov(X, Y) = E(XY ) – E(X)E(Y ) = 0

S (2) rXY : X2, Y2의 기대값 : E(X2) = x2fX(x) = 1• + 4• = E(Y2) = y2fY(y) = 1• = 3 X2, Y2의 기대값 : 3 2 1 2 X, Y의 분산 : Var(X) = E(X2) - E(X)2 = - 1 = sX = 1 / sY = 1/2 1 2 1 4 1 4 Var(Y) = E(Y2) - E(Y)2 = - = Cov(X, Y ) sX sY rXY = = 0 3 2 (3) E(X+Y ) = E(X) + E(Y) = 3 4 Var(X+Y ) = Var(X) + Var(Y) + 2Cov(X, Y) =

제 3 장