결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값.

Slides:



Advertisements
Similar presentations
수학과 김 지하 제 5 장 문제해결의 지도 5.1 문제와 문제해결의 정의.
Advertisements

제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
교수님 영상 제 2 장 관세법 일반 제 1 절 통칙 제 2 절 법 해석의 원칙 등 제 3 절 기한과 기간 제 4 절 서류의 송달 등 제 5 절 관세의 부과 및 징수 제 6 절 납세의무의 소멸 등.
제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
Add Your Text 5. 지수함수와 로그함수 1. 지수함수 2. 로그함수 · 지수함수와 그 그래프 · 지수방정식과 지수부등식 · 로그 함수와 그 그래프 · 로그방정식과 로그부등식.
[ 예제 ] 시장수익률의 확률분포 확률변수의 분포. 목적 내년 시장수익률의 확률분포에 대한 평균, 분산, 표준편차 계산.
Chapter 2 1계 미분방정식.
확률변수의 기대값, 분산 등.
패턴인식 개론 Ch.4 기초 통계와 확률 이론 Translated from “CSCE 666 Pattern Analysis | Ricardo Gutierrez-Osuna | “
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
제 2 장 확 률.
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
표본분포 Sampling Distribution
4.3.3 초기하분포 (Hypergeometric distribution)
제8장 일반함수모형의 비교정태분석.
수치해석 6장 예제문제 환경공학과 천대길.
제12주 회귀분석 Regression Analysis
결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값.
수학 I 2. 방정식과 부등식.
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
패턴인식 개론 Ch.5 확률 변수와 확률 분포.
선형대수학 부정적분과 정적분 적분의 응용 Prof. Jae Young Choi
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
연 속 확 률 분 포 5 균등분포 지수분포 감마분포 웨이블분포 베타분포 정규분포 정규분포에 관련된 연속분포들
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
확률통계론 2장 : 확률변수.
상관함수 correlation function
A Moments of Areas.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
일차방정식의 풀이 일차방정식의 풀이 순서 ① 괄호가 있으면 괄호를 먼저 푼다.
제4장 제어 시스템의 성능.
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
확 률 변 수 2 1 이산확률변수 2 연속확률변수 3 기대값.
Keller: Stats for Mgmt & Econ, 7th Ed
1.4 중첩된 한정기호 (Nested Quantifiers) 이산수학 (Discrete Mathematics)
Week 10:확률변수(Random Variable)
수학 I Week 7. Differentiation
과학 탐구 토론 대회 1학년 2반 박승원 1학년 5반 권민성.
(independent variable)
이번 학기 공부할 내용 확률 확률변수 결합확률분포 이산확률분포 연속확률분포 기술통계학 표본분포 추정 가설검정 이재원
수학8가 대한 92~95 쪽 Ⅳ. 연립방정식 1. 연립방정식과 그 풀이 및 활용 >끝내기전에(9/9) 끝내기 전에.
Week 5:확률(Probability)
Metal Forming CAE Lab., Gyeongsang National University
연 속 확 률 분 포 5 1 균등분포 2 지수분포 3 감마분포 4 정규분포.
Probability.
■ 화성공장 산학인턴 버스 노선 확인 안내 문의 전화 : 안내페이지 접속 1
합집합과 교집합이란 무엇인가? 01 합집합 두 집합 A, B에 대하여 A에 속하거나 B에 속하는 모든 원소로 이루어진 집합을 A와 B의 합집합이라고 하며, 기호 A∪B로 나타낸다. A∪B ={x | x∈A 또는 x∈B}
다면체 다면체 다면체: 다각형인 면만으로 둘러싸인 입체도 형 면: 다면체를 둘러싸고 있는 다각형
2. Boole 대수와 논리 게이트.
논문작성을 위한 연구모형 설정 양동훈.
Distribution(모의 실험에 자주 쓰이는 분포들)
수학10-나 1학년 2학기 Ⅳ.삼각함수 3. 삼각함수의 그래프(7/12) 삼각함수 수업계획 수업활동.
01 로그의 정의 ⑴ 일 때, 양수 에 대하여 을 만족시키는 실수 는 오직 하나 존재한다. 이때 를
감마분포 gamma distribution
선 그리기.
Sampling Distributions
표지  수학 8-나  2학년 2학기 Ⅰ.확률 (1)경우의 수(2~5/15) 경우의 수.
Chapter 3: 확률변수와 분포함수 Pilsung Kang
원의 방정식 원의 방정식 x축, y축에 접하는 원의 방정식 두 원의 위치 관계 공통접선 원과 직선의 위치 관계
1. 접선의 방정식 2010년 설악산.
3. 반/전 가산기, 반/전 감산기 제작 컴퓨터 구조 실습 안내서.
Ⅵ. 확 률 1. 확 률 2. 확률의 계산.
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
Basic Function 김윤성 박로빈 이지호 천영재
상관계수.
이산수학(Discrete Mathematics)  술어와 한정기호 (Predicates and Quantifiers)
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
수학10-나 1학년 2학기 Ⅱ.부등식의 영역 3. 부등식의 영역에서 최대, 최소(5/5) 부등식 영역 수업계획 수업활동.
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
Presentation transcript:

결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값

1 결합확률분포 결합확률분포, 주변확률분포 및 결합확률분포함수의 개념과 2변량 확률 계산 방법을 알아본다.

A와 B 두 회사에 대한 투자액(단위; 백만 원) X와 Y의 비율 1 2 3 4 0.02 0.04 0.08 0.15 0.05 0.06 0.10 0.01 0.00 A와 B 두 회사에 각각 1백만 원씩 투자할 비율 : 0.02 A 회사에 3백만 원 그리고 B 회사에 2백만 원을 투자할 비율 : 0.06 회사에 동시에 4백만 원씩 투자할 비율 : 0.00 투자자들이 회사 A와 회사 B에 투자한 투자액에 대한 확률 : P(X=1, Y=1) = 0.02, P(X=3, Y=2) = 0.06, P(X=4, Y=4) = 0.00

▶ ▶ 결합확률분포(joint probability distribution) : 두 개 이상의 확률변수에 의하여 결합된 확률분포 ▶ 결합확률질량함수(joint p.m.f.) : 이산확률변수 X와 Y에 대하여, 상태공간 안의 (x, y)에서 확률 P(X=x, Y=y)에 대응 하고, 상태공간 밖의 (x, y)에서 0으로 대응하는 함수 SX = { x1, x2, … , xn } , SY = {y1, y2, …, ym } 에 대하여 P(X=x, Y=y) , x ∈ SX , y ∈ SY 0 , 다른 곳에서 f(x, y) =

S = { (x, y) : x = x1, x2, … , xn , y = y1, y2, … , ym } ☞ 결합확률질량함수의 성질 X와 Y의 결합상태공간 S = { (x, y) : x = x1, x2, … , xn , y = y1, y2, … , ym } 에 대하여 모든 x, y에 대하여 0 ≤ f(x, y) ≤ 1이다. S f(x, y) = 1 P(a< X≤ b, c< Y ≤ d ) = S S f(x, y) a<x≤ b c< y ≤ d

S HHH HHT HTH THH HTT THT TTH TTT X 3 2 1 Y 동전 3번 던지는 게임 X와 Y의 결합질량함수 f(x, y) 앞면의 수 : X , 뒷면의 수 : Y 확률 P(X ≥ 1 , Y ≥ 2) 동전 3번 던지는 게임 X : 관찰된 H의 수 Y : 관찰된 T의 수 S HHH HHT HTH THH HTT THT TTH TTT X 3 2 1 Y X와 Y 의 상태공간 : SX = { 0, 1, 2, 3 }, SY = { 0, 1, 2, 3 }

X와 Y 의 결합확률표 : X Y 1 2 3 1/8 3/8 결합확률질량함수 : 1/8 , (x, y) = (0,3), (3,0) 3/8 , (x, y) = (1,2), (2,1) 0 , 다른 곳에서 f(x, y) = 구하고자 하는 확률 : P(X ≥ 1 , Y ≥ 2) = f(1,2) + f(2,2) + f(3,2) + f(1,3) + f(2,3) + f(3 3) = + 0 + 0 + 0 + 0 + 0 = 3 8 3 8

결합상태공간의 분할 예제 1에서 Y=0 (0,0) (1,0) (2,0) (3,0) Y=1 (0,1) (1,1) (2,1) (3,1) Y=2 (0,2) (1,2) (2,2) (3,2) Y=3 (0,3) (1,3) (2,3) (3,3) S X=0 (0,0) (0,1) (0,2) (0,3) (3,3) (3,2) (3,1) (3,0) (2,3) (2,2) (2,1) (2,0) (1,3) (1,2) (1,1) (1,0) (0,3) (0,2) (0,1) (0,0) (3,3) (3,2) (3,1) (3,0) (2,3) (2,2) (2,1) (2,0) (1,3) (1,2) (1,1) (1,0) (0,3) (0,2) (0,1) (0,0) (0,0) (0,1) (0,2) (0,3) X=1 (1,0) (1,1) (1,2) (1,3) (1,0) (1,1) (1,2) (1,3) X=2 (2,0) (2,1) (2,2) (2,3) (2,0) (2,1) (2,2) (2,3) X=3 (3,0) (3,1) (3,2) (3,3) (3,0) (3,1) (3,2) (3,3)

동전을 세 번 던져서 나온 앞면의 수에 대한 확률분포 X 1 2 3 fX(x) 1/8 3/8 Y 1 2 3 합 X=0 1/8 사건 [X=0]일 확률 Y 1 2 3 합 X=1 3/8 사건 [X=1]일 확률 Y 1 2 3 합 X=2 3/8 사건 [X=2]일 확률 Y 1 2 3 합 X=3 1/8 사건 [X=3]일 확률

▶ 주변확률질량함수(marginal p.m.f.) : 이산확률변수 X, Y와 결합확률질량함수 f(x, y)에 대하여 X의 주변확률질량함수 : fX(x) = P(X=x) = S f(x, y), x=x1,…,xn Y의 주변확률질량함수 : fY(y) = P(Y=y) = S f(x, y), y=y1,…,ym x y 뒷면의 수 Y 1/8 3 3/8 2 1 합 1/8 3/8 X의 주변확률질량함수 앞면의 수 X 합 1/8 3/8 Y의 주변확률질량함수

X, Y의 결합확률표 (1) X와 Y의 주변확률질량함수 (2) P(X≤ 2) = ? X Y 1 2 3 4 0.02 0.04 0.08 0.15 0.05 0.06 0.10 0.01 0.00 (1) X, Y의 결합확률질량함수의 그림

X의 주변확률 : P(X=1) = f(1,1) + f(1,2) + f(1,3) + f(1,4) = 0.02 + 0.04 + 0.08 + 0.15 = 0.29 P(X=2) = f(2,1) + f(2,2) + f(2,3) + f(2,4) = 0.04 + 0.05 + 0.06 + 0.10 = 0.25 P(X=3) = f(3,1) + f(3,2) + f(3,3) + f(3,4) = 0.08 + 0.06 + 0.05 + 0.01 = 0.20 P(X=4) = f(4,1) + f(4,2) + f(4,3) + f(4,4) = 0.15 + 0.10 + 0.01 + 0.00 = 0.26 Y의 주변확률 : P(Y=1) = f(1,1) + f(2,1) + f(3,1) + f(4,1) = 0.02 + 0.04 + 0.08 + 0.15 = 0.29 P(Y=2) = f(1,2) + f(2,2) + f(3,2) + f(4,2) = 0.04 + 0.05 + 0.06 + 0.10 = 0.25 P(Y=3) = f(1,3) + f(2,3) + f(3,3) + f(4,3) = 0.08 + 0.06 + 0.05 + 0.01 = 0.20 P(Y=4) = f(1,4) + f(2,4) + f(3,4) + f(4,4) = 0.15 + 0.10 + 0.01 + 0.00 = 0.26

X의 주변확률질량함수 : Y의 주변확률질량함수 : 0.29 , x=1 0.25 , x=2 0.20 , x=3 0.26 , x=4 fX(x) = P(X=x) = 0.29 , y=1 0.25 , y=2 0.20 , y=3 0.26 , y=4 fY(y) = P(Y=y) = (2) 구하고자 하는 확률 : P(X≤ 2) = f(1,1) + f(1,2) + f(1,3) + f( 1,4) + f(2,1) + f(2,2) + f(2,3) + f( 2,4) = 0.02 + 0.04 + 0.08 + 0.15 + 0.04 + 0.05 + 0.06 + 0.10 = 0.54 또는 P(X≤ 2) = fX(1) + fX(2) = 0.29 + 0.25 = 0.54

▶  결합확률밀도함수(joint p.d.f.) : 연속확률변수 X와 Y에 대하여, 다음 조건을 만족하는 함수 f(x, y) f(x, y) ≥ 0 for all x, y  -∞ ∞ f(x, y) dxdy = 1 결합밀도함수의 개형

영역 A와 결합밀도함수 f(x, y)로 둘러싸인 입체의 부피 ☞ 연속형 결합확률 구하는 방법 A={ (x, y)|a ≤ X ≤ b , c ≤ Y ≤ d }에 대하여 확률 P[(X, Y) ∈ A]의 기하학적 의미  a b c d P[(X,Y) ∈ A] = f(x, y) dydx = f(x, y) dydx A 영역 A와 결합밀도함수 f(x, y)로 둘러싸인 입체의 부피

▶  주변확률밀도함수(marginal p.d.f.) : 연속확률변수 X, Y와 결합확률밀도함수 f(x, y)에 대하여 X의 주변확률밀도함수 : fX(x) = f(x, y) dy Y의 주변확률밀도함수 : fY(y) = f(x, y) dx  -∞ ∞

[ ] [ ]   결합확률밀도함수 : x + y , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 0 , 다른 곳에서 (2) P(0≤ X ≤ ½, ½ ≤ Y ≤ 1) , P(0≤ X ≤ ½) , P(½ ≤ Y ≤ 1) , x + y , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 0 , 다른 곳에서 f(x, y) = (1) X의 주변확률밀도함수 : fX(x) = f(x, y) dy = (x + y) dy  -∞ ∞ 1 = xy + y2 = x + , 0 ≤ x ≤ 1 1 2 y=0 [ ] Y의 주변확률밀도함수 : fY(y) = f(x, y) dx = (x + y) dx  1 -∞ ∞ = x2 + xy = y + , 0 ≤ y ≤ 1 1 2 x=0 [ ]

[ ] ( ) ( ) [ ] ( ) [ ]    (2) 구하고자 하는 확률 : P(0 ≤ X ≤ 1/2, 1/2 ≤ Y ≤ 1) = (x + y) dydx  1/2 1 = xy + y2 dx = dx = 2 y=1/2 [ ] x 3 8 + ( ) 4 1/2 P(0 ≤ X ≤ 1/2) = x + dx = x2 + x =  1/2 1 2 ( ) [ ] 3 8 1 ( ) 1 2 [ ] 1 2 1 2 1  5 8 P(1/2 ≤ Y ≤ 1) = y + dy = y2 + y = 1/2 1/2

▶ S  결합분포함수(joint d.f.) : 임의의 실수 x, y에 대하여 F(x, y) = P(X ≤ x, Y ≤ y ) X의 주변분포함수 : FX(x) = P(X ≤ x ) Y의 주변분포함수 : FY(y) = P(Y ≤ y ) FX(x) = S t≤x fX(t)  -∞ x fX(t)dt 모든 y f(t, y) ∞ f(t, y)dydt = , X : 연속확률변수인 경우 , X : 이산확률변수인 경우

☞ 결합분포함수의 성질 (1) FX(x) = lim F(x, y) , FY(y) = lim F(x, y) (2) A={ (x, y)|a < X ≤ b , c < Y ≤ d }에 대하여 확률 P[(X, Y) ∈ A] P(a < X ≤ b , c < Y ≤ d ) = F(b,d) – F(a,d) - F(b,c) + F(a,c) 연속확률변수 X와 Y에 대하여  2 xy F(x, y) f(x, y) = (3) fX(x) = d dx FX(x) , fY(y) = dy FY(y) (4)

(1) X와 Y 의 결합확률밀도함수 : f(x, y) = ? 결합분포함수 : F(x, y) = (1-e-x ) (1- e-y ) , 0 < x < ∞ , 0 < y < ∞ (1) X와 Y 의 결합확률밀도함수 : f(x, y) = ? (2) X와 Y 의 주변확률밀도함수 : fX(x) = ? , fY(y) = ? (3) P(1 < X ≤ 2 , 1 < Y ≤ 2) = ? (1) X와 Y 의 결합확률밀도함수 : 2 xy f(x, y) = F(x, y) 2 xy = (1 – e-x ) (1 – e-2y ) = (e-x) (2e-2y) = 2e-(x+2y) , 0 < x < ∞ , 0 < y < ∞ X와 Y 의 주변분포함수 : FX(x) = lim F(x, y) = lim (1 – e-x ) (1 – e-2y ) = 1 – e-x , 0 < x < ∞ FY(y) = lim F(x, y) = lim (1 – e-x ) (1 – e-2y ) = 1 – e-2y , 0 < y < ∞ y→∞ x→∞

(2) X와 Y의 주변확률밀도함수 : fX(x) = FX(x) = (1 – e-x) = e-x , 0 < x < ∞ d dx d dy d dy fY(y) = FY(y) = (1 – e-2y) = 2e-2y , 0 < y < ∞ (3) P(1 < X ≤ 2, 1 < Y ≤ 2) = F(2, 2) – F(1, 2) – F(2, 1) + F(1, 1) = (1 - e-2) (1 - e-4) - (1 - e-1) (1 - e-4) - (1 - e-2)2 - (1 - e-1) (1 - e-2) = 0.0272

결합확률질량함수 : 결합분포함수 : F(x, y) 0.10 0.15 0.04 2 0.30 0.05 1 0.01 3 Y X F(x, y) = P(X ≤ x, Y ≤ y ) 이므로 Y X 1 2 3 0.01 0.06 0.10 0.11 0.21 0.30 0.61 0.15 0.40 0.59 1.00

2 조건부 확률분포 조건부 확률분포, 확률변수의 독립성과 종속성 및 항등분포에 대하여 알아본다.

A = { X=x }, B = { Y=y } A∩B = { X = x, Y = y } 조건부 확률 Review P(A|B) = P(A∩B) P(B) , P(B) > 0 f(x, y) : 이산확률변수 X 와 Y의 결합확률질량함수 f(x, y) = P(X = x, Y = y) fX(x) : 이산확률변수 X 의 주변확률질량함수 fX(x) = P(X = x) fY(y) : 이산확률변수 Y 의 주변확률질량함수 fY(y) = P(Y = y) A = { X=x }, B = { Y=y } A∩B = { X = x, Y = y } P(A) = P(X=x) = fX(x) P(B) = P(Y=y) = fY(y) P(A∩B) = P(X=x, Y=y) = f(x, y) P(A∩B) f(x, y) P(B) fY(y) P(A|B)=P(X=x|Y=y) = =

▶ ▶ 조건부확률질량함수(conditional p.m.f.) : 이산확률변수 f(x, y) X와 Y에 대하여, P(Y=y) > 0일 때 를 Y=y일 때 X의 조건부확률질량함수라 하고, f(x|y)로 나타낸다. P(X=x|Y=y) = f(x, y) fY(y) f(y|x)= f(x, y) fX(x) X=x일 때 Y의 조건부확률질량함수 : ▶ 조건부확률밀도함수(conditional p.d.f.) : 연속확률변수 X와 Y에 대하여, fY(y) > 0일 때 f(x|y) = f(x, y) fY(y)

☞ 조건부 확률분포의 의미 P(X=x, Y=y) P(X=x) P(X=x,Y=y) P(Y=y) y x

S X와 Y의 결합확률질량함수 : (1) Y의 주변확률질량함수 : fY(y) = ? (2) Y=y인 X의 조건부확률질량함수 : f(x|y) = ? (3) Y=2인 X의 조건부확률질량함수 : f(x|y=2) = ? (4) 조건부 확률 : P(X=3|Y=2) = ? 0 , 다른 곳에서 f (x, y) = , x = 1, 2, 3, y = 1, 2, 3 x + y 36 fY(y) = S x=1 3 f(x, y) = x + y 36 = y + 2 12 , y = 1, 2, 3 (1) f(x|y) = f(x, y) fY(y) (x + y) /36 (y + 2) / 12 x + y 3(y + 2) = , x = 1, 2, 3 (2) f(x|y = 2) = x + 2 12 , x = 1, 2, 3 (3) P(X=3|Y=2) = f(3|2) = 3 + 2 12 5 = (4)

☞ S 조건부 확률 구하는 방법 P(Y ∈ B|X = x) = f(y|x) = P(X = x, Y ∈ B) P(X = x) P(X ∈ A|Y = y) = x ∈ A f(x|y) P(X ∈ A, Y = y) P(Y = y)

 P(Y ∈ B|X = x) = = P(X = x, Y ∈ B) fX(x) P(X ∈ A|Y = y) = fY(y) f(y|x)dy  c d f(x|y)dx a b

X, Y의 결합확률 : (1) X와 Y의 주변확률질량함수 (2) Y=2인 X의 조건부 확률질량함수 (3) Y=2인 조건 아래서 X=1 또는 X=3 일 확률 Y X 1 2 3 4 0.12 0.08 0.07 0.05 0.15 0.21 0.13 0.01 0.02 (1) X와 Y의 주변확률질량함수 : fX(x) = 0.32 , x = 1 0.57 , x = 2 0.11 , x = 3 Y X 1 2 3 4 fX(x) 0.12 0.08 0.07 0.05 0.32 0.15 0.21 0.13 0.57 0.01 0.02 0.11 fY(y) 0.24 0.30 0.25 1.00 fY(y) = 0.21 , y = 1 0.24 , y = 2 0.30 , y = 3 0.25 , y = 4

(2) Y=2인 X의 조건부 확률질량함수 : 조건부 확률질량함수의 정의로부터 f(x|y = 2) = f(x, 2) fY(2) 0.24 = , x = 1, 2, 3 f(1|y = 2) = = 0.333 0.08 0.24 X의 조건부 확률질량함수 : f(x|y) = 0.333 , x = 0 0.625 , x = 1 0.042 , x = 2 0 , 다른 곳에서 f(2|y = 2) = = 0.625 0.15 0.24 f(3|y = 2) = = 0.042 0.01 0.24 (3) 구하고자 하는 확률 : P(X = 1 또는 X = 3|Y = 2) = f(1|y = 2) + f(3|y = 2) = 0.333 + 0.042 = 0.375

P(A|B)=P(X = x|Y = y) = f(x|y) 독립 사건 Review P(A) = P(A|B) , P(B) > 0 이산확률변수 X와 Y에 대하여 A = { X = x }, B = { Y = y } P(A) = P(X = x) = fX(x) P(A|B)=P(X = x|Y = y) = f(x|y) f(x|y) = fX(x) ?

▶ ☞ 독립(independent) : 임의의 실수 x와 y에 대하여, 독립 확률변수의 성질 fX(x) > 0, fY(y) > 0일 때 fX(x) = f(x|y) 또는 fY(y) = f(y|x) 이면, 두 확률변수 X와 Y를 독립이라 하고, 독립이 아닌 경우에 종속(dependent)이라 한다. ☞ 독립 확률변수의 성질 확률변수 X와 Y가 독립이면, f(x, y) = fX(x) fY(y)

[ ] [ ]   결합확률밀도함수 : f(x, y)=6xy2 , 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 (1) X의 주변확률밀도함수 : fX(x) = ? (2) Y=1/2인 조건 아래서 X의 조건부 확률밀도함수 : f (x|y=1/2) = ? (3) Y=1/2인 조건 아래서 확률 : P(1/2 ≤ X ≤ 1) = ? (4) X와 Y의 독립성 (1) X의 주변확률밀도함수 : fX(x) = f(x, y) dy = 6xy2 dy = (2x)y3 = 2x , 0 ≤ x ≤ 1  -∞ ∞ y=0 1 [ ] (2) Y의 주변확률밀도함수 : fY(y) = f(x, y) dx = 6xy2 dx = (3y2)x2 = 3y2 , 0 ≤ y ≤ 1  -∞ ∞ x=0 1 [ ]

( ) ( )  fY(1/2)=3/4이므로 Y=1/2인 조건 아래서 X의 조건부 확률밀도함수 : f(x|y = ½) = = 2x , 0 ≤ x ≤ 1 (3/2)x 3/4 P ≤ X ≤ 1|Y = = 1 2 ( ) P ≤ X ≤ 1 , Y = fY(1/2) ( )  1/2 = 2x dx = x2 = 3 4 (3) (4) 모든 0 ≤ x ≤ 1에 대하여 fX(x) = 2x = f(x|y ) X와 Y는 독립

[ ] ( ) [ ]   다음 결합분포에 대한 X와 Y의 독립성 (1) f(x, y) = x + y , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 (2) f(x, y) = 2e-(x+2y) , x > 0, y > 0 (3) 1/8, (x, y) = (0, 3), (3, 0) 3/8, (x, y) = (1, 2), (2, 1) 0 , 다른 곳에서 f(x, y) = (1) X와 Y의 주변확률밀도함수 : ∞ 1 2 fX(x) = f(x, y) dy = (x + y) dy = xy + y2 = x + , 0 ≤ x ≤ 1  -∞ y=0 [ ] 모든 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1에 대하여 1 2 f(x, y) = x + y ≠ fX(x) fY(y) = x + y + ( ) • 1 2 fY(y) = f(x, y) dx = (x + y) dx = x2 + xy = y + , 0 ≤ y ≤ 1  -∞ ∞ x=0 [ ] X와 Y는 종속

f(x, y) =2e-(x+2y) = fX(x) fY(y) , x > 0, y > 0 fX(x) = 2e-(x+2y) dy = e-x e-2y = e-x , x > 0  ∞ y=0 [ ] fY(y) = 2e-(x+2y) dx = 2e-2y e-x = 2e-2y , y > 0 x=0 f(x, y) =2e-(x+2y) = fX(x) fY(y) , x > 0, y > 0 X와 Y는 독립 (3) X와 Y의 주변확률질량함수 : 1/8, x = 0, 3 3/8, x = 1, 2 0 , 다른 곳에서 fX(x) = 1/8, y = 0, 3 3/8, y = 1, 2 fY(y) = f(1, 1) = 0 ≠ fX(1) fY(1) = 3 8 9 64 • = X와 Y는 종속

( ) ( )    정리 1 임의의 두 확률변수 X와 Y에 대하여 다음은 동치이다. (1) X, Y : 독립 (2) 모든 x, y에 대하여 F(x, y) = FX(x) FY(y) (3) P(a < X ≤ b, c < Y ≤ d ) = P(a < X ≤ b ) P(c < Y ≤ d ) 증명 X와 Y가 연속확률변수인 경우 (1) (2)  -∞ y x  -∞ y x F(x, y) = f(u, v)dvdu = fX(u)fY(v)dvdu = fX(u) fY(v)dv du = fX(u) FY(y)du  -∞ x y ( ) = FY(y) fX(u)du = FX(x)FY(y) (2) (1) 2 x y ∂x ∂y f(x, y) = F(x, y) = FX(x)FY(y) = FX(x) FY(y) = FX(x)fY(y) ∂ ∂x ∂y ( ) = fY(y) FX(x) = fX(x)fY(y)

(1) X, Y : 독립 식 (3)이 성립 P(a < X ≤ b, c < Y ≤ d ) = F(b, d) – F(a, d) – F(b, c) + F(a, c) 이고, X, Y가 독립이면, F(x, y) = FX(x) FY(y)이므로 P(a < X ≤ b, c < Y ≤ d ) = FX(b)FY(d) – FX(a)FY(d) – FX(b)FY(c) + FX(a)FY(c) = (FX(b) - FX(a)) (FY(d) - FY(c)) = P(a < X ≤ b ) P(c < Y ≤ d ) 식 (3)이 성립 X, Y : 독립 a, b, c, d가 임의의 수이므로 a = -∞ , c = -∞ , b = x, d = y라 하면, F(x, y) = P(a < X ≤ b, c < Y ≤ d ) = P(a < X ≤ b ) P(c < Y ≤ d ) = FX(x) FY(y) 이고, 따라서 X와 Y는 독립이다.

▶ 항등분포(identical distribution) : 임의의 실수 x에 대하여 fX(x) = fY(x) 일 때, 확률변수 X와 Y는 항등분포를 이룬다 하고, 항등적으로 독립인 분포를 이루는 확률변수를 간단히 i.i.d(independently, identically distributed)로 나타낸다.

 X와 Y의 결합분포함수 : F(x, y) = (1-e-2x)(1-e-3y) , x >0 , y >0 X와 Y는 i.i.d. ? X와 Y의 결합밀도함수와 주변밀도함수 : f(x, y) = F(x, y) = 6e-(2x+3y) , 0 < x < ∞, 0 < y < ∞ ∂2 ∂x ∂y fX(x) = 6e-(2x+3y) dy = 2e-2x , 0 < x < ∞  ∞ fY(y) = 6e-(2x+3y) dx = 3e-3y , 0 < y < ∞ 모든 x >0 , y >0에 대하여 f(x, y) = fX(x) fY(y) X, Y : 독립 X, Y : i.i.d. 가 아니다. 모든 x >0 에 대하여 fX(x) = 2e-2x≠ fY (x) = 3e-3x X, Y : 항등분포가 아니다.

X와 Y의 결합확률함수 : X와 Y : i.i.d. ? 1/8, (x, y) = (0, 3), (3, 0) 3/8, (x, y) = (1, 2), (2, 1) 0 , 다른 곳에서 f(x, y) = X와 Y의 주변확률질량함수 : 1/8, x = 0, 3 3/8, x = 1, 2 0 , 다른 곳에서 1/8, y = 0, 3 3/8, y = 1, 2 0 , 다른 곳에서 fY(y) = fX(x) = 예제 4에서 X, Y : 종속 X, Y : i.i.d.가 아니다. 모든 x =0, 1, 2, 3 에 대하여 fX(x) = fY (x) X, Y : 항등분포

3 결합분포에 대한 기대값 결합분포의 기대값과 공분산, 상관관계 등에 대하여 알아본다.

☞ S S   2변량 확률변수의 함수 u(X, Y)의 기대값 확률변수의 함수에 대한 기대값 Review 확률변수의 함수 Y = g(X)의 기대값 : E(Y) = E[g(X)] = S x g(x) f(x)  -∞ ∞ g(x) f(x)dx ☞ 2변량 확률변수의 함수 u(X, Y)의 기대값 f(x, y) : X와 Y의 결합확률함수 u(x, y) : X와 Y의 함수 S 모든 y u(x, y) f(x, y)  -∞ ∞ u(x, y) f(x, y)dydx E[u(X, Y)] = 모든 x , (X, Y) : 이산확률변수인 경우 , (X, Y) : 연속확률변수인 경우

E[au(X, Y ) + bv(X, Y )] = aE[u(X, Y )] + bE[v(X, Y)] ☞ 2변량 기대값의 성질 E[au(X, Y ) + bv(X, Y )] = aE[u(X, Y )] + bE[v(X, Y)] S 모든 x S 모든 y mX = E(X) = x f(x, y) X의 기대값 : S 모든 x [ ] S 모든 y  모든 x = x f(x, y) = x fX(x)  -∞ ∞ mX = x f(x, y)dydx = x fX(x)dx S 모든 y 모든 x = (x - mX)2 f(x, y) = (x - mX)2 fX(x) [ ] sX = E[(X - mX)2] = (x - mX)2 f(x, y) 2  -∞ ∞ sX = (x - mX)2 f(x, y)dydx = (x - mX)2 fX(x)dx X의 분산 :

S S 결합확률질량함수 : (1) E(X) = ? (2) E(Y) = ? (3) E(X + Y) = ? 0.09 0.07 0.05 0.04 2 0.10 1 0.15 0.11 0.08 3 Y X mX = E(X) = x f(x, y) S x=0 2 y=0 3 = 0•(0.08) + 0•(0.10) + 0•(0.11) + 0•(0.15) + 1•(0.05) + 1•(0.07) + 1•(0.09) + 1•(0.10) + 2•(0.04) + 2•(0.05) + 2•(0.07) + 2•(0.09) = 0.81 mY = E(Y) = y f(x, y) S x=0 2 y=0 3 = 0•(0.08) + 0•(0.05) + 0•(0.04) + 1•(0.10) + 1•(0.07) + 1•(0.05) + 2•(0.11) + 2•(0.09) + 2•(0.07) + 3•(0.15) + 3•(0.10) + 3•(0.09) = 1.78

E(X + Y) = (x + y) f(x, y) S x=0 2 y=0 3 = 0•(0.08) + 1•(0.10) + 2•(0.11) + 3•(0.15) + 1•(0.05) + 2•(0.07) + 3•(0.09) + 4•(0.10) + 2•(0.04) + 3•(0.05) + 4•(0.07) + 5•(0.09) = 2.59 E(X Y) = xy f(x, y) S x=0 2 y=0 3 = 0•(0.08) + 0•(0.10) + 0•(0.11) + 0•(0.15) + 0•(0.05) + 1•(0.07) + 2•(0.09) + 3•(0.10) + 0•(0.04) + 2•(0.05) + 4•(0.07) + 6•(0.09) = 1.47

[ ] ( ) S  정리 2 임의의 두 확률변수 X와 Y가 독립이면. 다음이 성립한다. E(X Y ) = E(X ) E(Y ) X와 Y가 이산확률변수인 경우 : 증명 S 모든 y E(X Y) = xy f(x, y) = xy fX(x)fY(y) 모든 x = x fX(x) y fY(y) = E(X)E(Y) [ ] X와 Y가 연속확률변수인 경우 : E(X Y) = xy f(x, y)dydx = xy fX(x)fY(y)dydx = xfX(x)dx yfY(y)dy = E(X)E(Y) ( )  -∞ ∞ 정리 2의 역은 성립하지 않는다. 주 의

( )  결합확률밀도함수 : f(x, y) = 6xy2 , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 E(X), E(Y ), E(X Y ) = ? E(X Y ) = E(X)E(Y ) = ? X, Y 의 주변확률밀도함수 : fX(x) = 2x , 0 ≤ x ≤ 1 , fY(y) = 3y2 , 0 ≤ y ≤ 1 mX = xfX(x)dx = 2x2dx = x3 = 2 3 1 mY = yfY(y)dy = 3y3dy = y4 = 4 E(X Y) = xyf(x, y)dydx = 6x2y3dydx = 6x2 y4 dx = x2 dx = x3 = ( )  E(X Y ) = E(X)E(Y)가 성립한다.

   결합밀도함수 : E(X), E(Y ), E(X Y ) = ? X, Y의 독립성 ? f(x, y) = 4 f(x, y) = , -1 ≤ x ≤ 1, -1 ≤ y ≤ 1 X, Y 의 주변확률밀도함수 :  -1 1 1 + xy(x2 – y2) 4 1 2 fX(x) = dy = , -1 ≤ x ≤ 1  -1 1 1 + xy(x2 – y2) 4 1 2 fY(y) = dx = , -1 ≤ y ≤ 1 mY = dy = 0 y 2 mX = dx = 0 ; x E(XY) = dydx = 0 1 + xy(x2 – y2) 4  -1 1 E(XY ) = E(X) E(Y ) f(x, y) = ≠ fX(x) fY(y) = 1 4 1 + xy(x2 – y2) X, Y는 독립이 아니다.

Cov(X, Y) = E[(X – mX ) (Y – mY )] ▶ 공분산(covariance) : mX=E(X), mY=E(Y)에 대하여 E[(X – mX ) (Y – mY )] 을 공분산이라 하고, Cov(X, Y)로 나타낸다. Cov(X, Y) = E[(X – mX ) (Y – mY )] (x – mX ) (y – mY ) f(x, y) , (X, Y) : 이산형인 경우 (x – mX ) (y – mY ) f(x, y)dxdy , (X, Y) : 연속형인 경우 = S 모든 x 모든 y  -∞ ∞ ☞ 공분산의 간편 계산 방법 Cov(X, Y) = E[(X – mX) (Y - mY)] = E(X Y - mXY - mYX + mX mY) = E(X Y) - mXE(Y) - mYE(X) + mY mY = E(X Y) - mY mY

☞ 공분산의 성질 (1) Cov(X, Y ) = E(X Y ) - mX mY (2) X, Y가 독립이면, Cov(X, Y ) = 0 (역은 성립하지 않는다) (3) Cov(X, X ) = Var(X) (4) Cov(aX + b, cY + d ) = ac Cov(X, Y ) (5) Var(X + Y ) = Var(X) + Var(Y ) +2 Cov(X, Y ) (6) Var(X - Y ) = Var(X) + Var(Y ) -2 Cov(X, Y ) (7) X, Y가 독립이면, Var(X + Y ) = Var(X) + Var(Y ) Var(X - Y ) = Var(X) + Var(Y ) Var(X + Y) = E[{(X + Y) – (mX + mY)}2] = E[(X - mX)2 + 2(X - mX)(Y - mY) + (Y - mY)2 ] = E[(X - mX)2 ] + 2E[(X - mX)(Y - mY) ] + E[(Y - mY)2] = Var(X) + Var(Y) + 2Cov(X, Y)

( ) ( ) ( ) ( )  결합밀도함수 : f(x, y) = x+y, 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 (2) E(X+Y ), Var(X+Y ) (1) X와 Y의 주변확률밀도함수 : fX(x) = x + , 0 ≤ x ≤ 1 ; fY(y) = y + , 0 ≤ y ≤ 1 1 2 1 2 ( ) 1 E(X) = x x + dx = x2+ dx = x3 + x2 = 2 x 3 4 ( ) 7 12 ( ) E(Y) = y y + dy = y2+ dy = y3 + y2 = y y=0 E(XY) = xy(x + y)dydx = x xy2 + y3 dx ( ) = x x + dx =  Cov(X, Y) = E(XY) - mX mY = - • = - 1 3 7 12 144

( ) ( ) ( ) ( ) ( )  E(X + Y) = E(X) + E(Y) = + = 7 12 E(X + Y) = E(X) + E(Y) = + = 6 ( ) 1 E(X2) = x2 x + dx = x3+ dx = x4 + x3 = 2 x2 4 ( ) ( ) 5 E(Y2) = y2 y + dy = y3+ dy = y4 + y3 = y2  (2) X와 Y의 분산 : ( ) Var(X) = E(X2) – E(X)2 = - = 7 12 11 144 5 2 ( ) Var(Y) = E(Y2) – E(Y)2 = - = 7 12 11 144 5 2 X+Y의 분산 : 5 36 Var(X + Y) = Var(X) + Var(Y) + 2Cov(X, Y) = + - = 11 144 2

▶ ☞ 상관계수(correlation coefficient) : 두 확률변수 사이의 상관계수의 특징 상호 종속관계를 나타내는 계수 Cov(X, Y ) X Y r  Corr(X, Y ) = r > 0인 경우 r < 0인 경우 r = 0인 경우 상관계수의 특징 ☞ -1 ≤ r ≤ 1

☞ 상관계수의 성질 r = 1인 경우 r = -1인 경우 Corr(aX+b, cY+d ) = Corr(X, Y ) , ac > 0 인 경우 , ac < 0 인 경우

공정한 동전을 3번 던지는 실험 X : 처음 두 번에서 앞면이 나오는 개수 Y : 세 번째에서 앞면이 나오는 개수 (1) Cov(X, Y) = ? (2) rXY = ? (3) E(X+Y ) = ?, Var(X+Y ) = ? 표본공간 HHH HHT HTH THH HTT THT TTH TTT X 2 1 Y 확 률 1/8 X와 Y의 결합질량함수 : f(x, y) = 1/8 , (x, y) = (0, 0), (0, 1), (2, 0), (2, 1) 2/8 , (x, y) = (1, 0), (1, 1) 0 , 다른 곳에서

Cov(X, Y) = E(XY ) – E(X)E(Y ) = 0 fX(x) = 1/4 , x = 0, 2 1/2 , x = 1 0 , 다른 곳에서 fY(y) = 1/2 , y = 0, 1 0 , 다른 곳에서 (1) Cov(X, Y) : S 모든 (x,y) E(XY) = xyf(x, y) = 2•1• + 1•1• = 1 8 2 모든 x E(X) = xfX(x) = 1• + 2• = 1 4 모든 y E(Y) = yfY(y) = 1• = Cov(X, Y) = E(XY ) – E(X)E(Y ) = 0

S (2) rXY : X2, Y2의 기대값 : E(X2) = x2fX(x) = 1• + 4• = E(Y2) = y2fY(y) = 1• = 3 X2, Y2의 기대값 : 3 2 1 2 X, Y의 분산 : Var(X) = E(X2) - E(X)2 = - 1 = sX = 1 / sY = 1/2 1 2 1 4 1 4 Var(Y) = E(Y2) - E(Y)2 = - = Cov(X, Y ) sX sY rXY = = 0 3 2 (3) E(X+Y ) = E(X) + E(Y) = 3 4 Var(X+Y ) = Var(X) + Var(Y) + 2Cov(X, Y) =