결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값
1 결합확률분포 결합확률분포, 주변확률분포 및 결합확률분포함수의 개념과 2변량 확률 계산 방법을 알아본다.
A와 B 두 회사에 대한 투자액(단위; 백만 원) X와 Y의 비율 1 2 3 4 0.02 0.04 0.08 0.15 0.05 0.06 0.10 0.01 0.00 A와 B 두 회사에 각각 1백만 원씩 투자할 비율 : 0.02 A 회사에 3백만 원 그리고 B 회사에 2백만 원을 투자할 비율 : 0.06 회사에 동시에 4백만 원씩 투자할 비율 : 0.00 투자자들이 회사 A와 회사 B에 투자한 투자액에 대한 확률 : P(X=1, Y=1) = 0.02, P(X=3, Y=2) = 0.06, P(X=4, Y=4) = 0.00
▶ ▶ 결합확률분포(joint probability distribution) : 두 개 이상의 확률변수에 의하여 결합된 확률분포 ▶ 결합확률질량함수(joint p.m.f.) : 이산확률변수 X와 Y에 대하여, 상태공간 안의 (x, y)에서 확률 P(X=x, Y=y)에 대응 하고, 상태공간 밖의 (x, y)에서 0으로 대응하는 함수 SX = { x1, x2, … , xn } , SY = {y1, y2, …, ym } 에 대하여 P(X=x, Y=y) , x ∈ SX , y ∈ SY 0 , 다른 곳에서 f(x, y) =
S = { (x, y) : x = x1, x2, … , xn , y = y1, y2, … , ym } ☞ 결합확률질량함수의 성질 X와 Y의 결합상태공간 S = { (x, y) : x = x1, x2, … , xn , y = y1, y2, … , ym } 에 대하여 모든 x, y에 대하여 0 ≤ f(x, y) ≤ 1이다. S f(x, y) = 1 P(a< X≤ b, c< Y ≤ d ) = S S f(x, y) a<x≤ b c< y ≤ d
S HHH HHT HTH THH HTT THT TTH TTT X 3 2 1 Y 동전 3번 던지는 게임 X와 Y의 결합질량함수 f(x, y) 앞면의 수 : X , 뒷면의 수 : Y 확률 P(X ≥ 1 , Y ≥ 2) 동전 3번 던지는 게임 X : 관찰된 H의 수 Y : 관찰된 T의 수 S HHH HHT HTH THH HTT THT TTH TTT X 3 2 1 Y X와 Y 의 상태공간 : SX = { 0, 1, 2, 3 }, SY = { 0, 1, 2, 3 }
X와 Y 의 결합확률표 : X Y 1 2 3 1/8 3/8 결합확률질량함수 : 1/8 , (x, y) = (0,3), (3,0) 3/8 , (x, y) = (1,2), (2,1) 0 , 다른 곳에서 f(x, y) = 구하고자 하는 확률 : P(X ≥ 1 , Y ≥ 2) = f(1,2) + f(2,2) + f(3,2) + f(1,3) + f(2,3) + f(3 3) = + 0 + 0 + 0 + 0 + 0 = 3 8 3 8
결합상태공간의 분할 예제 1에서 Y=0 (0,0) (1,0) (2,0) (3,0) Y=1 (0,1) (1,1) (2,1) (3,1) Y=2 (0,2) (1,2) (2,2) (3,2) Y=3 (0,3) (1,3) (2,3) (3,3) S X=0 (0,0) (0,1) (0,2) (0,3) (3,3) (3,2) (3,1) (3,0) (2,3) (2,2) (2,1) (2,0) (1,3) (1,2) (1,1) (1,0) (0,3) (0,2) (0,1) (0,0) (3,3) (3,2) (3,1) (3,0) (2,3) (2,2) (2,1) (2,0) (1,3) (1,2) (1,1) (1,0) (0,3) (0,2) (0,1) (0,0) (0,0) (0,1) (0,2) (0,3) X=1 (1,0) (1,1) (1,2) (1,3) (1,0) (1,1) (1,2) (1,3) X=2 (2,0) (2,1) (2,2) (2,3) (2,0) (2,1) (2,2) (2,3) X=3 (3,0) (3,1) (3,2) (3,3) (3,0) (3,1) (3,2) (3,3)
동전을 세 번 던져서 나온 앞면의 수에 대한 확률분포 X 1 2 3 fX(x) 1/8 3/8 Y 1 2 3 합 X=0 1/8 사건 [X=0]일 확률 Y 1 2 3 합 X=1 3/8 사건 [X=1]일 확률 Y 1 2 3 합 X=2 3/8 사건 [X=2]일 확률 Y 1 2 3 합 X=3 1/8 사건 [X=3]일 확률
▶ 주변확률질량함수(marginal p.m.f.) : 이산확률변수 X, Y와 결합확률질량함수 f(x, y)에 대하여 X의 주변확률질량함수 : fX(x) = P(X=x) = S f(x, y), x=x1,…,xn Y의 주변확률질량함수 : fY(y) = P(Y=y) = S f(x, y), y=y1,…,ym x y 뒷면의 수 Y 1/8 3 3/8 2 1 합 1/8 3/8 X의 주변확률질량함수 앞면의 수 X 합 1/8 3/8 Y의 주변확률질량함수
X, Y의 결합확률표 (1) X와 Y의 주변확률질량함수 (2) P(X≤ 2) = ? X Y 1 2 3 0.02 0.04 0.08 0.15 0.05 0.06 0.10 0.01 0.00 (1) X, Y의 결합확률질량함수의 그림
X의 주변확률 : P(X=1) = f(1,1) + f(1,2) + f(1,3) + f(1,4) = 0.02 + 0.04 + 0.08 + 0.15 = 0.29 P(X=2) = f(2,1) + f(2,2) + f(2,3) + f(2,4) = 0.04 + 0.05 + 0.06 + 0.10 = 0.25 P(X=3) = f(3,1) + f(3,2) + f(3,3) + f(3,4) = 0.08 + 0.06 + 0.05 + 0.01 = 0.20 P(X=4) = f(4,1) + f(4,2) + f(4,3) + f(4,4) = 0.15 + 0.10 + 0.01 + 0.00 = 0.26 Y의 주변확률 : P(Y=1) = f(1,1) + f(2,1) + f(3,1) + f(4,1) = 0.02 + 0.04 + 0.08 + 0.15 = 0.29 P(Y=2) = f(1,2) + f(2,2) + f(3,2) + f(4,2) = 0.04 + 0.05 + 0.06 + 0.10 = 0.25 P(Y=3) = f(1,3) + f(2,3) + f(3,3) + f(4,3) = 0.08 + 0.06 + 0.05 + 0.01 = 0.20 P(Y=4) = f(1,4) + f(2,4) + f(3,4) + f(4,4) = 0.15 + 0.10 + 0.01 + 0.00 = 0.26
X의 주변확률질량함수 : Y의 주변확률질량함수 : 0.29 , x=1 0.25 , x=2 0.20 , x=3 0.26 , x=4 fX(x) = P(X=x) = 0.29 , y=1 0.25 , y=2 0.20 , y=3 0.26 , y=4 fY(y) = P(Y=y) = (2) 구하고자 하는 확률 : P(X≤ 2) = f(1,1) + f(1,2) + f(1,3) + f( 1,4) + f(2,1) + f(2,2) + f(2,3) + f( 2,4) = 0.02 + 0.04 + 0.08 + 0.15 + 0.04 + 0.05 + 0.06 + 0.10 = 0.54 또는 P(X≤ 2) = fX(1) + fX(2) = 0.29 + 0.25 = 0.54
▶ 결합확률밀도함수(joint p.d.f.) : 연속확률변수 X와 Y에 대하여, 다음 조건을 만족하는 함수 f(x, y) f(x, y) ≥ 0 for all x, y -∞ ∞ f(x, y) dxdy = 1 결합밀도함수의 개형
영역 A와 결합밀도함수 f(x, y)로 둘러싸인 입체의 부피 ☞ 연속형 결합확률 구하는 방법 A={ (x, y)|a ≤ X ≤ b , c ≤ Y ≤ d }에 대하여 확률 P[(X, Y) ∈ A]의 기하학적 의미 a b c d P[(X,Y) ∈ A] = f(x, y) dydx = f(x, y) dydx A 영역 A와 결합밀도함수 f(x, y)로 둘러싸인 입체의 부피
▶ 주변확률밀도함수(margina p.d.f.) : 연속확률변수 X, Y와 결합밀도질량함수 f(x, y)에 대하여 X의 주변확률밀도함수 : fX(x) = f(x, y) dy Y의 주변확률밀도함수 : fY(y) = f(x, y) dx -∞ ∞
[ ] [ ] 결합확률밀도함수 : x + y , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 0 , 다른 곳에서 (2) P(0≤ X ≤ ½, ½ ≤ Y ≤ 1) , P(0≤ X ≤ ½) , P(½ ≤ Y ≤ 1) , x + y , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 0 , 다른 곳에서 f(x, y) = (1) X의 주변확률밀도함수 : fX(x) = f(x, y) dy = (x + y) dy -∞ ∞ 1 = xy + y2 = x + , 0 ≤ x ≤ 1 1 2 y=0 [ ] Y의 주변확률밀도함수 : fY(y) = f(x, y) dx = (x + y) dx 1 -∞ ∞ = x2 + xy = y + , 0 ≤ y ≤ 1 1 2 x=0 [ ]
[ ] ( ) ( ) [ ] ( ) [ ] (2) 구하고자 하는 확률 : P(0 ≤ X ≤ 1/2, 1/2 ≤ Y ≤ 1) = (x + y) dydx 1/2 1 = xy + y2 dx = dx = 2 y=1/2 [ ] x 3 8 + ( ) 4 1/2 P(0 ≤ X ≤ 1/2) = x + dx = x2 + x = 1/2 1 2 ( ) [ ] 3 8 1 ( ) 1 2 [ ] 1 2 1 2 1 5 8 P(1/2 ≤ Y ≤ 1) = y + dy = y2 + y = 1/2 1/2
▶ S 결합분포함수(joint d.f.) : 임의의 실수 x, y에 대하여 F(x, y) = P(X ≤ x, Y ≤ y ) X의 주변분포함수 : FX(x) = P(X ≤ x ) Y의 주변분포함수 : FY(y) = P(Y ≤ y ) FX(x) = S t≤x fX(t) -∞ x fX(t)dt 모든 y f(t, y) ∞ f(t, y)dydt = , X : 연속확률변수인 경우 , X : 이산확률변수인 경우
☞ 결합분포함수의 성질 (1) FX(x) = lim F(x, y) , FY(y) = lim F(x, y) (2) A={ (x, y)|a < X ≤ b , c < Y ≤ d }에 대하여 확률 P[(X, Y) ∈ A] P(a < X ≤ b , c < Y ≤ d ) = F(b,d) – F(a,d) - F(b,c) + F(a,c) 연속확률변수 X와 Y에 대하여 ∂ 2 ∂x∂y F(x, y) f(x, y) = (3) fX(x) = d dx FX(x) , fY(y) = dy FY(y) (4)
(1) X와 Y 의 결합확률밀도함수 : f(x, y) = ? 결합분포함수 : F(x, y) = (1-e-x ) (1- e-y ) , 0 < x < ∞ , 0 < y < ∞ (1) X와 Y 의 결합확률밀도함수 : f(x, y) = ? (2) X와 Y 의 주변확률밀도함수 : fX(x) = ? , fY(y) = ? (3) P(1 < X ≤ 2 , 1 < Y ≤ 2) = ? (1) X와 Y 의 결합확률밀도함수 : ∂2 ∂x∂y f(x, y) = F(x, y) ∂2 ∂x∂y = (1 – e-x ) (1 – e-2y ) = (e-x) (2e-2y) = 2e-(x+2y) , 0 < x < ∞ , 0 < y < ∞ X와 Y 의 주변분포함수 : FX(x) = lim F(x, y) = lim (1 – e-x ) (1 – e-2y ) = 1 – e-x , 0 < x < ∞ FY(y) = lim F(x, y) = lim (1 – e-x ) (1 – e-2y ) = 1 – e-2y , 0 < y < ∞ y→∞ x→∞
(2) X와 Y의 주변확률밀도함수 : fX(x) = FX(x) = (1 – e-x) = e-x , 0 < x < ∞ d dx d dy d dy fY(y) = FY(y) = (1 – e-2y) = 2e-2y , 0 < y < ∞ (3) P(1 < X ≤ 2, 1 < Y ≤ 2) = F(2, 2) – F(1, 2) – F(2, 1) + F(1, 1) = (1 - e-2) (1 - e-4) - (1 - e-1) (1 - e-4) - (1 - e-2)2 - (1 - e-1) (1 - e-2) = 0.0272
결합확률질량함수 : 결합분포함수 : F(x, y) 0.10 0.15 0.04 2 0.30 0.05 1 0.01 3 Y X F(x, y) = P(X ≤ x, Y ≤ y ) 이므로 Y X 1 2 3 0.01 0.06 0.10 0.11 0.21 0.30 0.61 0.15 0.40 0.59 1.00
2 조건부 확률분포 조건부 확률분포, 확률변수의 독립성과 종속성 및 항등분포에 대하여 알아본다.
A = { X=x }, B = { Y=y } A∩B = { X = x, Y = y } 조건부 확률 Review P(A|B) = P(A∩B) P(B) , P(B) > 0 f(x, y) : 이산확률변수 X 와 Y의 결합확률질량함수 f(x, y) = P(X = x, Y = y) fX(x) : 이산확률변수 X 의 주변확률질량함수 fX(x) = P(X = x) fY(y) : 이산확률변수 Y 의 주변확률질량함수 fY(y) = P(Y = y) A = { X=x }, B = { Y=y } A∩B = { X = x, Y = y } P(A) = P(X=x) = fX(x) P(B) = P(Y=y) = fY(y) P(A∩B) = P(X=x, Y=y) = f(x, y) P(A∩B) f(x, y) P(B) fY(y) P(A|B)=P(X=x|Y=y) = =
▶ ▶ 조건부확률질량함수(conditional p.m.f.) : 이산확률변수 f(x, y) X와 Y에 대하여, P(Y = y) > 0일 때 를 Y=y일 때 X의 조건부확률질량함수라 하고, f(x|y)로 나타낸다. P(X=x|Y=y) = f(x, y) fY(y) f(y|x)= f(x, y) fX(x) X=x일 때 Y의 조건부확률질량함수 : ▶ 조건부확률밀도함수(conditional p.d.f.) : 연속확률변수 X와 Y에 대하여, fY(y) > 0일 때 f(x|y) = f(x, y) fY(y)
☞ 조건부 확률분포의 의미 P(X=x, Y=y) P(X=x) P(X=x,Y=y) P(Y=y) y x
S X와 Y의 결합확률질량함수 : (1) Y의 주변확률질량함수 : fY(y) = ? (2) Y=y인 X의 조건부확률질량함수 : f(x|y) = ? (3) Y=2인 X의 조건부확률질량함수 : f(x|y=2) = ? (4) 조건부 확률 : P(X=3|Y=2) = ? 0 , 다른 곳에서 f (x, y) = , x = 1, 2, 3, y = 1, 2, 3 x + y 36 fY(y) = S x=1 3 f(x, y) = x + y 36 = y + 2 12 , y = 1, 2, 3 (1) f(x|y) = f(x, y) fY(y) (x + y) /36 (y + 2) / 12 x + y 3(y + 2) = , x = 1, 2, 3 (2) f(x|y = 2) = x + 2 12 , x = 1, 2, 3 (3) P(X=3|Y=2) = f(3|2) = 3 + 2 12 5 = (4)
☞ S 조건부 확률 구하는 방법 P(Y ∈ B|X = x) = f(y|x) = P(X = x, Y ∈ B) P(X = x) P(X ∈ A|Y = y) = x ∈ A f(x|y) P(X ∈ A, Y = y) P(Y = y)
P(Y ∈ B|X = x) = = P(X = x, Y ∈ B) fX(x) P(X ∈ A|Y = y) = fY(y) f(y|x)dy c d f(x|y)dx a b
X, Y의 결합확률 : (1) X와 Y의 주변확률질량함수 (2) Y=2인 X의 조건부 확률질량함수 (3) Y=2인 조건 아래서 X=1 또는 X=3 일 확률 Y X 1 2 3 4 0.12 0.08 0.07 0.05 0.15 0.21 0.13 0.01 0.02 (1) X와 Y의 주변확률질량함수 : fX(x) = 0.32 , x = 1 0.57 , x = 2 0.11 , x = 3 Y X 1 2 3 4 fX(x) 0.12 0.08 0.07 0.05 0.32 0.15 0.21 0.13 0.57 0.01 0.02 0.11 fY(y) 0.24 0.30 0.25 1.00 fY(y) = 0.21 , y = 1 0.24 , y = 2 0.30 , y = 3 0.25 , y = 4
(2) Y=2인 X의 조건부 확률질량함수 : 조건부 확률질량함수의 정의로부터 f(x|y = 2) = f(x, 2) fY(2) 0.24 = , x = 1, 2, 3 f(1|y = 2) = = 0.333 0.08 0.24 X의 조건부 확률질량함수 : f(x|y) = 0.333 , x = 0 0.625 , x = 1 0.042 , x = 2 0 , 다른 곳에서 f(2|y = 2) = = 0.625 0.15 0.24 f(3|y = 2) = = 0.042 0.01 0.24 (3) 구하고자 하는 확률 : P(X = 1 또는 X = 3|Y = 2) = f(1|y = 2) + f(3|y = 2) = 0.333 + 0.042 = 0.375
P(A|B)=P(X = x|Y = y) = f(x|y) 독립 사건 Review P(A) = P(A|B) , P(B) > 0 이산확률변수 X와 Y에 대하여 A = { X = x }, B = { Y = y } P(A) = P(X = x) = fX(x) P(A|B)=P(X = x|Y = y) = f(x|y) f(x|y) = fX(x) ?
▶ ☞ 독립(independent) : 임의의 실수 x와 y에 대하여, 독립 확률변수의 성질 fX(x) > 0, fY(y) > 0일 때 fX(x) = f(x|y) 또는 fY(y) = f(y|x) 이면, 두 확률변수 X와 Y를 독립이라 하고, 독립이 아닌 경우에 종속(dependent)이라 한다. ☞ 독립 확률변수의 성질 확률변수 X와 Y가 독립이면, f(x, y) = fX(x) fY(y)
[ ] 결합확률밀도함수 : f(x, y)=6xy2 , 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 (1) X의 주변확률밀도함수 : fX(x) = ? (2) Y=1/2인 조건 아래서 X의 조건부 확률밀도함수 : f (x|y=1/2) = ? (3) Y=1/2인 조건 아래서 확률 : P(1/2 ≤ X ≤ 1) = ? (4) X와 Y의 독립성 (1) X의 주변확률밀도함수 : (2) Y의 주변확률밀도함수 : fY(y) = f(x, y) dx = 6xy2 dx = (3y2)x2 = 3y2 , 0 ≤ y ≤ 1 -∞ ∞ x=0 1 [ ] fX(x) = f(x, y) dy = 6xy2 dy = (2x)y3 = 2x , 0 ≤ x ≤ 1 y=0
( ) fY(1/2)=3/4이므로 Y=1/2인 조건 아래서 X의 조건부 확률밀도함수 : f(x|y = ½) = = 2x , 0 ≤ x ≤ 1 (3/2)x 3/4 P ≤ X ≤ 1|Y = = 1 2 ( ) P ≤ X ≤ 1 , Y = fY(1/2) 1/2 = 2x dx = x2 = 3 4 (3) (4) 모든 0 ≤ x ≤ 1에 대하여 fX(x) = 2x = f(x|y = 1/2) X와 Y는 독립
[ ] ( ) [ ] 다음 결합분포에 대한 X와 Y의 독립성 (1) f(x, y) = x + y , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 (2) f(x, y) = 2e-(x+2y) , x > 0, y > 0 (3) 1/8, (x, y) = (0, 3), (3, 0) 3/8, (x, y) = (1, 2), (2, 1) 0 , 다른 곳에서 f(x, y) = (1) X와 Y의 주변확률밀도함수 : ∞ 1 2 fX(x) = f(x, y) dy = (x + y) dy = xy + y2 = x + , 0 ≤ x ≤ 1 -∞ y=0 [ ] 모든 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1에 대하여 1 2 f(x, y) = x + y ≠ fX(x) fY(y) = x + y + ( ) • 1 2 fY(y) = f(x, y) dx = (x + y) dx = x2 + xy = y + , 0 ≤ y ≤ 1 -∞ ∞ x=0 [ ] X와 Y는 종속
f(x, y) =2e-(x+2y) = fX(x) fY(y) , x > 0, y > 0 fX(x) = 2e-(x+2y) dy = e-x e-2y = e-x , x > 0 ∞ y=0 [ ] fY(y) = 2e-(x+2y) dx = 2e-2y e-x = 2e-2y , y > 0 x=0 X와 Y는 독립 (3) X와 Y의 주변확률질량함수 : 1/8, x = 0, 3 3/8, x = 1, 2 0 , 다른 곳에서 fX(x) = 1/8, y = 0, 3 3/8, y = 1, 2 fY(y) = f(1, 1) = 0 ≠ fX(x) fY(y) = 1 8 64 • = X와 Y는 종속
▶ 쌍마다 독립(pairwisely independent) : 임의의 실수 x, y,z에 대하여, fX(x) > 0, fY(y) > 0, fZ(z)일 때 f(x, y) = fX(x) fY(y), f(y, z) = fY(y) fZ(z) , f(x, z) = fX(x) fZ(z) 이면, 확률변수 X, Y와 Z를 쌍마다 독립이라 하고, f(x, y, z) = fX(x) fY(y) fZ(z) 이면 독립이라 한다.
f(x, y, z) = fX(x) fY(y) fZ(z) f(x, y, z) = 6e-(x+2y+3z) , x > 0, y > 0, z >0에 대하여, 확률변수 X, Y, Z의 독립성 조사 예 (X, Y), (Y, Z), (X, Z)의 j.p.d.f. : X, Y, Z의 m.p.d.f. : fX(x) = e-x , x > 0 fY(y) = 2e-2y , y > 0 fZ(z) = 3e-3z , z > 0 f(x, y) = 2e-(x+2y) , x > 0, y > 0 f(y, z) = 6e-(2y+3z) , y > 0, z > 0 f(x, z) = 3e-(x+3z) , x > 0, z > 0 f(x, y, z) = fX(x) fY(y) fZ(z) X, Y와 Z : 독립 f(x, y) = fX(x) fY(y), f(y, z) = fY(y) fZ(z) , f(x, z) = fX(x) fZ(z) X, Y와 Z : 쌍마다 독립
( ) ( ) 정리 1 임의의 두 확률변수 X와 Y에 대하여 다음은 동치이다. (1) X, Y : 독립 (2) 모든 x, y에 대하여 F(x, y) = FX(x) FY(y) (3) P(a < X ≤ b, c < Y ≤ d ) = P(a < X ≤ b ) P(c < Y ≤ d ) 증명 X와 Y가 연속확률변수인 경우 (1) (2) -∞ y x -∞ y x F(x, y) = f(u, v)dvdu = fX(u)fY(v)dvdu = fX(u) fY(v)dv du = fX(u) FY(y)du -∞ x y ( ) = FY(y) fX(u)du = FX(x)FY(y) (2) (1) ∂2 ∂x ∂y f(x, y) = F(x, y) = FX(x)FY(y) = FX(x) FY(y) = FX(x)fY(y) ∂ ∂x ∂y ( ) = fY(y) FX(x) = fX(x)fY(y)
(1) X, Y : 독립 식 (3)이 성립 P(a < X ≤ b, c < Y ≤ d ) = F(b, d) – F(a, d) – F(b, c) + F(a, c) 이고, X, Y가 독립이면, F(x, y) = FX(x) FY(y)이므로 P(a < X ≤ b, c < Y ≤ d ) = FX(b)FY(d) – FX(a)FY(d) – FX(b)FY(c) + FX(a)FY(c) = (FX(b) - FX(a)) (FY(d) - FY(c)) = P(a < X ≤ b ) P(c < Y ≤ d ) 식 (3)이 성립 X, Y : 독립 a, b, c, d가 임의의 수이므로 a = -∞ , c = -∞ , b = x, d = y라 하면, F(x, y) = P(a < X ≤ b, c < Y ≤ d ) = P(a < X ≤ b ) P(c < Y ≤ d ) = FX(x) FY(y) 이고, 따라서 X와 Y는 독립이다.
S ( ) S ( ) 두 도시의 교통사고 건수 X와 Y의 결합확률함수 : (1) X와 Y의 주변확률함수 : (3) 두 도시의 교통사고 건수가 각각 1을 초과하지 못할 확률 : 2x3y e-5 (x!)(y!) , x = 0, 1, 2, …, y = 0, 1, 2, … f(x, y) = (1) X와 Y의 주변확률질량함수 : ( ) S y=0 ∞ fX(x) = f(x, y) = 2x3y (x!) (y!) e-5 = 2x x! e-5 3y y! = e-5 (e3) = e-2, x = 0, 1, 2, … ( ) S x=0 ∞ fY(y) = f(x, y) = 2x3y (x!) (y!) e-5 = 3y y! e-5 2x x! = e-5 (e2) = e-3, y = 0, 1, 2, …
(3) X와 Y가 독립이므로 P(X≤ 1, Y≤ 1)= P(X≤ 1) P(Y≤ 1)이고, 2x3y e-5 2x e-2 x! 3y e-3 y! • f (x, y) = = fX(x, y) fY(x, y) = (x!)(y!) X, Y : 독립 (3) X와 Y가 독립이므로 P(X≤ 1, Y≤ 1)= P(X≤ 1) P(Y≤ 1)이고, 20 0! 21 1! P(X ≤ 1) = e-2 + e-2 = 0.4060 P(X≤ 1, Y≤ 1) =(0.406)•(0.1991) = 0.08080 30 0! 31 1! P(Y ≤ 1) = e-3 + e-3 = 0.1991
fX(x) = fY(x) = fZ(x) = e-x ▶ 항등분포(identical distribution) : 임의의 실수 x에 대하여 fX(x) = fY(x) 일 때, 확률변수 X와 Y는 항등분포를 이룬다 하고, 항등적으로 독립인 분포를 이루는 확률변수를 간단히 i.i.d(independently, identically distributed)로 나타낸다. 예 f(x, y, z) = e-(x+y+z) , x > 0, y > 0, z >0에 대하여, 확률변수 X, Y, Z의 항등적인 독립성 조사 fX(x) = e-x , x > 0 fY(y) = e-y , y > 0 fZ(z) = e-z , z > 0 fX(x) = fY(x) = fZ(x) = e-x X, Y, Z : i.i.d
X와 Y의 결합분포함수 : F(x, y) = (1-e-2x)(1-e-3y) , x >0 , y >0 X와 Y는 i.i.d. ? X와 Y의 결합밀도함수와 주변밀도함수 : f(x, y) = F(x, y) = 6e-(2x+3y) , 0 < x < ∞, 0 < y < ∞ ∂2 ∂x ∂y fX(x) = 6e-(2x+3y) dy = 2e-2x , 0 < x < ∞ ∞ fY(y) = 6e-(2x+3y) dx = 3e-3y , 0 < y < ∞ 모든 x >0 , y >0에 대하여 f(x, y) = fX(x) fY(y) X, Y : 독립 X, Y : i.i.d. 가 아니다. 모든 x >0 에 대하여 fX(x) = 2e-2x≠ fY (x) = 3e-3x X, Y : 항등분포가 아니다.
X와 Y의 결합확률함수 : X와 Y : i.i.d. ? 1/8, (x, y) = (0, 3), (3, 0) 3/8, (x, y) = (1, 2), (2, 1) 0 , 다른 곳에서 f(x, y) = X와 Y의 주변확률질량함수 : 1/8, x = 0, 3 3/8, x = 1, 2 0 , 다른 곳에서 1/8, y = 0, 3 3/8, y = 1, 2 0 , 다른 곳에서 fY(y) = fX(x) = 예제 4에서 X, Y : 종속 X, Y : i.i.d.가 아니다. 모든 x =0, 1, 2, 3 에 대하여 fX(x) = fY (x) X, Y : 항등분포
3 결합분포에 대한 기대값 결합분포의 기대값과 공분산, 상관관계 등에 대하여 알아본다.
☞ S S 2변량 확률변수의 함수 u(X, Y)의 기대값 확률변수의 함수에 대한 기대값 Review 확률변수의 함수 Y = g(X)의 기대값 : E(Y) = E[g(X)] = S x g(x) f(x) -∞ ∞ g(x) f(x)dx ☞ 2변량 확률변수의 함수 u(X, Y)의 기대값 f(x, y) : X와 Y의 결합확률함수 u(x, y) : X와 Y의 함수 S 모든 y u(x, y) f(x, y) -∞ ∞ u(x, y) f(x, y)dydx E[u(X, Y)] = 모든 x , (X, Y) : 이산확률변수인 경우 , (X, Y) : 연속확률변수인 경우
E[au(X, Y ) + bv(X, Y )] = aE[u(X, Y )] + bE[v(X, Y)] ☞ 2변량 기대값의 성질 E[au(X, Y ) + bv(X, Y )] = aE[u(X, Y )] + bE[v(X, Y)] S 모든 x S 모든 y mX = E(X) = x f(x, y) X의 기대값 : S 모든 x [ ] S 모든 y S 모든 x = x f(x, y) = x fX(x) -∞ ∞ mX = x f(x, y)dydx = x fX(x)dx S 모든 y 모든 x = (x - mX)2 f(x, y) = (x - mX)2 fX(x) [ ] sX = E[(X - mX)2] = (x - mX)2 f(x, y) 2 -∞ ∞ sX = (x - mX)2 f(x, y)dydx = (x - mX)2 fX(x)dx X의 분산 :
S S 결합확률질량함수 : (1) E(X) = ? (2) E(Y) = ? (3) E(X + Y) = ? 0.09 0.07 0.05 0.04 2 0.10 1 0.15 0.11 0.08 3 Y X mX = E(X) = x f(x, y) S x=0 2 y=0 3 = 0•(0.08) + 0•(0.10) + 0•(0.11) + 0•(0.15) + 1•(0.05) + 1•(0.07) + 1•(0.09) + 1•(0.10) + 2•(0.04) + 2•(0.05) + 2•(0.07) + 2•(0.09) = 0.81 mY = E(Y) = y f(x, y) S x=0 2 y=0 3 = 0•(0.08) + 0•(0.05) + 0•(0.04) + 1•(0.10) + 1•(0.07) + 1•(0.05) + 2•(0.11) + 2•(0.09) + 2•(0.07) + 3•(0.15) + 3•(0.10) + 3•(0.09) = 1.78
E(X + Y) = (x + y) f(x, y) S x=0 2 y=0 3 = 0•(0.08) + 1•(0.10) + 2•(0.11) + 3•(0.15) + 1•(0.05) + 2•(0.07) + 3•(0.09) + 4•(0.10) + 2•(0.04) + 3•(0.05) + 4•(0.07) + 5•(0.09) = 2.59 E(X Y) = xy f(x, y) S x=0 2 y=0 3 = 0•(0.08) + 0•(0.10) + 0•(0.11) + 0•(0.15) + 0•(0.05) + 1•(0.07) + 2•(0.09) + 3•(0.10) + 0•(0.04) + 2•(0.05) + 4•(0.07) + 6•(0.09) = 1.47
[ ] ( ) S 정리 2 임의의 두 확률변수 X와 Y가 독립이면. 다음이 성립한다. E(X Y ) = E(X ) E(Y ) X와 Y가 이산확률변수인 경우 : 증명 S 모든 y E(X Y) = xy f(x, y) = xy fX(x)fY(y) 모든 x = x fX(x) y fY(y) = E(X)E(Y) [ ] X와 Y가 연속확률변수인 경우 : E(X Y) = xy f(x, y)dydx = xy fX(x)fY(y)dydx = xfX(x)dx yfY(y)dy = E(X)E(Y) ( ) -∞ ∞ 정리 2의 역은 성립하지 않는다. 주 의
( ) 결합확률밀도함수 : f(x, y) = 6xy2 , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 E(X), E(Y ), E(X Y ) = ? E(X Y ) = E(X)E(Y ) = ? X, Y 의 주변확률밀도함수 : fX(x) = 2x , 0 ≤ x ≤ 1 , fY(y) = 3y2 , 0 ≤ y ≤ 1 mX = xfX(x)dx = 2x2dx = x3 = 2 3 1 mY = yfY(y)dy = 3y3dy = y4 = 4 E(X Y) = xyf(x, y)dydx = 6x2y3dydx = 6x2 y4 dx = x2 dx = x3 = ( ) E(X Y ) = E(X)E(Y)가 성립한다.
결합밀도함수 : E(X), E(Y ), E(X Y ) = ? X, Y의 독립성 ? f(x, y) = 4 f(x, y) = , -1 ≤ x ≤ 1, -1 ≤ y ≤ 1 X, Y 의 주변확률밀도함수 : -1 1 1 + xy(x2 – y2) 4 1 2 fX(x) = dy = , -1 ≤ x ≤ 1 -1 1 1 + xy(x2 – y2) 4 1 2 fY(y) = dx = , -1 ≤ y ≤ 1 mY = dy = 0 y 2 mX = dx = 0 ; E(XY) = dydx = 0 1 + xy(x2 – y2) 4 -1 1 E(XY ) = E(X) E(Y ) f(x, y) = ≠ fX(x) fX(x) = 1 4 1 + xy(x2 – y2) X, Y는 독립이 아니다.
Cov(X, Y) = E[(X – mX ) (Y – mY )] ▶ 공분산(covariance) : mX=E(X), mY=E(Y)에 대하여 E[(X – mX ) (Y – mY )] 을 공분산이라 하고, Cov(X, Y)로 나타낸다. Cov(X, Y) = E[(X – mX ) (Y – mY )] (x – mX ) (y – mY ) f(x, y) , (X, Y) : 이산형인 경우 (x – mX ) (y – mY ) f(x, y)dxdy , (X, Y) : 연속형인 경우 = S 모든 x 모든 y -∞ ∞ ☞ 공분산의 간편 계산 방법 Cov(X, Y) = E[(X – mX) (Y - mY)] = E(X Y - mXY - mYX + mX mY) = E(X Y) - mXE(Y) - mYE(X) + mY mY = E(X Y) - mY mY
☞ 공분산의 성질 (1) Cov(X, Y ) = E(X Y ) - mX mY (2) X, Y가 독립이면, Cov(X, Y ) = 0 (역은 성립하지 않는다) (3) Cov(X, X ) = Var(X) (4) Cov(aX + b, cY + d ) = ac Cov(X, Y ) (5) Var(X + Y ) = Var(X) + Var(Y ) +2 Cov(X, Y ) (6) Var(X - Y ) = Var(X) + Var(Y ) -2 Cov(X, Y ) (7) X, Y가 독립이면, Var(X + Y ) = Var(X) + Var(Y ) Var(X - Y ) = Var(X) + Var(Y ) Var(X + Y) = E[{(X + Y) – (mX + mY)}2] = E[(X - mX)2 + 2(X - mX)(Y - mY) + (Y - mY)2 ] = E[(X - mX)2 ] + 2E[(X - mX)(Y - mY) ] + E[(Y - mY)2] = Var(X) + Var(Y) + 2Cov(X, Y)
( ) ( ) ( ) ( ) 결합밀도함수 : f(x, y) = x+y, 0 ≤ x ≤ 1 , 0 ≤ y ≤ 1 (2) E(X+Y ), Var(X+Y ) (1) X와 Y의 주변확률밀도함수 : fX(x) = x + , 0 ≤ x ≤ 1 ; fY(y) = y + , 0 ≤ y ≤ 1 1 2 1 2 ( ) 1 E(X) = x x + dx = x2+ dx = x3 + x2 = 2 x 3 4 ( ) 7 12 ( ) E(Y) = y y + dy = y2+ dy = y3 + y2 = y y=0 E(XY) = xy(x + y)dydx = x xy2 + y3 dx ( ) = x x + dx = Cov(X, Y) = E(XY) - mX mY = - • = - 1 3 7 12 144
( ) ( ) ( ) ( ) ( ) E(X + Y) = E(X) + E(Y) = + = 7 12 E(X + Y) = E(X) + E(Y) = + = 6 ( ) 1 E(X2) = x2 x + dx = x3+ dx = x4 + x3 = 2 x2 4 ( ) ( ) 5 E(Y2) = y2 y + dy = y3+ dy = y4 + y3 = y2 (2) X와 Y의 분산 : ( ) Var(X) = E(X2) – E(X)2 = - = 7 12 11 144 5 2 ( ) Var(Y) = E(Y2) – E(Y)2 = - = 7 12 11 144 5 2 X+Y의 분산 : 5 36 Var(X + Y) = Var(X) + Var(Y) + 2Cov(X, Y) = + - = 11 144 2
▶ ☞ 상관계수(correlation coefficient) : 두 확률변수 사이의 상관계수의 특징 상호 종속관계를 나타내는 계수 Cov(X, Y ) sX sY r = Corr(X, Y ) = r > 0인 경우 r < 0인 경우 r = 0인 경우 상관계수의 특징 ☞ -1 ≤ r ≤ 1
☞ 상관계수의 성질 r = 1인 경우 r = -1인 경우 (1) E(X Y) = mX mY + rXY sX sY (2) Corr(aX+b, cY+d ) = Corr(X, Y ) -Corr(X, Y ) , ac > 0 인 경우 , ac < 0 인 경우
공정한 동전을 3번 던지는 실험 X : 처음 두 번에서 앞면이 나오는 개수 Y : 세 번째에서 앞면이 나오는 개수 (1) Cov(X, Y) = ? (2) rXY = ? (3) E(X+Y ) = ?, Var(X+Y ) = ? 표본공간 HHH HHT HTH THH HTT THT TTH TTT X 2 1 Y 확 률 1/8 X와 Y의 결합질량함수 : f(x, y) = 1/8 , (x, y) = (0, 0), (0, 1), (2, 0), (2, 1) 2/8 , (x, y) = (1, 0), (1, 1) 0 , 다른 곳에서
Cov(X, Y) = E(XY ) – E(X)E(Y ) = 0 fX(x) = 1/4 , x = 0, 2 1/2 , x = 1 0 , 다른 곳에서 fY(y) = 1/2 , y = 0, 1 0 , 다른 곳에서 (1) Cov(X, Y) : S 모든 (x,y) E(XY) = xyf(x, y) = 2•1• + 1•1• = 1 8 2 모든 x E(X) = xfX(x) = 1• + 2• = 1 4 모든 y E(Y) = yfY(y) = 1• = Cov(X, Y) = E(XY ) – E(X)E(Y ) = 0
S (2) rXY : X2, Y2의 기대값 : E(X2) = x2fX(x) = 1• + 4• = E(Y2) = y2fY(y) = 1• = 3 X2, Y2의 기대값 : 3 2 1 2 X, Y의 분산 : Var(X) = E(X2) - E(X)2 = - 1 = sX = 1 / sY = 1/2 1 2 1 4 1 4 Var(Y) = E(Y2) - E(Y)2 = - = Cov(X, Y ) sX sY rXY = = 0 3 2 (3) E(X+Y ) = E(X) + E(Y) = 3 4 Var(X+Y ) = Var(X) + Var(Y) + 2Cov(X, Y) =
제 3 장