확 률 변 수 2 1 이산확률변수 2 연속확률변수 3 기대값
1 이산확률변수 이산확률변수, 확률질량함수와 분포함수의 의미를 알아본다.
▶ ▶ R S 확률변수(random variable) : 표본공간을 이루는 실험 결과를 실수로 대응시키는 함수 X w X(w) S R X ▶ 상태공간(state space) : 확률변수 X가 취하는 모든 실수들의 집합
예 X : 주사위를 두 번 반복하여 던지는 게임에서 두 눈의 합 주사위를 두 번 반복하여 던질 때, 상태공간 표본공간 S SX = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
예 X : 동전을 두 번 반복하여 던지는 게임에서 그림이 나온 횟수 동전을 두 번 반복하여 던질 때, 상태공간 표본공간 S = {(그림, 그림), (그림, 숫자), (숫자, 그림), (숫자, 숫자)} X의 상태공간 : SX = {0, 1, 2}
예 X : “1”의 눈이 나올 때까지 주사위를 던진 횟수 “1”의 눈이 나올 때까지 주사위를 던진 횟수에 대한 상태공간 표본공간 X의 상태공간 : SX = {1, 2, 3, 4, 5, … }
▶ 이산확률변수(discrete random variable) : 상태공간이 유한집합이거나 셈할 수 있는 무한집합인 확률변수 X X : 동전을 두 번 반복하여 던지는 게임에서 그림이 나온 횟수 SX = {0, 1, 2} X : 주사위를 두 번 반복하여 던지는 게임에서 두 눈의 합 SX = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} X : “1”의 눈이 나올 때까지 주사위를 던진 횟수 SX = {1, 2, 3, 4, 5, … }
X : 주사위를 두 번 반복하여 던지는 게임에서 두 눈의 합 P(X=12)=P(A11)=1/36 A11 ={(6,6)} X=12 P(X=11)=P(A10)=2/36 A10 ={(5,6), (6,5)} X=11 P(X=10)=P(A9)=3/36 A9 ={(4,6), (5,5), (6,4)} X=10 P(X=9)=P(A8)=4/36 A8 ={(3,6), (4,5), (5,4), (6,3)} X=9 P(X=8)=P(A7)=5/36 A7 ={(2,6), (3,5), (4,4), (5,3), (6,2)} X=8 P(X=7)=P(A6)=6/36 A6 ={(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)} X=7 P(X=6)=P(A5)=5/36 A5 ={(1,5), (2,4), (3,3), (4,2), (5,1)} X=6 P(X=5)=P(A4)=4/36 A4 ={(1,4), (2,3), (3,2), (4,1)} X=5 P(X=4)=P(A3)=3/36 A3 ={(1,3), (2,2), (3,1)} X=4 P(X=3)=P(A2)=2/36 A2 ={(1,2), (2,1)} X=3 P(X=2)=P(A1)=1/36 A1 ={(1,1)} X=2
▶ 확률질량함수(probability mass function) : 상태공간 안에 있는 xi에 대하여 확률 pi를 대응시키고, 상태공간 안에 있지 않는 x에 대하여 0으로 대응시키는 함수 f(x) = 1 36 2 3 4 5 6 , x = 2, 12 , x = 3, 11 , x = 4, 10 , x = 5, 9 , x = 6, 8 , x = 7 , 다른 곳에서 f(xi) = P(X = xi) , xi SX 0 , xi SX pi , xi SX 0 , xi SX = X : 주사위를 두 번 반복하여 던지는 게임에서 두 눈의 합에 대한 확률질량함수
▶ ☞ f(x) = 1 확률분포(probability distribution) : 확률변수 X에 대응 확률질량함수의 성질 하는 확률들의 집합 {pi : pi = P(X = xi), xi SX } ☞ 확률질량함수의 성질 f(x) ≥ 0 f(x) = 1
확률변수 X가 취할 수 있는 값 1, 2, 3에 대하여, P(X = 1) = 0.3, P(X = 2) = 0.35 확률질량함수를 f(x)라 하고, P(X = 3) = k라 하면 0.3 , x = 1 0.35, x = 2 k , x = 3 f(x) = 확률질량함수의 성질 (2)에 의하여 f(1) + f(2) + f(3) = 1 P(X = 3) = f(3) = 1- f(1) - f(2) = 1 - 0.3 - 0.35 = 0.35
☞ 확률을 구하는 방법 P(XB) = S f(x) 주사위를 두 번 반복하여 던질 때, 두 눈의 합이 5이상 8이하일 확률 ? 게임에서 두 눈의 합 5 ≤ X ≤ 8 구하고자 하는 확률 P(5 ≤ X ≤ 8) = f(5) + f(6) + f(7) + f(8) 4 5 6 36 + =
X : 동전을 두 번 던지는 실험에서 앞면이 나온 횟수 X를 앞면이 나온 횟수라 하면, X가 취하는 값 : 0, 1, 2 X = 0 A = {TT} X = 1 B = {HT, TH} X = 2 C = {HH} 확률질량함수 f(x) = 1 4 2 , x = 0, 2 , x = 1 , 다른 곳에서 확률 표 X 1 2 P(X=x) 1/4 1/2 1/4
▶ 확률히스토그램(probability histogram) : 확률변수 X가 취하는 값 x를 중심으로 밑면의 길이가 1이고 높이가 확률 f(x)인 사각형으로 이루어진 그림 동전을 두 번 던지는 실험에서 앞면이 나온 횟수에 대한 확률히스토그램
남자아이와 여자아이가 태어날 확률이 동일하다 할 때, 세 명의 자녀를 둔 가족에 대하여 여자아이의 수를 X라 한다. (1) X의 확률질량함수 f(x) = ? (2) 여자아이가 적어도 두 명 이상일 확률. (3) X의 확률 히스토그램. (1) b : 남자 아이, g : 여자 아이 표본공간 : S = {(b,b,b), (b,b,g), (b,g,b), (g,b,b), (b,g,g), (g,b,g), (g,g,b), (g,g,g)} 각 표본점에 대한 확률은 동등하게 1/8 X : 여자 아이 수 f(x) = 1 8 3 , x = 0, 3 , x = 1, 2 , 다른 곳에서 X = 0 {(b,b,b)} X = 1 {(b,b,g), (b,g,b), (g,b,b)} X = 2 {(b,g,g), (g,b,g), (g,g,b)} X = 3 {(g,g,g)}
(2) 여자아이가 적어도 두 명 이상일 사건 : {X ≥ 2} = {X = 2 or X = 3} P(X ≥ 2) = P(X = 2) + P(X = 3) 3 1 8 2 + = (3) 확률히스토그램
주사위를 반복하여 두 번 던지는 게임에 대하여, 두 눈의 차 : X (1) X의 확률 표와 확률질량함수 f(x) = ? (2) 두 눈의 차이가 “1” 이하이면 이긴다고 할 때, 이 게임에서 이길 확률 (1) 주사위를 두 번 던져서 나온 눈의 수 : (i, j), i, j = 1,2,3,4,5,6 X = |i – j|, i, j = 1,2,3,4,5,6 SX = {0, 1, 2, 3, 4, 5} 확률변수 : 상태공간 : X = 0 A0 = { (1,1), (2,2), (3,3), (4,4), (5,5), (6,6)} X = 1 A1 = {(1,2), (2,1), (2,3), (3,2), (3,4), (4,3 ), (4,5), (5,4), (5,6), (6,5)} X = 2 A2 = {(1,3), (3,1), (2,4), (4,2), (5,3), (3,5), (6,4), (4,6)} X = 3 A3 = {(1,4), (4,1), (2,5), (5,2), (3,6), (6,3)} X = 4 A4 = {(1,5), (5,1), (2,6), (6,2)} X = 5 A5 = {(1,6), (6,1)}
6 36 P(A0) = 각 사건에 대한 확률 : 10 36 P(A1) = 8 36 P(A2) = 6 36 P(A3) = 4 36 P(A4) = 2 36 P(A5) = 확률 표 : P(X = x) 5 4 3 2 1 X 6 18 9 확률질량함수 : f(x) = 1 6 5 18 2 9 , x = 0, 3 , x = 1 , x = 2 , x = 4 , x = 5 , 다른 곳에서 (2) 두 눈의 차이가 “1” 이하인 사건: {X ≤ 1} = {X = 0 or X = 1} P(X ≤ 1) = f(0) + f(1) = 1 6 5 18 4 9 = +
▶ 분포함수(distribution function) : x를 넘지 않는 모든 실수 u에 대하여 확률 f(u) = P(X = u)를 합한 누적확률 ▶ F(x) = P(X ≤ x) = S f(u) u≤ x X : 동전을 두 번 반복하여 던지는 게임에서 앞면이 나온 횟수 X의 분포함수 F(x) 예 X < 0 에 대하여 u ≤ x 이면 f(u)=0 P(X ≤ x) = S f(u) = 0 u≤ x
P(X ≤ x) = S f(u) = f(0) + f(1) 0≤ x< 1 에 대하여 u≤ x 이면 f(0)=1/4, f(u)=0 1 4 P(X ≤ x) = S f(u) = f(0) = u≤ x 1≤ x< 2 에 대하여 u≤ x 이면 f(0)=1/4, f(1)= 1/2, f(u)=0 P(X ≤ x) = S f(u) = f(0) + f(1) u≤ x 1 4 1 2 3 4 = + = x ≥ 2 에 대하여 u≤ x 이면 f(0)=1/4, f(1)= 1/2, f(2)=1/4, f(u)=0 P(X ≤ x) = S f(u) = f(0) + f(1) + f(2) u≤ x 1 4 1 2 1 4 = + + = 1
X의 분포함수 : 1 4 3 , 0 ≤ x < 1 , 1 ≤ x < 2 , x ≥ 2 , x < 0 F(x) = P(X≤ x) = 불연속 점과 확률의 관계 : P(X = x) = F(x) – F(x-) x = 2 x = 1 x = 0 점프크기 불연속 점 1 4 2 X = 2 X = 1 X = 0 P(X = x) 확률변수 X = x
예제 3에서, X의 분포함수 F(x)와 분포함수의 그림 1 8 3 , x = 0, 3 , x = 1, 2 , 다른 곳에서 f(x) = X의 확률질량함수 : x < 0 이면, F(x) = P(X ≤ x) = 0 1 8 0 ≤ x < 1 이면, F(x) = P(X ≤ x) = f(0) = 1 ≤ x < 2 이면, F(x) = P(X ≤ x) = f(0) + f(1) 1 8 3 8 1 2 = + = 2 ≤ x < 3 이면, F(x) = P(X ≤ x) = f(0) + f(1) + f(2) 1 8 3 8 3 8 7 8 = + + =
3 ≤ x 이면 , F(x) = P(X ≤ x) = f(0) + f(1) + f(2) + f(3) = 1 , x < 0 1 8 , 0 ≤ x < 1 1 2 , 1 ≤ x < 2 F(x) = 7 8 , 2 ≤ x < 3 1 , x ≥ 3
X의 분포함수 : 0 , x < 10 0.30 , 10 ≤ x < 20 0.75 , 20 ≤ x <30 1.00 , 30 ≤ x F(x) = X의 확률질량함수 f(x) = ? X의 분포함수는 x = 10, 20, 30에서 점프불연속이고, 각 점프크기 : p1 = F(10) – F(10-) = 0.3 – 0 = 0.3 p2 = F(20) – F(20-) = 0.75 – 0.3 = 0.45 p3 = F(30) – F(30-) = 1 – 0.75 = 0.25 0.3, x = 10 0.45, x = 20 0.25, x = 30 0 , 다른 곳에서 f(x) =
☞ 분포함수를 이용한 확률을 구하는 방법 (1) P(a < X ≤ b) = P(X ≤ b) – P(X ≤ a) = F(b) - F(a) (2) P(a ≤ X ≤ b) = F(b) - F(a) + P(X = a) (3) P(a ≤ X < b) = F(b) - F(a) - P(X = b) + P(X=a) (4) P(a < X < b) = F(b) - F(a) – P(X = b)
예제 6에서, P( 5 < X ≤ 15) = ? P(15 ≤ X ≤ 25) = ? 분포함수와 질량함수가 0 , x < 10 0.30 , 10 ≤ x < 20 0.75 , 20 ≤ x <30 1.00 , 30 ≤ x F(x) = 0.3, x = 10 0.45, x = 20 0.25, x = 30 0 , 다른 곳에서 f(x) = 이므로 P( 5 < X ≤ 15) = F(15) – F(5) = 0.3 – 0 = 0.3 P(15 ≤ X ≤ 25) = F(25) – F(15) + P(X=15) = 0.75 - 0.3 + 0 = 0.45
2 연속확률변수 연속확률변수, 확률밀도함수에 관한 개념, 연속확률변수의 분포함수와 확률의 기하학적 의미, 확률밀도함수와 분포함수 사이의 관계 등에 대하여 알아본다.
▶ ▶ 연속확률변수(continuous random variable) : 확률변수 X가 취하는 값이 구간으로 나타나는 확률변수 새로 교체된 전구의 수명 : 상태공간 SX = { x : x ≥ 0 } 하루 동안의 온도 변화 : 상태공간 SX = { x : -20 ≤ x ≤ 40 } ▶ 확률밀도함수(probability density function) : 연속확률변수 X에 대하여 다음 조건을 만족하는 함수 f(x) f(x) ≥ 0, for all x f(x)dx = 1 SX
☞ 확률을 구하는 방법 f(x) : p.d.f. P(a < X ≤ b) = f(x)dx P(a≤ X ≤ b) 참 고 P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b) P(X=a) = P(a ≤ X ≤ a) = f(x)dx = 0 a
반도체 칩의 수명에 대한 확률밀도함수 (1) 칩의 수명이 6년 이하일 확률(수명의 기본 단위는 1년) (2) 수명이 5년에서 8년 사이일 확률 (3) 최소한 4년 이상 사용할 확률 (x+1) 2 , x ≥ 0 0 , x < 0 1 f(x) = 6 1 (x+1)2 P(X≤ 6) = dx 1 x+1 - 6 = - = 7 + 1
( ) P(5 ≤ X≤ 8) = dx - = - = 9 18 + 6 P(X ≥ 4) = 1 – P(X < 4) - 4 = 5 = 1 - + 1 ( ) (x+1)2 dx
▶ ☞ 분포함수(distribution function) : 임의의 실수 x에 대하여 분포함수의 기하학적 의미 확률 P(X ≤ x)를 연속확률변수의 분포함수라 한다. F(x) = P(X ≤ x) = f(u)du -∞ x ☞ 분포함수의 기하학적 의미
☞ 분포함수의 성질 (1) F(∞) = P ( X ≤ ∞) = 1 , lim F(x) = 1 (3) 모든 실수 x에 대하여 0 ≤ F(x) ≤ 1 (4) F(x)는 단조증가한다. (5) F(x)는 우측 연속이다. x → ∞ x → -∞ 연속확률변수의 경우, (6) F(x) = f(x) (7) P(a < X ≤ b) = P(a ≤ X ≤ b) =P(a ≤ X < b) = P(a < X < b) = F(b) – F(a) d dx
예제 1에 주어진 확률변수 X에 대한 분포함수 F(x) = ? x < 0 이면, F(x) = P( X ≤ x) = 0 x F(x) = P( X ≤ x) = 1 (u+1)2 u+1 - = 1 - du x+1
확률밀도함수 : 0 ≤ x ≤ 6에서 2등변 삼각형 (1) 확률밀도함수 : f(x) (2) 분포함수 : F(x) (3) 확률 P(2 < X ≤ 5) (1) 삼각형의 넓이가 1이므로 6• k• (1/2) = 1 ; k= 1/3 x 9 , 0 ≤ x < 3 x 9 2 3 확률밀도함수 : f(x) = - + , 3 ≤ x < 6 0 , 다른 곳에서 (2) x < 0 이면, f(x) = 0이므로 F(x) = 0 0 ≤ x < 3 이면, f(x) = x/ 9이므로 x u 9 du F(x) = = x2 18
3 ≤ x < 6 이면, 이므로 x 9 2 3 - + f(x) = x2 18 f(u) du = F(x) = = - u f(u) du = F(x) = = - u du + du x - 1 6 ≤ x 이면, 6 du = 1 분포함수 : F(x) = x2 18 2 3 - + x - 1 , 0 ≤ x < 3 , 3 ≤ x < 6 , x < 0 , x ≥ 6 1 (3) P(2 < X ≤ 5) = F(5) – F(2) = 17 18 4 13 - =
3 기대값 기대값과 평균의 의미, 분포의 중심위치 척도, 확률분포의 분산과 표준편차, Chebyshev 부등식의 의미 등에 대하여 알아본다.
예 [1, 2, 3, 4, 5, 6]의 평균 : x1 = 1 + 2 + 3 + 4 + 5 + 6 6 1 6 1 6 1 6 1 6 1 6 1 6 = 1 • + 2 • + 3 • + 4• + 5 • + 6 • = 3.5 X 1 2 3 4 5 6 P(X=x) 1 6 1 6 1 6 1 6 1 6 1 6 [1, 2, 2, 4, 4, 6]의 평균 : x2 = 1 + 2 + 2 + 4 + 3 + 6 6 = 1• + 2• + 4• + 6• 1 2 = 3.167 X 1 2 4 6 P(X=x) 1 6 2 6 2 6 1 6
▶ ☞ 가중평균(weighted mean) : 상대적인 중요성에 대한 적당 가중평균의 의미 한 허용치를 주기 위하여 일련의 가중치를 부여한 양들의 평균 가중평균의 의미 ☞ 중심의 위치 = 가중평균 수평 중심의 위치 > 가중평균 왼쪽으로 기울어짐 중심의 위치 < 가중평균 오른쪽으로 기울어짐
▶ 기대값(expected value) : 이산확률변수 X가 취할 수 있는 값 xi에 대하여 pi = P(X=xi )일 때, X의 가중평균 m = E(X) = S xi pi = S xi P(X=xi ) i 예 동전 두 번 던지는 실험에서 앞면이 나온 횟수 X의 기대값 확률질량함수 : f(x) = 1 4 2 0 , 다른 곳에서 , x = 1 , x = 0, 2 기대값 : E(X) = 0• + 1• + 2• = 1
컴퓨터의 고장에 대하여 서비스를 받을 때, 소요되는 비용과 그에 대한 확률 (1) 고장으로 인하여 소요되는 평균비용 (2) 확률 히스토그램에 위치를 표시 비 용 1 2 3 4 5 확 률 0.35 0.21 0.23 0.15 0.06 E(X) = 1•(0.35) + 2•(0.21) + 3•(0.23) + 4•(0.15) + 5•(0.06) = 2.36
☞ 연속확률변수의 기대값 E(X) = x f(x)dx , f(x) : X의 확률밀도함수 -∞ ∞ E(X) = x f(x)dx , f(x) : X의 확률밀도함수 확률밀도함수 : f(x) = e-x , 0 ≤ x < ∞ X의 기대값 = ? -∞ ∞ E(X) = x f(x)dx = xe-xdx = -(x+1)e-x = 1
참 고 모든 확률분포에 대하여 기대값이 존재하는 것은 아니다. 확률밀도함수 : f(x) = , -∞ < x < ∞ 1 p(1+x2) x = 0 을 중심으로 좌우대칭 x = 0 이 중심의 위치 그러나 이 분포는 기대값을 갖지 않는다
▶ ▶ ▶ 중앙값(median) : 확률변수 X의 분포함수 F(x)에 대하여 F(x0) =0.5를 만족하는 x0을 X의 중앙값이라 하고, Me로 나타낸다. 즉, 중앙값은 다음과 같다. P(X≤ Me) = P(X≥ Me) = 0.5 ▶ 최빈값(mode) : 확률변수 X의 확률함수 f(x)에 대하여 f(x0) =max { f(x) : x ∈ SX } 를 만족하는 x0을 X의 최빈값이라 하고, Mo로 나타낸다. ▶ 사분위수(quartiles) : 확률분포를 4등분하는 상태공간 안의 점 Q1, Q2, Q3 100p-백분위수(percentiles) : 확률변수 X의 분포함수 F(x)에 대하여 F(xp) =p, 0 < p < 1을 만족하는 xp
최빈값이 없는 경우 최빈값이 2개인 경우 중앙값이 하나인 경우 중앙값이 무수히 많은 경우 중앙값이 없는 경우 사분위수와 백분위수의 관계 : Q1 = x0.25 , Q2 = Me = x0.5 , Q3= x0.75
예제 2에 대하여 (1) 중앙값, 최빈값을 구하고, 평균과 비교 (2) 제1사분위수와 제3사분위수 확률밀도함수 : f(x) = e-x , 0 < x < ∞ 분포함수 : x F(x) = e-u du = - e-u = 1 – e-x , 0 < x < ∞ F(x0) = 1-e-x = 0.5 ; e-x = 0.5 ; x0 = Me = ln 2 = 0.693 x = 0 에서 f(0) = 1이 최대이므로 최빈값 : Mo = 1 F(q1) = 1-e-q = 0.25 ; e-q = 0.75 ; Q1 = ln (0.75) = 0.2876 F(q3) = 1-e-q = 0.75 ; e-q = 0.25 ; Q3 = ln (0.25) = 1.3863 1 3
Mo < Me < m m < Me < Mo m = Me = Mo 왼쪽으로 치우치고 오른쪽으로 긴 꼬리 모양을 갖는 경우 Mo < Me < m 오른쪽으로 치우치고 왼쪽으로 긴 꼬리 모양을 갖는 경우 m < Me < Mo m = Me = Mo 대칭형인 경우
☞ 확률변수의 함수에 대한 기대값 예 이산확률변수 X에 대하여 , x = -1, 1 Y = X2의 기대값 ? 확률질량함수 : f(x) = 1 4 2 0 , 다른 곳에서 , x = -1, 1 , x = 0 Y = X2의 기대값 ? Y = X2 상태공간 : SX = { -1, 0, 1 } SY = { 0, 1 } Y = 0 X = 0 동치관계 Y = 1 X = -1, 1
P(Y = 0) = P(X = 0) = P(Y = 1) = P(X = -1 또는 X = 1) 2 P(Y = 0) = P(X = 0) = P(Y = 1) = P(X = -1 또는 X = 1) = P(X = -1) + P(X = 1) = Y의 확률질량함수 : h(y) = 1 2 0 , 다른 곳에서 , y = 0, 1 1 2 Y = X2의 기대값 : E(Y) = 0• + 1• = 1 2 X -1 1 Y=X2 f(x) 1/4 1/2 x2f(x) x2f(x) = + 0 + = = E(Y) 1 2 x
☞ 기대값의 성질 (1) E(a) = a , a : 상수 (2) E(aX) = aE(X) , a≠0 : 상수 확률변수의 함수 Y = g(X)의 기대값 : X :이산확률변수인 경우 X : 연속확률변수인 경우 E(Y) = E[g(X)] = x -∞ ∞ g(x)f(x) g(x)f(x)dx ☞ 기대값의 성질 (1) E(a) = a , a : 상수 (2) E(aX) = aE(X) , a≠0 : 상수 (3) E(aX + b) = aE(X) + b, a≠0, a, b : 상수 (4) E[au(X) + bv(X)]= aE[u(X)] + bE[v(X)]
동전 두 번 던지기 게임 X : 앞면이 나온 횟수 E(X) = ? E(X2) = ? X의 확률질량함수 : , x = 0, 2 f(x) = 1 4 2 0 , 다른 곳에서 , x = 0, 2 , x = 1 1 4 E(X) = 0• + 1• + 2• = 1 2 E(X2) = 02• + 12• + 22• = 1.5
( ) 확률밀도함수 : 1 , 0 ≤ x < 4 4 E(X) = ? E(X2) = ? f (x) = , 다른 곳에서 , 다른 곳에서 f (x) = E(X) = ? E(X2) = ? 4 E(X2) = x2 dx = x3 = = 1 12 ( ) 64 16 3 E(X) = x dx = x2 = 2 8
▶ ☞ S 분산(variance) : 확률변수 X의 평균을 중심으로 분포의 밀집정도를 나타내는 척도. Var(X) 또는 s2 표준편차(standard deviation) : 분산의 양의 제곱근 S.D(X) 또는 s Var(X) = E[(X-m)2] = S x -∞ ∞ (x-m)2 f(x) , X :이산확률변수인 경우 (x-m)2 f(x)dx , X :이산확률변수인 경우 ☞ 분산의 간편 계산 방법 s2 = E[(X-m)2] = E(X2 -2mX + m2 ) = E(X2 ) -2 m E(X) + m2 = E(X2 ) - m2 , m = E(X)
※ 분산(표준편차)이 작을수록 평균에 집중하여 분포한다.
예제 4에서 주어진 이산확률변수 X의 분산과 표준편차 m = E(X) = 1 E(X2 ) = 1.5 s2 = E(X2 ) - m2 = 1.5 – 1 = 0.5 s = = 0.7071 예제 5에서 주어진 이산확률변수 X의 분산과 표준편차 s2 = E(X2 ) - m2 = – 22 = s = = 16 3 4 2 m = E(X) = 2 E(X2 ) = 16 3
☞ ☞ 분산의 성질 (1) Var(a) = 0 , a : 상수 (2) Var(aX) = a2Var(X) , a≠0 : 상수 (3) Var(aX + b) = a2Var(X), a≠0, a, b : 상수 ☞ 표준편차의 성질 (1) S.D(a) = 0 , a : 상수 (2) S.D(aX) = |a|S.D(X) , a≠0 : 상수 (3) S.D(aX+b) = |a|S.D(X), a≠0, a, b : 상수
( ) 확률밀도함수 : f(x) = 2x , 0 < x < 1 X와 Y = 3X + 1의 평균과 분산 1 E(X2) = 2x3 dx = 2 m = E(X) = 2x2 dx = 3 ( ) s2 = E(X2) - m2 = - = 18 Y = 3X + 1의 평균과 분산 : 2 3 E(Y) = 3E(X) + 1 = 3• + 1 = 3 1 18 1 2 Var(Y) = 9Var(X) = 9• =
☞ 표준화 확률변수 평균 m, 표준편차 s인 임의의 확률변수 X에 대하여 Z = X - m s mZ = 0, sZ = 1
예제 1의 서비스 비용 X에 대하여 확률히스토그램에 m - s와 m + s를 표시하고, 히스토그램을 이용한 확률 P(m - s ≤ X ≤ m + s) = ? 예제 1에서, 비용 1 2 3 4 5 확률 0.35 0.21 0.23 0.15 0.06 E(X) = 1•(0.35) + 2•(0.21) + 3•(0.23) + 4•(0.15) + 5•(0.06) = 2.36 E(X2) = 12•(0.35) + 22•(0.21) + 32•(0.23) + 42•(0.15) + 52•(0.06) = 7.16 s2 = E(X2) - m2 = 7.16 – (2.36)2 = 1.5904 s = = 1.261
m – s = 2.36 – 1.261 = 1.099, m + s = 2.36 + 1.261 = 3.621 히스토그램을 이용한 확률 : P(m – s ≤ X ≤ m + s ) = (1.5 – 1.099)•(0.35) + 1•(0.21) + 1•(0.23) + (3.621 – 3.5)•(0.15) = 0.5985
☞ Chebyshev 부등식 1 P(m – ks ≤ X ≤ m + ks) ≥ 1 - , k > 1 k2 ※ 평균으로부터 동등한 간격으로 떨어져 있는 거리 사이에 놓일 확률의 하한값
( ) ( ) 과거 경험에 따르면, 어느 편의점을 찾는 고객의 수 X는 평균 40명이고 표준편차 4명이라고 한다. 어느 날 이 편의점을 찾을 고객의 수가 35명 이상 45명 이하일 확률의 하한값 ? m = 40, s = 4 이므로 Chebyshev 부등식에 의하여 5 4 P(35 ≤ X ≤ 45) = P(40 - 5 ≤ X ≤ 40 + 5) = P 40 - •4 ≤ X ≤ 40 + •4 ( ) = P m - •s ≤ X ≤ m + •s ( ) ≥ 1 - = 9 25 1 (5/4)2
제 2 장