Keller: Stats for Mgmt & Econ, 7th Ed February 22, 2019 켈러의 경영경제통계학 제7장 연속확률분포 Continuous Probability Distributions Copyright © 2006 Brooks/Cole, a division of Thomson Learning, Inc.
확률밀도함수 (Probability Density Functions)… -연속확률변수(continuous random variable )는 셀 수 없는 실수 값들을 가질 수 있는 확률변수이다. 연속확률변수가 가질 수 있는 실수는 무한개이기 때문에 나열할 수 없다. 연속확률변수가 가질 수 있는 실수는 무한개이기 때문에 각 개별 실수값이 발생할 확률은 0이다. ->따라서 연속확률변수의 확률분포는 이산확률변수와 같은 방법으로 확률분포를 나타낼 수 없다.
확률밀도함수 (Probability Density Functions)… 연속확률변수가 가질 수 있는 실수의 값들이 무한개이기 때문에 각 개별 실수값의 확률은 0이다. ->연속확률변수의 경우 확률은 실수구간에 대해서만 정의될 수 있다.. 예. 주사위 1개를 던지는 이산확률변수(X=나타나는 점의 개수)의 경우 P(X=5)는 의미를 가진다. 그러나 연속확률변수 (X=프로젝트 완성시간)의 경우 X가 정확히 5분을 가질 확률은 무한히 작기 때문에 의미가 없고 P(X ≤ 5) 와 같이 X가 실수구간에 있을 확률만이 의미를 가진다. .
확률밀도함수 (Probability Density Functions)… -연속확률변수의 확률밀도함수 함수 f(x)가 다음과 같은 조건을 충족시키면 f(x)를 a ≤ x ≤ b의 범위를 가지는 확률밀도함수(probability density function )라고 부른다. 1) a 와 b사이에 있는 모든 x에 대하여 f(x) ≥ 0 2) a 와 b사이에 있는 f(x) 아래의 총면적은 1이다. f(x) area=1 a b x
일양분포 (Uniform Distribution)… -일양분포(uniform probability distribution )의 확률밀도함수는 다음과 같다. f(x) a b x 면적 = 밑변 x 높이 = (b – a) x = 1
예제 7.1 가솔린 판매량… -한 주유소에서 하루에 판매되는 가솔린의 양은 최소값이 2,000갤런이고 최대값이 5,000갤런을 가지는 일양분포를 따른다고 하자. 하루 가솔린 판매량이 2,500 갤런과 3,000 갤런사이에 속할 확률은? P(2,500 ≤ X ≤ 3,000) ? f(x) 2,000 5,000 x
“임의의 하루에 가솔린 판매량이 2,500갤런과 3,000갤런 사이에 속할 확률은 16.67%이다.” 예제 7.1 가솔린 판매량… P(2,500 ≤ X ≤ 3,000) = (3,000 – 2,500) x = .1667 “임의의 하루에 가솔린 판매량이 2,500갤런과 3,000갤런 사이에 속할 확률은 16.67%이다.” f(x) 2,000 5,000 x
예제 7.1 가솔린 판매량… b. 이 주유소가 하루에 적어도 4,000갤런을 판매할 확률은 얼마인가? P(X ≥ 4,000) ? P(X ≥ 4,000) ? f(x) 2,000 5,000 x
“이 주유소가 임의의 하루에 적어도 4,000갤런을 판매할 확률은 33.33%이다” 예제 7.1 가솔린 판매량… P(X ≥ 4,000) = (5,000 – 4,000) x = .3333 “이 주유소가 임의의 하루에 적어도 4,000갤런을 판매할 확률은 33.33%이다” f(x) 2,000 5,000 x
예제 7.1 가솔린 판매량… -이 주유소가 하루에 정확히 2,500갤런의 가솔린을 판매할 확률은 얼마인가? P(X = 2,500) ? P(X = 2,500) f(x) 2,000 5,000 x
“이 주유소가 하루에 정확히 2,500갤런의 가솔린을 판매할 확률은 0이다.” 예제 7.1 가솔린 판매량… P(X = 2,500) = (2,500 – 2,500) x = 0 “이 주유소가 하루에 정확히 2,500갤런의 가솔린을 판매할 확률은 0이다.” f(x) 2,000 5,000 x
7.2 정규분포(Normal Distribution)… -정규확률변수(normal random variable)의 확률밀도함수 ->평균 주위에서 대칭인 종모양의 모습을 가진다.…
정규분포(Normal Distribution)… <중요사항> 정규분포는 두 모수인 평균과 표준편차에 의해 완전히 정의된다. 정규분포는 종모양이고 평균 주위에서 대칭이다 일양분포의 범위(a ≤ x ≤ b)와는 달리 정규분포의 범위는 음의 무한대 부터 양의 무한대 까지 실수구간전체이다.
표준정규분포 (Standard Normal Distribution)… -임의의 정규분포는 간단한 대수조작으로 표준정규분포로 전환될 수 있고 이에 따라 임의의 정규분포와 관련된 확률계산은 간단한 표준정규분포를 이용한 확률계산으로 대체될 수 있다. 1
정규분포 (Normal Distribution)… -정규분포는 두 모수인 평균 과 표준편차 에 의해서 완전히 정의된다. ”평균의 증가는 정규분포곡선을 오른쪽으로 이동시킨다…”
정규분포 (Normal Distribution)… ” 표준편차의 증가는 정규분포곡선을 더 낮아지고 넓어지게 만든다…”
정규분포의 확률계산… -임의의 정규분포 확률변수를 표준정규확률변수로 전환시켜 확률을 계산한다.->확률변수X를 확률변수Z로 전환.
예제 7.2 정규분포를 따르는 가솔린 판매량… 한 주유소에서 보통가솔린에 대한 일일 수요량은 평균이 1,000갤런이고 표준편차가 100갤런인 정규분포를 따른다고 하자. -이 주요소의 경영자는 방금 영업을 시작했고 저장소에 보통가솔린이 정확히 1,100갤런을 보유하고 있다는 것을 알고 있다. -다음 가솔린 배달은 오늘 영업이 종료된 후에 이루어지는 것으로 예정되어 있다. 이 경영자는 오늘 수요를 충족시키기에 충분한 보통가솔린을 보유하고 있을 확률을 알기 원한다.
예제 7.2 정규분포를 따르는 가솔린 판매량… -보통가솔린에 대한 수요 X는 µ = 1,000 와 σ = 100 인 정규분포를 따른다. 주유소 경영자는 P(X < 1,100) 를 알기 원하고 이것을 그래프로 나타내면 다음과 같다.
예제 7.2 정규분포를 따르는 가솔린 판매량… -첫 단계는 X를 표준화하는 것(즉 X를 Z로 전환하는 것)이다. P(X < 1,100)= = P(Z < 1.00)
예제 7.2 정규분포를 따르는 가솔린 판매량… -Z의 값은 상응하는 X의 값 위치를 나타낸다. 즉, Z = 1 은 평균보다 1 표준편차 위에 있는 X의 값을 나타낸다. 마찬가지로 Z의 평균(0)은 X의 평균(1,000)을 나타낸다. -정규분포의 평균과 표준편차를 알면 X에 관한 확률은 Z에 관한 확률로 전환될 수 있다. -따라서 정규분포에 관한 확률을 계산하기 위해서 부록B의 표 3 (표준정규확률표)만 있으면 된다.
부록B의 표 3을 이용한 정규분포의 확률계산… -부록B의 표3은 -3.09와 +3.09 사이에 속하는 z값들에 대한 누적확률 P(Z < z)의 값을 정리한 것이다. - P(Z < −1.52)의 확률을 구하기 원한다고 하자. 부록B의 표3에서 먼저 왼쪽 첫번째 열에서 -1.5를 찾고 주어진 행에서 오른쪽으로 이동하여 .02에 있는 위치로 이동한다. -> P(Z < −1.52) = .0643
부록B의 표 3을 이용한 정규분포의 확률계산… P(Z < −1.52) = .0643
부록B의 표 3을 이용한 정규분포의 확률계산… 여사건의 법칙을 적용하면 부록B의 표3으로부터 P(Z > 1.80) = 1 – P(Z < 1.80) = 1 − .9641 = .0359
부록B의 표 3을 이용한 정규분포의 확률계산… P(−1.30 < Z < 2.10)는 2개의 누적확률들, 즉 P(Z < −1.30) = .0968 과 P(Z < 2.10) = .9821 을 구하여 그 차이를 계산함으로써 구해진다. P(−1.30 < Z < 2.10)= P(Z < 2.10) − P(Z < −1.30) = .9821 −.0968 = .8853
부록B의 표 3을 이용한 정규분포의 확률계산 … -부록B의 표3에서 z의 최대값은 3.09이고 P(Z<3.09)=.9990이다. 이것은 P(Z>3.09)=1−.9990=.0010 을 의미한다. -그러나 표3에서 3.09보다 큰 z의 값이 없고 P(Z > 3.09) = 1 − .9990 = .0010 (작은 값)이기 때문에 z의 값이 3.10보다 큰 면적을 0 으로 근사시킬 수 있다. P(Z > 3.10) = P(Z < −3.10) ≈ 0 -연속확률변수가 특정한 실수값일 확률은 0이기 때문에 정규변수를 포함한 연속확률변수의 확률을 계산할 때 구간 설정시 등호를 포함시키는 것과 부등호만으로 표시하는 것에는 아무런 차이가 없다.
예제 7.2 정규분포를 따르는 가솔린 판매량… 예제 7.2에서 P(X < 1,100) = P( Z < 1.00) = .8413
예제 7.3 음의 투자수익률이 발생할 확률… -한 투자의 수익률이 평균이 10%이고 표준편차가 5%인 정규분포를 따른다고 하자. -a. 손실이 발생될 확률을 구하라. P(X < 0) = = P(Z < – 2.00)=0.0228 b. 표준편차가 10%일 때 손실이 발생할 확률을 구하라. P(X < 0) = = P(Z < –1.00)= .1587
Z의 값 찾기… -주어진 확률을 나타내는 Z의 값을 찾아야 할 경우가 있다. P(Z > zA) = A 에서 A가 주어진 경우 zA를 어떻게 찾을 수 있는지를 살펴보자.
Z의 값 찾기… -면적 A가 2.5%인 경우에 해당하는 Z의 값 (z0.025 )는 얼마인가? Area = .025 부록B 표3에서 누적확률 값이 0.9750인 z의 값을 찾는다. -> zA = 1.96 P(z > 1.96) =1-P(z<1.96)= .025이므로 z.025 = 1.96
7.3 지수분포 (Exponential Distribution)… 지수분포의 확률밀도함수 x ≥ 0는 점을 주목하라. 시간(예를 들면)은 0 이상인 양이다. 지수분포는 종종 전화수신 간 시간길이와 조립대에 부품이 도착하는 시간차이와 같은 시간과 관련된 현상을 분석하기 위해 사용된다. 지수분포의 경우 ->
지수분포 (Exponential Distribution)… -지수분포는 λ의 값에 의존한다. “ λ의 값이 작을 수록 지수분포의 확률밀도함수는 더 평평해진다.”
지수분포 (Exponential Distribution)… - X 가 지수확률변수(exponential random variable)이면, 지수분포의 확률은 다음과 같이 계산된다.
7.4 기타 연속확률분포… -통계적 추론에서 많이 사용되는 3개의 중요한 연속확률분포에 대하여 소개한다… 스튜던트 t 분포 (Student t Distribution) 카이제곱분포(Chi-Squared Distribution) F 분포 (F Distribution)
Student t 분포 (Student t Distribution)… ν (“nu”)=자유도, Γ (.)는 Gamma 함수이며 Γ(k)=(k-1)(k- 2)…(2)(1)
Student t 분포 (Student t Distribution)… - Student t 분포는 표준정규분포와 마찬가지로 산모양(“mound”shaped)이고 평균 0 주위에서 대칭이다. -The mean and variance of a Student t 확률변수 (Student t random variable)의 평균과 분산은 E(t) = 0 , V(t) = for ν > 2.
Student t 분포 (Student t Distribution)… Figure 7.26
Student t 값의 결정… -Student t 분포는 통계적 추론에서 많이 사용된다. -부록B 표4는 자유도 별로 의 값을 정리한 것이다. - A의 값은 사전에 결정된 “임계값”(“critical” value)으로 10%, 5%, 2.5%, 1%, 1/2% 이다.
Student t table (표4) … -자유도가 10이고 그 값의 오른쪽에서 Student t 함수의 면적이 .05가 되는 t 값 구하기… Area under the curve value (tA) : COLUMN t.05,10 t.05,10=1.812 Degrees of Freedom : ROW
카이제곱분포 (Chi-Squared Distribution) ( 분포)… 은 확률변수를 나타낸다. 카이제곱분포의 확률밀도함수: 자유도= Figure 7.29
카이제곱분포 (Chi-Squared Distribution) ( 분포)… -카이제곱분포는 대칭이 아니다. 은 0이상의 값을 가진다. -부록 B 표 5는 P( > )=A 의 값을 정리한 것이다
카이제곱표(부록B 표 5)의 이용… -자유도=8인 카이제곱분포에서 의 값 구하기 -자유도=8인 카이제곱분포에서 의 값 구하기 -부록B 표5에서 자유도=8인 행에서 열의 값을 찾는다 … =15.5
카이제곱표(부록B 표 5)의 이용… -자유도=8인 카이제곱분포에서 의 값 구하기 -자유도=8인 카이제곱분포에서 의 값 구하기 -부록B 표5에서 자유도=8인 행에서 열의 값을 찾는다 … =2.73
F 분포(F Distribution)… F 분포의 확률밀도함수: F는 확률변수를 나타낸다. =“분자”의 자유도 = “분모”의 자유도
F 분포 (F Distribution)… - F 분포의 평균과 분산 -확률변수 F는 0이상의 값을 가지며 비대칭이다.
F.05,3,7 F 의 값 결정… - 부록B 표 6을 이용하여 F의 값 구하기 F.05,3,7 =4.35 A의 값에 따라 다른 표이용 ->정확한 표이용!! F.05,3,7 =4.35 F.05,3,7 분모의 자유도: 행(ROW) 분자의 자유도:열(COLUMN)
F 의 값 결정… 자유도의 순서가 바뀐다!!