Statistics Prof. Seewhy Lee
Agenda 1. Why Statistics? 2. Statistics Basic 3. 이산확률분포 4. 이항분포 5. 연속확률분포 6. Poisson 분포 7. 지수확률분포 8. 큐잉 이론 9. 정규분포 Agenda
1. Why Statistics?
주정뱅이들의 고민
어떤 날은 피곤하고 어떤 날은 괜찮아~! 어떤 날이 피곤한 걸까??
통계학을 열심히 공부하여 그는 중요한 결론에 도달하였다!
술 마신 다음날은 피곤하다!
2. Statistics Basic
대수의 법칙 (The Law of Large Numbers): 충분히 많이 시행하면 수학적 평균값에 수렴한다. 몇 가지 전제(Premise) 대수의 법칙 (The Law of Large Numbers): 충분히 많이 시행하면 수학적 평균값에 수렴한다. Iid = independently and identically distributed (시행의 결과는 서로 독립적이고 동등하게 분포) Ergodicity: 1개 N회 시행 = N개 1회 시행
σ = 표준편차(Standard Deviation) Glossary 돗수(Frequency) 평균(Mean) 분산(Variance) σ = 표준편차(Standard Deviation)
A Quiz 동전 두 번 던져 1회는 그림(1), 1회는 숫자(0). 평균과 분산은?
3. Discrete Probability Distribution
A Simple Example 11 ?? Draw (x, p) Graph Calculate m and σ
4. Binomial Distribution
An Example 어느 선수가 슛을 해서 골인 확률이 0.1 이 선수가 어느 경기에서 세 번 슛 0골, 1골, 2골, 3골 확률을 구하고 평균과 표준편차 계산
5. Continuous Probability Distribution
예제
6. Poisson Distribution
푸아송 분포 이항분포에서 단일확률은 p→ 0 시행횟수는 매우 큼 n → ∞ 사건이 일어나는 평균값은 m = np 사건이 x번 일어날 확률분포 = 푸아송분포 겁먹을 필요 없음 ㅎㅎ
적용 사례 화소 한 개 불량 확률은 거의 제로 천만 화소 액정 패널이 불량일 확률 = 2% 수율 = 98% 화소 한 개 불량 확률은 거의 제로 천만 화소 액정 패널이 불량일 확률 = 2% 매년 운전자 1인 사고사망 확률은 거의 제로 만명 운전자 중 평균 사고사망자 수 = 5명
어느 지역에서 하루 평균 5명의 응급환자가 발생한다. 이 지역에서 어느 날 10명의 응급환자가 발생할 확률은? 100개 중 2개 비율로 불량. 불량이 세 개 이하일 확률은?
7. Exponential Distribution
시간 t ~ t + dt 사이에 사망할 확률은 규격화 확인: 시간 0~ t 사이에 사망 확률: 시간 t 이후에 사망할 확률 = 시간 t 까지 살아있을 확률 =
전화가 걸려오고 난 후 시간 t 안에 다음 전화가 걸려올 확률 제품의 수명 → 무상 A/S 기간의 결정 사망 시기 → 보험금 결정
Example 1 보험 계약 후 해지 확률이 지수확률밀도함수라고 가정 1년 내 해지 확률이 70% 5년 내 해지할 확률은? 계약자의 99.8%가 5년 안에 해지 5년 이후에는 해지해도 원금 돌려준다고 광고 매우 매력적으로 보임 5년 이후에 해지하여 원금 돌려받는 사람은 0.2%에 불과함
Example 2 조삼모사 수리를 요구하는 제품의 25%만 무상 A/S 해 주라는 회장님의 지시 제품이 고장나는 시기를 조사했더니 평균 10개월 무상 A/S 기간을 얼마로 해야 하는가? 제품의 25%가 2.9개월 안에 고장 제품의 75%는 2.9개월 이후에 고장 3개월까지는 무상 A/S라고 광고 실제로는 75%에게 무료 A/S 안해준다는 뜻 조삼모사
8. Queuing Theory
Jane Austin (1775-1817)
기다릴 때 사람들은 시간에 대해 제대로 판단하지 못한다.
Prescription 아무것도 하지 않고 기다리는 시간은 뭔가를 하면서 기다리는 시간보다 길게 느껴진다. --> 은행이나 미용실에 잡지 비치함. 초조하면 기다리는 시간이 길게 느껴짐. --> 마음이 편해지는 음악은 도움을 줌 끝이 어디인지 모르는 기다림은 아는 기다림보다 길게 느껴진다. --> 번호표를 뽑게 한다든가 전방 몇 km 정체라든가 대기시간은 몇 분이라든가 알려준다. 불공평하다고 여겨지는 기다림은 더 길게 느껴진다. --> 한 줄로 서기는 위대한 발명품! 상황 설명이 없는 기다림은 더 길게 느껴진다. --> 기다림에 대한 이유를 설명
서버 가동률 100% Idle Time = 0 Queuing Delay = ∞
장사하자 (하찌와 TJ) http://www.youtube.com/watch?v=NeWRZ-wPncI&feature=player_embedded
The Most Common Distribution 9. 정규분포 The Most Common Distribution
Probability Density Bell-Shaped Normal Distribution Gaussian Distribution
Parameter Meaning x Random Variable f Probabiliy Density μ Mean σ2 Variance σ Standard Deviation 1/σ Precision
Probability / Normalization
Standard Normal Distribution Zero Mean Unit Variance
표준정규분포표 (p.398)
Three-Sigma Limits 1 이상 벗어나기: 세 번에 한 번 2 이상 벗어나기: 스무 번에 한 번 3 이상 벗어나기: 사백 번에 한 번
표준화 (Standardization) 정규분포 X : 평균 m, 표준편차 σ 표준정규분포 Z : 평균 0, 표준편차 1
=NORMDIST(x, mean, standard_dev, cumulative) Using Excel =NORMDIST(x, mean, standard_dev, cumulative)
Example 1 철판을 제조하는데 그 두께가 m=10mm, σ=0.02mm의 정규분포를 보인다. (a) 판의 두께 9.97mm 이하를 불량으로 할 때, 불량품의 비율은? (b) 판의 두께 10.05mm 이상을 불량으로 할 때, 불량품의 비율은? (c) 판의 두께가 10mm로부터 0.03mm 벗어나는 비율은? (d) m+c와 m-c 사이를 합격품. 불량품의 비율을 5%가 되게 하려면 c는?
철판을 제조하는데 그 두께가 m=10mm, σ=0.02mm의 정규분포를 보인다. (a) 판의 두께 9.97mm 이하를 불량으로 할 때, 불량품의 비율은? (b) 판의 두께 10.05mm 이상을 불량으로 할 때, 불량품의 비율은? (a) (b)
철판을 제조하는데 그 두께가 m=10mm, σ=0.02mm의 정규분포를 보인다. (c) 판의 두께가 10mm로부터 0.03mm 벗어나는 비율은? (c)
(d) 철판을 제조하는데 그 두께가 m=10mm, σ=0.02mm의 정규분포를 보인다. (d) m+c ~ m-c 사이를 합격품. 불량품의 비율을 5%가 되게 하려면 c는? (d)
박카스 CF – 첫 출근 편
Example 2 사람으로부터 센서까지의 거리가 m=30cm, σ=5cm의 정규분포를 보인다. m+c와 m-c 사이를 90%가 되게 하려면 c는?
어느 과수원에서 수확되는 사과의 무게가 m=500gr, σ=50gr의 정규분포를 보인다. Example 3 어느 과수원에서 수확되는 사과의 무게가 m=500gr, σ=50gr의 정규분포를 보인다. 상위 33%를 우등품으로 판매하려고 한다. 몇 그램 이상의 사과를 우등품으로 해야 하는가?
Example 4 백만명 도시 일인당 월별 소득 분포가 m=150만원, σ=50만원의 정규분포. 하위 20%에게 20만원의 지원을 하려고 한다. 매달 얼마가 필요한가? 일단 인 z 값을 찾아야 한다. 즉, 인 z 값을 찾아야 한다. 실제로는 이딴 계산 할 필요 없다. 공약하고 당선된 다음 안 지키면 된다!
Binary | Normal
Summary 평균/ 분산 / 표준편차 이산확률분포 이항분포 연속확률분포 / 확률밀도함수 푸아송분포 지수확률분포 정규분포
Thanks! Prof. Seewhy Lee