확 률 변 수 2 1 이산확률변수 2 연속확률변수 3 기대값.

Slides:



Advertisements
Similar presentations
전자통신연구실 1 확률과 랜덤 해석 잡음 분석 확률 - 실험 (experiment) - 결과 (outcome) - 사건 (event)
Advertisements

10장. 시기별 학급경영 11조 염지수 이 슬 권용민 신해식.
일본 근세사. (1) 에도막부의 개창 ( ㄱ ) 세키가하라의 전투 (1600) - 히데요시의 사후 다섯 명의 다이로 ( 大老 ) 가운데 최대 영지 (250 만석 ) 를 보유하고 있던 도쿠가와 이에야스가 급부상. 이에 이에야스와 반목해 온 이시다 미쓰나리 ( 石田三成 ),
신진영 현지 조사 방법 및 보고서 작성법 제 10 강 - 측정 및 척도 - - 통계적 추론 원리 -
제 1 회 도전 ! 한글 골든벨 2014 년 7 월 12 일 ( 토 ) 주최 : 센다이 한국교육원 후원 : 駐仙台大韓民国総領事館 在日韓国民団宮城県地方本部 韓日觀光交流センター.
아니마 / 아니무스 송문주 조아라. 아니마 아니마란 ? 남성의 마음속에 있는 여성적 심리 경향이 인격화 한 것. 막연한 느낌이나 기분, 예견적인 육감, 비합리적인 것에 대 한 감수성, 개인적인 사랑의 능력, 자연에 대한 감정, 그리.
대구가톨릭대학교 체육교육과 06 학번 영안중학교 체육교사 신웅섭 반갑습니다. 반야월초등학교 축구부 대륜중학교 축구부 대륜고등학교 대구가톨릭대학교 차석 입학 대구가톨릭대학교 수석 졸업 2014 년 경북중등임용 체육 차석 합격 영안중학교 체육교사 근무 소개.
일장 - 1 일 24 시간 중의 명기 ( 낮 ) 의 길이 ( 밤은 암기, 낮은 명기 ) 광주기성 - 하루 중 낮의 길이의 장단에 따라 식물의 꽃눈 형성이 달라지는 현상 일장이 식물의 개화현상을 조절하는 중요한 요인 단일식물 - 단일조건에서 개화가 촉진되는 식물 장일식물.
2012 년 봄학기 강원대학교 컴퓨터과학전공 문양세 이산수학 (Discrete Mathematics)  중첩된 한정기호 (Nested Quantifiers)
2 학년 6 반 1 조 고은수 구성현 권오제 김강서.  해당 언어에 본디부터 있던 말이나 그것에 기초하여 새로 만들어진 말  어떤 고장 고유의 독특한 말  Ex) 아버지, 어머니, 하늘, 땅.
2014년도 교원 및 기간제교사 성과상여금 전달교육 개 회 국기에 대한 경례 - 인사말
선진 고양교육 “유아교육 행정 업무 연수” 유치원 회계실무 및 유아학비 연수 경기도고양교육청.
광 고 사 항 1. 토요 전도실천 - 일시 : (토) 오후 1시
묵자 겸애, 비명, 비공, 상현, 상동, 천지, 명귀, 삼표 법.
Eliminating noise and other sources of error
Keller: Stats for Mgmt & Econ, 7th Ed
확률변수의 기대값, 분산 등.
수학이 이끄는 미래 ICT 산업의 메가트랜드 STEAM.
내 아이를 위한 구강관리.
제16장 원무통계 • 분석 ☞ 통계란 특정의 사실을 일정한 기준에 의하여 숫자로 표시한 것을 말한다.통계로서 활용할 수 있는 조건으로는 ① 동질성을 지녀야 하고 ② 기준이 명확하고 ③ 계속성이 지속되어야 하며 ④ 숫자로 표시하여야 한다 경영실적의.
기술 통계학 (Descriptive Statistics)
제8장 일반함수모형의 비교정태분석.
서울지방세무사회 부가세 교육 사진클릭-자료 다운 세무사 김재우.
2004년 예비신자 오리엔테이션 2004년 3월 13일 (토) 오후 8시 천주교 수원교구 상촌성당 [티없이 깨끗하신 성모성심]
주택형 : 59m²(24py), 75m²(30py), 84m²(34py) 견본주택 : 18年 05月 18日 OPEN
Excel과 통계학.
치매의 예방 김 은민 윤금 노인요양원 치매의.
의료의 질 평가 분석 기법 김 민 경.
결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값.
기술이 다르면 집진기도 다릅니다..
패턴인식 개론 Ch.5 확률 변수와 확률 분포.
연 속 확 률 분 포 5 균등분포 지수분포 감마분포 웨이블분포 베타분포 정규분포 정규분포에 관련된 연속분포들
6장 Functions of r.v..
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
마산에 대하여 만든이 : 2204 김신우, 2202 권성헌.
탈모에 대하여 임현민, 노수진, 유민상,정다인.
Week 10:확률변수(Random Variable)
Yeong-Taeg Kim Signal processing R&D Center Samsung Electronics Co.
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
Contents 수익과 수익률 4.1 위험 4.2 위험에 대한 인간의 태도 4.3 평균-분산 모형 4.4.
Inferences concerning two populations and paired comparisons
연 속 확 률 분 포 5 1 균등분포 2 지수분포 3 감마분포 4 정규분포.
Statistical inference I (통계적 추론)
Mean and Variance.
The normal distribution (정규분포)
The Party-State (1) 영 어 학 부 강물결 영 어 학 부 박우인
이론적 확률분포 앞서: 확률변수의 임의의 확률분포 수학의 이론으로부터 도출될 확률분포 이항분포, Poisson 분포, 정규분포
Chapter 3. 양자역학의 가정, 연산자, 고유함수, 고유치.
통계방법의 이해.
Theory & Theorem 정리와 이론 김현길 박현수.
Distribution(모의 실험에 자주 쓰이는 분포들)
24시간후 사이다속 닭뼈 & 돼지뼈 하루 지난 사이다속 돼지뼈
비 표준 해석학 어떤 수 A 가 무한대라면, 그에 1 또는 또는 그보다 작은 수를 더한 B 와는 어떠한 부등호 관계를 가질까? A = ∞ 이고, B = ∞ 이면, A = B 이니 부등호는 존재할 수 없으리라고 생각한다. 그런데, B 는 분명 A 보다 크기 때문에.
6장 마케팅 조사 박소현, 김중호, 박기찬.
제2장 통계학의 기초 1절 확률 기본정의 확률의 기본 공리와 법칙 2절 확률변수와 확률분포 3절 정규분포와 관련 분포 정규분포
한밭대학교 창업경영대학원 회계정보학과 장 광 식
2018학년도 2학기 상담심리대학원 학위청구논문 진행 절차
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
정의역, 공역, 치역 수학 7-가 함수 > 함수의 뜻 > 5-6/14 수업계획 수업활동 [제작의도]
음양오행과 물리학 조 원 : 김용훈, 양범길, 박수진, 윤진희, 이경남, 박미옥, 박지선 (11조)
결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값.
학교 내 환자 관리 연수 학교 내 환자 및 응급환자 관리계획(도연학사생 포함) 명진고-2077 ( )
이야기 치료에 대하여 <8조 학문적 글쓰기 발표> 주희록 최은지
의학자료분석론 교재: 강의록 Rosner B, Fundamentals of Biostatistics, 7th ed. Brooks/Cole Cengage Learning, Canada, 강의 평가: 출석 20% 숙제 30% 기말고사 50%
Basic Function 김윤성 박로빈 이지호 천영재
제약이 없는 비선형계획모형 등식제약하의 비선형계획모형 부등식제약하의 비선형계획모형 secom.hanabt.ac.kr
기 술 통 계 학 6 1 기술통계학 2 자료의 정리 3 위치척도 4 산포의 척도.
맞춤형 사법서비스 구축 4단계 주요 변경업무 전자공탁
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
중국문학개론 한부와 겅건안문학 중어중국학과 ㅇ이진원 한부와 건안문학.
Presentation transcript:

확 률 변 수 2 1 이산확률변수 2 연속확률변수 3 기대값

1 이산확률변수 이산확률변수, 확률질량함수와 분포함수의 의미를 알아본다.

▶ ▶ R S 확률변수(random variable) : 표본공간을 이루는 실험 결과를 실수로 대응시키는 함수 X w X(w) S R X ▶ 상태공간(state space) : 확률변수 X가 취하는 모든 실수들의 집합

예 X : 주사위를 두 번 반복하여 던지는 게임에서 두 눈의 합 주사위를 두 번 반복하여 던질 때, 상태공간 표본공간 S SX = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}

예 X : 동전을 두 번 반복하여 던지는 게임에서 그림이 나온 횟수 동전을 두 번 반복하여 던질 때, 상태공간 표본공간 S = {(그림, 그림), (그림, 숫자), (숫자, 그림), (숫자, 숫자)} X의 상태공간 : SX = {0, 1, 2}

예 X : “1”의 눈이 나올 때까지 주사위를 던진 횟수 “1”의 눈이 나올 때까지 주사위를 던진 횟수에 대한 상태공간 표본공간 X의 상태공간 : SX = {1, 2, 3, 4, 5, … }

▶ 이산확률변수(discrete random variable) : 상태공간이 유한집합이거나 셈할 수 있는 무한집합인 확률변수 X X : 동전을 두 번 반복하여 던지는 게임에서 그림이 나온 횟수 SX = {0, 1, 2} X : 주사위를 두 번 반복하여 던지는 게임에서 두 눈의 합 SX = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} X : “1”의 눈이 나올 때까지 주사위를 던진 횟수 SX = {1, 2, 3, 4, 5, … }

X : 주사위를 두 번 반복하여 던지는 게임에서 두 눈의 합 P(X=12)=P(A11)=1/36 A11 ={(6,6)} X=12 P(X=11)=P(A10)=2/36 A10 ={(5,6), (6,5)} X=11 P(X=10)=P(A9)=3/36 A9 ={(4,6), (5,5), (6,4)} X=10 P(X=9)=P(A8)=4/36 A8 ={(3,6), (4,5), (5,4), (6,3)} X=9 P(X=8)=P(A7)=5/36 A7 ={(2,6), (3,5), (4,4), (5,3), (6,2)} X=8 P(X=7)=P(A6)=6/36 A6 ={(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)} X=7 P(X=6)=P(A5)=5/36 A5 ={(1,5), (2,4), (3,3), (4,2), (5,1)} X=6 P(X=5)=P(A4)=4/36 A4 ={(1,4), (2,3), (3,2), (4,1)} X=5 P(X=4)=P(A3)=3/36 A3 ={(1,3), (2,2), (3,1)} X=4 P(X=3)=P(A2)=2/36 A2 ={(1,2), (2,1)} X=3 P(X=2)=P(A1)=1/36 A1 ={(1,1)} X=2

▶ 확률질량함수(probability mass function) : 상태공간 안에 있는 xi에 대하여 확률 pi를 대응시키고, 상태공간 안에 있지 않는 x에 대하여 0으로 대응시키는 함수 f(x) = 1 36 2 3 4 5 6 , x = 2, 12 , x = 3, 11 , x = 4, 10 , x = 5, 9 , x = 6, 8 , x = 7 , 다른 곳에서 f(xi) = P(X = xi) , xi  SX 0 , xi  SX pi , xi  SX 0 , xi  SX = X : 주사위를 두 번 반복하여 던지는 게임에서 두 눈의 합에 대한 확률질량함수

▶ ☞  f(x) = 1 확률분포(probability distribution) : 확률변수 X에 대응 확률질량함수의 성질 하는 확률들의 집합 {pi : pi = P(X = xi), xi  SX } ☞ 확률질량함수의 성질 f(x) ≥ 0  f(x) = 1

확률변수 X가 취할 수 있는 값 1, 2, 3에 대하여, P(X = 1) = 0.3, P(X = 2) = 0.35 확률질량함수를 f(x)라 하고, P(X = 3) = k라 하면 0.3 , x = 1 0.35, x = 2 k , x = 3 f(x) = 확률질량함수의 성질 (2)에 의하여 f(1) + f(2) + f(3) = 1 P(X = 3) = f(3) = 1- f(1) - f(2) = 1 - 0.3 - 0.35 = 0.35

☞ 확률을 구하는 방법 P(XB) = S f(x) 주사위를 두 번 반복하여 던질 때, 두 눈의 합이 5이상 8이하일 확률 ? 게임에서 두 눈의 합 5 ≤ X ≤ 8 구하고자 하는 확률 P(5 ≤ X ≤ 8) = f(5) + f(6) + f(7) + f(8) 4 5 6 36 + =

X : 동전을 두 번 던지는 실험에서 앞면이 나온 횟수 X를 앞면이 나온 횟수라 하면, X가 취하는 값 : 0, 1, 2 X = 0 A = {TT} X = 1 B = {HT, TH} X = 2 C = {HH} 확률질량함수 f(x) = 1 4 2 , x = 0, 2 , x = 1 , 다른 곳에서 확률 표 X 1 2 P(X=x) 1/4 1/2 1/4

▶ 확률히스토그램(probability histogram) : 확률변수 X가 취하는 값 x를 중심으로 밑면의 길이가 1이고 높이가 확률 f(x)인 사각형으로 이루어진 그림 동전을 두 번 던지는 실험에서 앞면이 나온 횟수에 대한 확률히스토그램

남자아이와 여자아이가 태어날 확률이 동일하다 할 때, 세 명의 자녀를 둔 가족에 대하여 여자아이의 수를 X라 한다. (1) X의 확률질량함수 f(x) = ? (2) 여자아이가 적어도 두 명 이상일 확률. (3) X의 확률 히스토그램. (1) b : 남자 아이, g : 여자 아이 표본공간 : S = {(b,b,b), (b,b,g), (b,g,b), (g,b,b), (b,g,g), (g,b,g), (g,g,b), (g,g,g)} 각 표본점에 대한 확률은 동등하게 1/8 X : 여자 아이 수 f(x) = 1 8 3 , x = 0, 3 , x = 1, 2 , 다른 곳에서 X = 0 {(b,b,b)} X = 1 {(b,b,g), (b,g,b), (g,b,b)} X = 2 {(b,g,g), (g,b,g), (g,g,b)} X = 3 {(g,g,g)}

(2) 여자아이가 적어도 두 명 이상일 사건 : {X ≥ 2} = {X = 2 or X = 3} P(X ≥ 2) = P(X = 2) + P(X = 3) 3 1 8 2 + = (3) 확률히스토그램

주사위를 반복하여 두 번 던지는 게임에 대하여, 두 눈의 차 : X (1) X의 확률 표와 확률질량함수 f(x) = ? (2) 두 눈의 차이가 “1” 이하이면 이긴다고 할 때, 이 게임에서 이길 확률 (1) 주사위를 두 번 던져서 나온 눈의 수 : (i, j), i, j = 1,2,3,4,5,6 X = |i – j|, i, j = 1,2,3,4,5,6 SX = {0, 1, 2, 3, 4, 5} 확률변수 : 상태공간 : X = 0 A0 = { (1,1), (2,2), (3,3), (4,4), (5,5), (6,6)} X = 1 A1 = {(1,2), (2,1), (2,3), (3,2), (3,4), (4,3 ), (4,5), (5,4), (5,6), (6,5)} X = 2 A2 = {(1,3), (3,1), (2,4), (4,2), (5,3), (3,5), (6,4), (4,6)} X = 3 A3 = {(1,4), (4,1), (2,5), (5,2), (3,6), (6,3)} X = 4 A4 = {(1,5), (5,1), (2,6), (6,2)} X = 5 A5 = {(1,6), (6,1)}

6 36 P(A0) = 각 사건에 대한 확률 : 10 36 P(A1) = 8 36 P(A2) = 6 36 P(A3) = 4 36 P(A4) = 2 36 P(A5) = 확률 표 : P(X = x) 5 4 3 2 1 X 6 18 9 확률질량함수 : f(x) = 1 6 5 18 2 9 , x = 0, 3 , x = 1 , x = 2 , x = 4 , x = 5 , 다른 곳에서 (2) 두 눈의 차이가 “1” 이하인 사건: {X ≤ 1} = {X = 0 or X = 1} P(X ≤ 1) = f(0) + f(1) = 1 6 5 18 4 9 = +

▶ 분포함수(distribution function) : x를 넘지 않는 모든 실수 u에 대하여 확률 f(u) = P(X = u)를 합한 누적확률 ▶ F(x) = P(X ≤ x) = S f(u) u≤ x X : 동전을 두 번 반복하여 던지는 게임에서 앞면이 나온 횟수 X의 분포함수 F(x) 예 X < 0 에 대하여 u ≤ x 이면 f(u)=0 P(X ≤ x) = S f(u) = 0 u≤ x

P(X ≤ x) = S f(u) = f(0) + f(1) 0≤ x< 1 에 대하여 u≤ x 이면 f(0)=1/4, f(u)=0 1 4 P(X ≤ x) = S f(u) = f(0) = u≤ x 1≤ x< 2 에 대하여 u≤ x 이면 f(0)=1/4, f(1)= 1/2, f(u)=0 P(X ≤ x) = S f(u) = f(0) + f(1) u≤ x 1 4 1 2 3 4 = + = x ≥ 2 에 대하여 u≤ x 이면 f(0)=1/4, f(1)= 1/2, f(2)=1/4, f(u)=0 P(X ≤ x) = S f(u) = f(0) + f(1) + f(2) u≤ x 1 4 1 2 1 4 = + + = 1

X의 분포함수 : 1 4 3 , 0 ≤ x < 1 , 1 ≤ x < 2 , x ≥ 2 , x < 0 F(x) = P(X≤ x) = 불연속 점과 확률의 관계 : P(X = x) = F(x) – F(x-) x = 2 x = 1 x = 0 점프크기 불연속 점 1 4 2 X = 2 X = 1 X = 0 P(X = x) 확률변수 X = x

예제 3에서, X의 분포함수 F(x)와 분포함수의 그림 1 8 3 , x = 0, 3 , x = 1, 2 , 다른 곳에서 f(x) = X의 확률질량함수 : x < 0 이면, F(x) = P(X ≤ x) = 0 1 8 0 ≤ x < 1 이면, F(x) = P(X ≤ x) = f(0) = 1 ≤ x < 2 이면, F(x) = P(X ≤ x) = f(0) + f(1) 1 8 3 8 1 2 = + = 2 ≤ x < 3 이면, F(x) = P(X ≤ x) = f(0) + f(1) + f(2) 1 8 3 8 3 8 7 8 = + + =

3 ≤ x 이면 , F(x) = P(X ≤ x) = f(0) + f(1) + f(2) + f(3) = 1 , x < 0 1 8 , 0 ≤ x < 1 1 2 , 1 ≤ x < 2 F(x) = 7 8 , 2 ≤ x < 3 1 , x ≥ 3

X의 분포함수 : 0 , x < 10 0.30 , 10 ≤ x < 20 0.75 , 20 ≤ x <30 1.00 , 30 ≤ x F(x) = X의 확률질량함수 f(x) = ? X의 분포함수는 x = 10, 20, 30에서 점프불연속이고, 각 점프크기 : p1 = F(10) – F(10-) = 0.3 – 0 = 0.3 p2 = F(20) – F(20-) = 0.75 – 0.3 = 0.45 p3 = F(30) – F(30-) = 1 – 0.75 = 0.25 0.3, x = 10 0.45, x = 20 0.25, x = 30 0 , 다른 곳에서 f(x) =

☞ 분포함수를 이용한 확률을 구하는 방법 (1) P(a < X ≤ b) = P(X ≤ b) – P(X ≤ a) = F(b) - F(a) (2) P(a ≤ X ≤ b) = F(b) - F(a) + P(X = a) (3) P(a ≤ X < b) = F(b) - F(a) - P(X = b) + P(X=a) (4) P(a < X < b) = F(b) - F(a) – P(X = b)

예제 6에서, P( 5 < X ≤ 15) = ? P(15 ≤ X ≤ 25) = ? 분포함수와 질량함수가 0 , x < 10 0.30 , 10 ≤ x < 20 0.75 , 20 ≤ x <30 1.00 , 30 ≤ x F(x) = 0.3, x = 10 0.45, x = 20 0.25, x = 30 0 , 다른 곳에서 f(x) = 이므로 P( 5 < X ≤ 15) = F(15) – F(5) = 0.3 – 0 = 0.3 P(15 ≤ X ≤ 25) = F(25) – F(15) + P(X=15) = 0.75 - 0.3 + 0 = 0.45

2 연속확률변수 연속확률변수, 확률밀도함수에 관한 개념, 연속확률변수의 분포함수와 확률의 기하학적 의미, 확률밀도함수와 분포함수 사이의 관계 등에 대하여 알아본다.

▶ ▶ 연속확률변수(continuous random variable) : 확률변수 X가 취하는 값이 구간으로 나타나는 확률변수 새로 교체된 전구의 수명 : 상태공간 SX = { x : x ≥ 0 } 하루 동안의 온도 변화 : 상태공간 SX = { x : -20 ≤ x ≤ 40 } ▶ 확률밀도함수(probability density function) : 연속확률변수 X에 대하여 다음 조건을 만족하는 함수 f(x) f(x) ≥ 0, for all x  f(x)dx = 1 SX

☞    확률을 구하는 방법 f(x) : p.d.f. P(a < X ≤ b) = f(x)dx P(a≤ X ≤ b) 참 고 P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b)  P(X=a) = P(a ≤ X ≤ a) = f(x)dx = 0 a

 반도체 칩의 수명에 대한 확률밀도함수 (1) 칩의 수명이 6년 이하일 확률(수명의 기본 단위는 1년) (2) 수명이 5년에서 8년 사이일 확률 (3) 최소한 4년 이상 사용할 확률 (x+1) 2 , x ≥ 0 0 , x < 0 1 f(x) =  6 1 (x+1)2 P(X≤ 6) = dx 1 x+1 - 6 = - = 7 + 1

( )   P(5 ≤ X≤ 8) = dx - = - = 9 18 + 6 P(X ≥ 4) = 1 – P(X < 4) - 4 = 5 = 1 - + 1 ( ) (x+1)2 dx 

▶ ☞  분포함수(distribution function) : 임의의 실수 x에 대하여 분포함수의 기하학적 의미 확률 P(X ≤ x)를 연속확률변수의 분포함수라 한다. F(x) = P(X ≤ x) = f(u)du  -∞ x ☞ 분포함수의 기하학적 의미

☞ 분포함수의 성질 (1) F(∞) = P ( X ≤ ∞) = 1 , lim F(x) = 1 (3) 모든 실수 x에 대하여 0 ≤ F(x) ≤ 1 (4) F(x)는 단조증가한다. (5) F(x)는 우측 연속이다. x → ∞ x → -∞ 연속확률변수의 경우, (6) F(x) = f(x) (7) P(a < X ≤ b) = P(a ≤ X ≤ b) =P(a ≤ X < b) = P(a < X < b) = F(b) – F(a) d dx

 예제 1에 주어진 확률변수 X에 대한 분포함수 F(x) = ? x < 0 이면, F(x) = P( X ≤ x) = 0 x F(x) = P( X ≤ x) = 1 (u+1)2 u+1 - = 1 - du x+1

 확률밀도함수 : 0 ≤ x ≤ 6에서 2등변 삼각형 (1) 확률밀도함수 : f(x) (2) 분포함수 : F(x) (3) 확률 P(2 < X ≤ 5) (1) 삼각형의 넓이가 1이므로 6• k• (1/2) = 1 ; k= 1/3 x 9 , 0 ≤ x < 3 x 9 2 3 확률밀도함수 : f(x) = - + , 3 ≤ x < 6 0 , 다른 곳에서 (2) x < 0 이면, f(x) = 0이므로 F(x) = 0 0 ≤ x < 3 이면, f(x) = x/ 9이므로  x u 9 du F(x) = = x2 18

 3 ≤ x < 6 이면, 이므로 x 9 2 3 - + f(x) = x2 18 f(u) du = F(x) = = - u f(u) du = F(x) = = - u du + du x - 1 6 ≤ x 이면, 6 du = 1 분포함수 : F(x) = x2 18 2 3 - + x - 1 , 0 ≤ x < 3 , 3 ≤ x < 6 , x < 0 , x ≥ 6 1 (3) P(2 < X ≤ 5) = F(5) – F(2) = 17 18 4 13 - =

3 기대값 기대값과 평균의 의미, 분포의 중심위치 척도, 확률분포의 분산과 표준편차, Chebyshev 부등식의 의미 등에 대하여 알아본다.

예 [1, 2, 3, 4, 5, 6]의 평균 : x1 = 1 + 2 + 3 + 4 + 5 + 6 6 1 6 1 6 1 6 1 6 1 6 1 6 = 1 • + 2 • + 3 • + 4• + 5 • + 6 • = 3.5 X 1 2 3 4 5 6 P(X=x) 1 6 1 6 1 6 1 6 1 6 1 6 [1, 2, 2, 4, 4, 6]의 평균 : x2 = 1 + 2 + 2 + 4 + 3 + 6 6 = 1• + 2• + 4• + 6• 1 2 = 3.167 X 1 2 4 6 P(X=x) 1 6 2 6 2 6 1 6

▶ ☞ 가중평균(weighted mean) : 상대적인 중요성에 대한 적당 가중평균의 의미 한 허용치를 주기 위하여 일련의 가중치를 부여한 양들의 평균 가중평균의 의미 ☞ 중심의 위치 = 가중평균 수평 중심의 위치 > 가중평균 왼쪽으로 기울어짐 중심의 위치 < 가중평균 오른쪽으로 기울어짐

▶ 기대값(expected value) : 이산확률변수 X가 취할 수 있는 값 xi에 대하여 pi = P(X=xi )일 때, X의 가중평균 m = E(X) = S xi pi = S xi P(X=xi ) i 예 동전 두 번 던지는 실험에서 앞면이 나온 횟수 X의 기대값 확률질량함수 : f(x) = 1 4 2 0 , 다른 곳에서 , x = 1 , x = 0, 2 기대값 : E(X) = 0• + 1• + 2• = 1

컴퓨터의 고장에 대하여 서비스를 받을 때, 소요되는 비용과 그에 대한 확률 (1) 고장으로 인하여 소요되는 평균비용 (2) 확률 히스토그램에 위치를 표시 비 용 1 2 3 4 5 확 률 0.35 0.21 0.23 0.15 0.06 E(X) = 1•(0.35) + 2•(0.21) + 3•(0.23) + 4•(0.15) + 5•(0.06) = 2.36

☞   연속확률변수의 기대값 E(X) = x f(x)dx , f(x) : X의 확률밀도함수 -∞ ∞ E(X) = x f(x)dx , f(x) : X의 확률밀도함수 확률밀도함수 : f(x) = e-x , 0 ≤ x < ∞ X의 기대값 = ?  -∞ ∞ E(X) = x f(x)dx = xe-xdx = -(x+1)e-x = 1

참 고 모든 확률분포에 대하여 기대값이 존재하는 것은 아니다. 확률밀도함수 : f(x) = , -∞ < x < ∞ 1 p(1+x2) x = 0 을 중심으로 좌우대칭 x = 0 이 중심의 위치 그러나 이 분포는 기대값을 갖지 않는다

▶ ▶ ▶ 중앙값(median) : 확률변수 X의 분포함수 F(x)에 대하여 F(x0) =0.5를 만족하는 x0을 X의 중앙값이라 하고, Me로 나타낸다. 즉, 중앙값은 다음과 같다. P(X≤ Me) = P(X≥ Me) = 0.5 ▶ 최빈값(mode) : 확률변수 X의 확률함수 f(x)에 대하여 f(x0) =max { f(x) : x ∈ SX } 를 만족하는 x0을 X의 최빈값이라 하고, Mo로 나타낸다. ▶ 사분위수(quartiles) : 확률분포를 4등분하는 상태공간 안의 점 Q1, Q2, Q3 100p-백분위수(percentiles) : 확률변수 X의 분포함수 F(x)에 대하여 F(xp) =p, 0 < p < 1을 만족하는 xp

최빈값이 없는 경우 최빈값이 2개인 경우 중앙값이 하나인 경우 중앙값이 무수히 많은 경우 중앙값이 없는 경우 사분위수와 백분위수의 관계 : Q1 = x0.25 , Q2 = Me = x0.5 , Q3= x0.75

 예제 2에 대하여 (1) 중앙값, 최빈값을 구하고, 평균과 비교 (2) 제1사분위수와 제3사분위수 확률밀도함수 : f(x) = e-x , 0 < x < ∞ 분포함수 : x  F(x) = e-u du = - e-u = 1 – e-x , 0 < x < ∞ F(x0) = 1-e-x = 0.5 ; e-x = 0.5 ; x0 = Me = ln 2 = 0.693 x = 0 에서 f(0) = 1이 최대이므로 최빈값 : Mo = 1 F(q1) = 1-e-q = 0.25 ; e-q = 0.75 ; Q1 = ln (0.75) = 0.2876 F(q3) = 1-e-q = 0.75 ; e-q = 0.25 ; Q3 = ln (0.25) = 1.3863 1 3

Mo < Me < m m < Me < Mo m = Me = Mo 왼쪽으로 치우치고 오른쪽으로 긴 꼬리 모양을 갖는 경우 Mo < Me < m 오른쪽으로 치우치고 왼쪽으로 긴 꼬리 모양을 갖는 경우 m < Me < Mo m = Me = Mo 대칭형인 경우

☞ 확률변수의 함수에 대한 기대값 예 이산확률변수 X에 대하여 , x = -1, 1 Y = X2의 기대값 ? 확률질량함수 : f(x) = 1 4 2 0 , 다른 곳에서 , x = -1, 1 , x = 0 Y = X2의 기대값 ? Y = X2 상태공간 : SX = { -1, 0, 1 } SY = { 0, 1 } Y = 0 X = 0 동치관계 Y = 1 X = -1, 1

 P(Y = 0) = P(X = 0) = P(Y = 1) = P(X = -1 또는 X = 1) 2 P(Y = 0) = P(X = 0) = P(Y = 1) = P(X = -1 또는 X = 1) = P(X = -1) + P(X = 1) = Y의 확률질량함수 : h(y) = 1 2 0 , 다른 곳에서 , y = 0, 1 1 2 Y = X2의 기대값 : E(Y) = 0• + 1• = 1 2 X -1 1 Y=X2 f(x) 1/4 1/2 x2f(x) x2f(x) = + 0 + = = E(Y) 1 2  x

☞   기대값의 성질 (1) E(a) = a , a : 상수 (2) E(aX) = aE(X) , a≠0 : 상수 확률변수의 함수 Y = g(X)의 기대값 : X :이산확률변수인 경우 X : 연속확률변수인 경우 E(Y) = E[g(X)] =  x  -∞ ∞ g(x)f(x) g(x)f(x)dx ☞ 기대값의 성질 (1) E(a) = a , a : 상수 (2) E(aX) = aE(X) , a≠0 : 상수 (3) E(aX + b) = aE(X) + b, a≠0, a, b : 상수 (4) E[au(X) + bv(X)]= aE[u(X)] + bE[v(X)]

동전 두 번 던지기 게임 X : 앞면이 나온 횟수 E(X) = ? E(X2) = ? X의 확률질량함수 : , x = 0, 2 f(x) = 1 4 2 0 , 다른 곳에서 , x = 0, 2 , x = 1 1 4 E(X) = 0• + 1• + 2• = 1 2 E(X2) = 02• + 12• + 22• = 1.5

( )  확률밀도함수 : 1 , 0 ≤ x < 4 4 E(X) = ? E(X2) = ? f (x) = , 다른 곳에서 , 다른 곳에서 f (x) = E(X) = ? E(X2) = ?  4 E(X2) = x2 dx = x3 = = 1 12 ( ) 64 16 3 E(X) = x dx = x2 = 2 8

▶ ☞ S  분산(variance) : 확률변수 X의 평균을 중심으로 분포의 밀집정도를 나타내는 척도. Var(X) 또는 s2 표준편차(standard deviation) : 분산의 양의 제곱근 S.D(X) 또는 s Var(X) = E[(X-m)2] = S x  -∞ ∞ (x-m)2 f(x) , X :이산확률변수인 경우 (x-m)2 f(x)dx , X :이산확률변수인 경우 ☞ 분산의 간편 계산 방법 s2 = E[(X-m)2] = E(X2 -2mX + m2 ) = E(X2 ) -2 m E(X) + m2 = E(X2 ) - m2 , m = E(X)

※ 분산(표준편차)이 작을수록 평균에 집중하여 분포한다.

예제 4에서 주어진 이산확률변수 X의 분산과 표준편차 m = E(X) = 1 E(X2 ) = 1.5 s2 = E(X2 ) - m2 = 1.5 – 1 = 0.5 s = = 0.7071 예제 5에서 주어진 이산확률변수 X의 분산과 표준편차 s2 = E(X2 ) - m2 = – 22 = s = = 16 3 4 2 m = E(X) = 2 E(X2 ) = 16 3

☞ ☞ 분산의 성질 (1) Var(a) = 0 , a : 상수 (2) Var(aX) = a2Var(X) , a≠0 : 상수 (3) Var(aX + b) = a2Var(X), a≠0, a, b : 상수 ☞ 표준편차의 성질 (1) S.D(a) = 0 , a : 상수 (2) S.D(aX) = |a|S.D(X) , a≠0 : 상수 (3) S.D(aX+b) = |a|S.D(X), a≠0, a, b : 상수

( )  확률밀도함수 : f(x) = 2x , 0 < x < 1 X와 Y = 3X + 1의 평균과 분산  1 E(X2) = 2x3 dx = 2 m = E(X) = 2x2 dx = 3 ( ) s2 = E(X2) - m2 = - = 18 Y = 3X + 1의 평균과 분산 : 2 3 E(Y) = 3E(X) + 1 = 3• + 1 = 3 1 18 1 2 Var(Y) = 9Var(X) = 9• =

☞ 표준화 확률변수 평균 m, 표준편차 s인 임의의 확률변수 X에 대하여 Z = X - m s mZ = 0, sZ = 1

예제 1의 서비스 비용 X에 대하여 확률히스토그램에 m - s와 m + s를 표시하고, 히스토그램을 이용한 확률 P(m - s ≤ X ≤ m + s) = ? 예제 1에서, 비용 1 2 3 4 5 확률 0.35 0.21 0.23 0.15 0.06 E(X) = 1•(0.35) + 2•(0.21) + 3•(0.23) + 4•(0.15) + 5•(0.06) = 2.36 E(X2) = 12•(0.35) + 22•(0.21) + 32•(0.23) + 42•(0.15) + 52•(0.06) = 7.16 s2 = E(X2) - m2 = 7.16 – (2.36)2 = 1.5904 s = = 1.261

m – s = 2.36 – 1.261 = 1.099, m + s = 2.36 + 1.261 = 3.621 히스토그램을 이용한 확률 : P(m – s ≤ X ≤ m + s ) = (1.5 – 1.099)•(0.35) + 1•(0.21) + 1•(0.23) + (3.621 – 3.5)•(0.15) = 0.5985

☞ Chebyshev 부등식 1 P(m – ks ≤ X ≤ m + ks) ≥ 1 - , k > 1 k2 ※ 평균으로부터 동등한 간격으로 떨어져 있는 거리 사이에 놓일 확률의 하한값

( ) ( ) 과거 경험에 따르면, 어느 편의점을 찾는 고객의 수 X는 평균 40명이고 표준편차 4명이라고 한다. 어느 날 이 편의점을 찾을 고객의 수가 35명 이상 45명 이하일 확률의 하한값 ? m = 40, s = 4 이므로 Chebyshev 부등식에 의하여 5 4 P(35 ≤ X ≤ 45) = P(40 - 5 ≤ X ≤ 40 + 5) = P 40 - •4 ≤ X ≤ 40 + •4 ( ) = P m - •s ≤ X ≤ m + •s ( ) ≥ 1 - = 9 25 1 (5/4)2

제 2 장