패턴인식 개론 Ch.5 확률 변수와 확률 분포.

Slides:



Advertisements
Similar presentations
산업시스템분석 임성수 차수길 장연식 주혜림 7조7조.
Advertisements

전자통신연구실 1 확률과 랜덤 해석 잡음 분석 확률 - 실험 (experiment) - 결과 (outcome) - 사건 (event)
구 분현존 무창계사 사육장 (1,000 평기준 ) 신개념 가금류사육장 (1,000 평기준 특허보유유럽에서 약 50 여년전 개발 2008 년 특허개발 ( 송백영농조합 ) 계사구조 별도 독립된 단층계사 500 평ⅹ 2 동 건축 많은 사육장면적 확보시 계사를 추가로 신축 500.
 수학 10- 나  1 학년 2 학기  Ⅰ. 도형의 방정식 1. 평면좌표 (1/24) 두 점 사이의 거리 수업 계획 수업 활동.
20312 서종혁 새는 왜 유리창에 부딪힐까 ?  이번 탐구의 목적은 새와 사람이 조화롭게 살 수 있는 방법을 찾는다.
확률현상의 관찰과 실험 아주대학교 이승호
대륙 별로 알아 봅시다 ! 나라당 1 개씩이니 이해좀 해주세요 ^^ 아시아, 동남아시아의 있는것으로 과일의 왕이라고 불립니다 이것은 두리안이라는 것인되요 굉장히 부드럽고 높은 칼로리답게 (1 개당 4 천 2 백 칼로리가 넘는다고 하네요 ) 높은 당도를 자랑하거든요.
4. 우리들의 영양문제  기술ㆍ가정  청소년의 영양과 식사 > 1. 청소년의 영양 > 4. 우리들의 영양문제.
재 배 현 황 통 계( ’ 02년) 농가수 8,000 호 면 적 1,000본당 생산량 총생산량 28,406천본 (947ha) 200 Kg 4,591톤 (건조) 통 계 1,000본당 생산액 총생산액 농가소득 (호당평균) 소 득 율 천원 30,720 억원 5,165 1,100천원48.
효과적인 금연법 산재의료관리원 동해병원 건강관리센타.
우리나라 전통의 무술, 태권도 5학년 8반 김유승.
제 8 장 표본추출법과 중심극한정리.
호남선고속철도 개통 효과 조사 결과보고
1. 던전 디자인 개요_1 1. ‘던전’ 룬스톤은 던전 한 층에도 여러 개가 존재하며, 각 룬스톤 마다 영향을 미치는 범위가 설정되어 있다. 룬스톤이 영향을 주는 범위에 일정시간 사용자가 위치해 있게 되면 사용자 캐릭터는 ‘유령화’ 되어 버리기 때문에, 사용자는.
나의 한 줌은 얼마나 될까? 내가 태어났을 때의 몸무게는 얼마나 되는 걸까? 사진 속 모습과 똑 같게 하려면?
목차 : [1]갈라파고스 제도에대해서. [2] 갈라파고스 땅거북 생김새 [3]갈라파고스 땅거북 특징
자살 사례 분석 경영학과 백승용 경영학부 하수정 경영학부 이은옥
확률변수의 기대값, 분산 등.
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
수학이 이끄는 미래 ICT 산업의 메가트랜드 STEAM.
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
돼지가격 대표 기준 ‘탕박’변경 관련 설명자료
학습 주제 p 용해도 차이로 물질 분리하기.
통계적 품질관리 Statistical Quality Control
의료의 질 평가 분석 기법 김 민 경.
통계자료의 탐색적 분석(EDA) 84 제 6 장 확률모형과의 비교 1. 그룹 데이터, 도수 자료
점검용 웹하드 시스템 주소: 슬라이드쇼에서 클릭하면 위의 주소가 바로 열림
통계적 품질관리.
Communication and Information Systems Lab. 최정훈
과목명 : 과학 1학년 1학기 바닷물의 성분 > 해수의 성분과 운동 [1-3/6] 바닷물에는 무엇이 녹아 있을까?
7. 자극과 반응 7-2. 신경계 3. 여러 가지 반응.
6장 Functions of r.v..
확률통계론 2장 : 확률변수.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
강동경희대학교병원 영상의학과 석, 박사과정 및 연구원 모집
4-1 Gaussian Distribution
확 률 변 수 2 1 이산확률변수 2 연속확률변수 3 기대값.
유독물 및 취급제한∙금지물질 관리자 교육 취급시설별 관리기준 2014 한강유역환경청 화학물질관리과.
학습 주제 p 탄성력에 의한 위치 에너지.
5. 동역학적 해석 Korea University of Technology and Education
사업/성과관리시스템(SMART) 전산접수 매뉴얼 (수행기관용) 2013년 정보서비스팀.
Week 10:확률변수(Random Variable)
Yeong-Taeg Kim Signal processing R&D Center Samsung Electronics Co.
수학8가 대한 92~95 쪽 Ⅳ. 연립방정식 1. 연립방정식과 그 풀이 및 활용 >끝내기전에(9/9) 끝내기 전에.
Power Point 2007년 정보화교육 원미구청 총무과 통신전산팀.
Statistical inference I (통계적 추론)
For Information P-City 운영회의 ㈜파라다이스세가사미 February 10, 2017.
The normal distribution (정규분포)
Chapter 3. 양자역학의 가정, 연산자, 고유함수, 고유치.
Theory & Theorem 정리와 이론 김현길 박현수.
제2장 통계학의 기초 1절 확률 기본정의 확률의 기본 공리와 법칙 2절 확률변수와 확률분포 3절 정규분포와 관련 분포 정규분포
제10장. 품질관리 (CHAPTER 10. Quality Control)
정의역, 공역, 치역 수학 7-가 함수 > 함수의 뜻 > 5-6/14 수업계획 수업활동 [제작의도]
중학교 수학 ①/②/③ 교과서, 지도서 / ㈜교학사 (대표저자 : 고호경외 12명) Ⅰ. 교과서의 구성 Ⅱ. 교과서의 특장점
직장생활 예절 ① - 인사 1.내가 먼저 [인사의 5point] 2.상대방의 눈을 보고 미소지으며 3.상대방에 맞춰서
악취저감 / 친환경 축산(농장)을 위한 시험보고서
1월 교회학교 진급예배 및 성탄절 음악예배 찬 양 기 도 교 회 소 식 특 순 성 경 봉 독 말 씀 찬 양 축 도 인 도 자
RF Spectrum Analyzer 의 기본이해
뜨거운 햇살을 받으며 양 손에 도시락 두 개를 들고, 콧 노래를 부르며, 시골 길을 걷고 있는 한 아이가 있었어요
의학자료분석론 교재: 강의록 Rosner B, Fundamentals of Biostatistics, 7th ed. Brooks/Cole Cengage Learning, Canada, 강의 평가: 출석 20% 숙제 30% 기말고사 50%
Basic Function 김윤성 박로빈 이지호 천영재
Ⅲ. 선로전환기 청소 근거규정 및 점검요령.
국어지도 유아교육과 권수연 김아람 중등특수교육과 박수진 양한솔
(Predicates and Quantifiers)
Electromagnetics (전자기학) 정전계 Prof. Jae Young Choi (최재영 교수)
맞춤형 사법서비스 구축 4단계 주요 변경업무 전자공탁
근골격계 질환 예방교육.
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
강사 및 비전임교원 공개채용시스템 메뉴얼 교 무 연 구 팀.
Presentation transcript:

패턴인식 개론 Ch.5 확률 변수와 확률 분포

확률변수 ■ 확률변수란 무엇인가? 주사위 던졌을 때 3이 나올 확률을 P(X=3) = 1/6 또는 사람의 몸무게가 70kg 일 확률밀도를 p(X=70) = 0.032로 표현할 때, 이처럼 시행 결과 하나 하나를 수치로 대응시키는 X 를 '확률변수' 혹은 '랜덤변수(random variables)‘라 정의한다. 랜덤변수 X 는 이와 같이 시행 결과 ζ (zeta) 를 실수치 X(ζ) 로 대응시키는 함수로서, 샘플공간의 모든 요소들을 실수(또는 실선)에 매핑을 수행하게 된다. 랜덤변수(random variables)는 주사위 굴리기의 결과와 같이 이산변수(discrete variable)일 경우도 있고, 표본 추출된 몸무게와 같이 연속변수(continuous variable)일 수도 있다.

예1) 두 개의 동전을 던지는 확률 실험에서 앞면이 나오는 숫자 확률분포 ■ 확률 분포란 무엇인가? 수치로 대응된 확률변수의 개별 값들이 가지는 확률 값의 분포를 “확률분포”라 함. 확률변수가 취할 수 있는 구체적인 값 하나 하나를  확률공간상의 확률 값으로 할당해 주는 함수를 “확률분포함수”라 함. 예1) 두 개의 동전을 던지는 확률 실험에서 앞면이 나오는 숫자 예2) 두 개의 주사위를 던져서 나오는 점들의 합

확률함수의 종류 ■ 누적분포함수 ■ 누적분포함수의 성질 확률변수 X의 누적분포함수 ( cumulative distribution function, cdf ) FX (x)는 확률변수 X 가 {X ≤ x} 인 확률함수이다. ■ 누적분포함수의 성질

확률함수의 종류 ■ 확률밀도함수와 확률질량함수 ■ 확률밀도함수의 성질 확률밀도함수 (probability density function, pdf), fx(x) 는 연속확률변수 X 의 누적분포 Fx (x) 의 미분값으로 정의한다. 이산확률변수에서는 확률밀도함수와 동일한 개념으로 이를 특별히 확률질량함수 (probability mass function, pmf)라고 한다. ■ 확률밀도함수의 성질

확률함수의 종류 ■ 확률밀도함수에서 확률의 의미 확률밀도함수는 확률의 밀도를 정의하는 것이므로, 실제 확률을 얻기 위해서는 확률밀도함수를 일정구간에서 적분하여야 함. 확률질량함수는 실제확률을 나타냄.

확률함수의 종류 ■ 기대값 : 확률변수의 평균   n 값을 증가시키면 통계적 확률, 즉 근사확률 p(x) 에 접근하게 된다. 그러므로 다음과 같이 되고, 이 식을 x의 기대값(expectation)이라고 한다. 이는 각 값의 가중 산술평균을 확률적용어로 표현한 것인데, 어떤 실험을 무수히 반복했을 때 예상되는 평균 값을 말하며, 연속확률변수인 경우에는 다음과 같이 표현된다.

확률함수의 종류 ■ 확률변수의 분산/표준편차 이산자료의 확률변수 (일반자료 와 모집단자료) 연속자료의 확률변수

벡터 랜덤변수 ■ 벡터 랜덤변수 확률 변수를 2개 이상 고려한 경우로 확률변수의 개념을 확장한 것으로 열(column)벡터로 정의된다. 2개의 랜덤변수를 고려한 경우를 이중 랜덤변수라고 한다. 즉, 표본 공간 S 에서 정의되는 두 개의 랜덤변수 X, Y 를 고려할 경우에 두 개의 랜덤 벡터는 각각 x, y 라는 값을 가지며 순서쌍 (x, y) 로 표현되는 새로운 표본 공간(이를 결합 표본공간이라고 한다)의 xy 평면상의 임의의 점(random point)에 대응될 것이다. 그리고 누적분포함수와 확률밀도함수 개념은 "결합 누적분포함수(joint cdf)"와 "결합 확률밀도함수(joint pdf)"로 확장된다.

벡터 랜덤변수 ■ 단일 랜덤변수의 누적 분포함수의 표현 ■ X,Y의 이중 벡터 랜덤변수의 누적 분포함수의 표현 ■ 랜덤 벡터 가 주어질 경우 결합 누적분포함수 (Joint Cumulative Density Function) 결합 확률밀도함수 (Joint Probability Density Function)

랜덤벡터의 통계적 특징 랜덤 벡터의 통계적 특징은 결합 누적분포함수(joint cdf) 혹은 결합 확률밀도함수(joint pdf)를 이용하여 정의할 수 있다. 또한 랜덤 벡터를 스칼라 확률변수에서 정의한 것과 같은 방식으로 표현할 수 있다. 평균 벡터 공분산 행렬 : 랜덤 벡터에서 차원의 각 특징간의 관계를 나타낸다. 공분산 행렬의 성질

공분산 행렬과 상관계수 공분산 항은 다음과 같이 표현 될 수 있다.

공분산 행렬의 예 다음과 같이 3차원 분포의 표본이 주어진 경우, 공분산 행렬과 모든 변수 쌍에 대한 분산플롯을 완성하시오.

가우시안 분포 ■ 단변량 가우시안(Gaussian) 확률밀도함수

가우시안 분포 ■ 다변량 가우시안 확률밀도함수

중심극한정리 ■ 가우시안 분포가 자주 사용되는 이유 * 1차원의 특징 벡터일 경우에는 두 개의 파라미터, 평균과 표준편차 (μ,σ) 만으로도 정상분포를 특징 짖기에 충분함. * 중심극한정리(Central Limit Theorem) 중심극한정리(central Limit Theorem) : 평균, μ, 와 분산, σ 2,를 갖는 경우 평균의 표본 분포는 표본의 크기(N )가 증가함에 따라, 평균, μ, 과 분산, σ 2/N 을 갖는 정규분포로 접근한다. 정규분포의 자료로부터 500번의 실험을 수행한 경우 N=1 : 분포로부터 하나의 표본을 추출하고 그의 평균을 기록 ( 히스토그램은 일정한 밀도를 보임) N=4 : 분포로부터 4개의 표본을 추출하고 그의 평균을 기록 (히스토그램은 가우시안 분포를 보이기 시작함) N=7 그리고 N=10 경우도 마찬가지임. N이 증가함에 따라서 히스토그램의 모양이 점점 더 정상분포를 닮아 간다.

가우시안 분포 ■ 완전 공분산 가우시안 형태 ■ 대각 공분산 가우시안 형태 ■ 구형 공분산 가우시안 형태

가우시안 분포 ■ MATLAB 실습 >> N=10000; >> mu = [730 1090]; sigma_1=[8000 0; 0 8000]; >> X1= randn(N,2) *sqrtm(sigma_1) + repmat(mu,N,1); >> gaussview(X1, mu, sigma_1,’amplitude X1’); >> sigma_2=[8000 0; 0 18500]; >> X1= randn(N,2) *sqrtm(sigma_2) + repmat(mu,N,1); >> gaussview(X1, mu, sigma_2,’amplitude X1’); >> sigma_3=[8000 8400; 8400 18500]; >> X1= randn(N,2) *sqrtm(sigma_3) + repmat(mu,N,1); >> gaussview(X1, mu, sigma_3,’amplitude X1’);