패턴인식 개론 Ch.4 기초 통계와 확률 이론 Translated from “CSCE 666 Pattern Analysis | Ricardo Gutierrez-Osuna | CSE@TAMU “

Slides:



Advertisements
Similar presentations
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
Advertisements

1. 도형의 연결 상태 2. 꼭지점과 변으로 이루어진 도형 Ⅷ. 도형의 관찰 도형의 연결상태 연결상태가 같은 도형 단일폐곡선의 성질 연결상태가 같은 입체도형 뫼비우스의 띠.
제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
재료수치해석 HW # 박재혁.
전자파 연구실 Fast Beamforming of Electronically Steerable Parasitic Array Radiator Antennas: Theory and Experiment 세미나 자료 발표자 : 이동현 1.
적분방법의 연속방정식으로부터 Q=AV 방정식을 도출하라.
• 수학 • 6학년 나단계 • 7. 연비>1/9 홈 두 수의 대응 관계를 , 를 사용한 식으로 나타내기 수업활동 수업계획.
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
고장률 failure rate 어떤 시점까지 동작하여 온 품목이 계속되는 단위기간내에 고장을 일으키는 비율(횟수). 고장률은 확률이 아니며 따라서 1 보다 커도 상관없다. 고장이 발생하기 쉬운 정도를 표시하는 척도. 일반으로 고장률은 순간고장률과 평균고장률을 사용하고 있지만.
각 행 (row) 에서 같은 첨자가 있는 곳은 비워두고, 그 밖에 cell에 수준수 (level) 또는 반복수를 기입
공차 및 끼워맞춤.
베이즈 정리(Bayesian Theory)
Report #2 - Solution 문제 #1: 다음과 같이 프로그램을 작성하라.
제9장 샘플링과 오차 표본: 시료, Sample 모집단 : 공정, Lot Sampling
10장 랜덤 디지털 신호처리 1.
제12주 회귀분석 Regression Analysis
경영통계학 통계학은 어떤 학문인가? What is Statistics? 1.1.
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
질의 사항 Yield Criteria (1) 소재가 평면응력상태에 놓였을 때(σ3=0), 최대전단응력조건과 전단변형에너지 조건은σ1 – σ2 평면에서 각각 어떤 식으로 표시되는가? (2) σ1 =σ2인 등이축인장에서 σ = Kεn로 주어지는 재료의 네킹시 변형율을 구하라.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
Multimedia Programming 10: Point Processing 5
Error Detection and Correction
확률통계론 2장 : 확률변수.
상관함수 correlation function
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
상관분석 (p , p ).
일차방정식의 풀이 일차방정식의 풀이 순서 ① 괄호가 있으면 괄호를 먼저 푼다.
제4장 제어 시스템의 성능.
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
프로그래밍 개요
군집 분석.
문제 2명의 사형수가 있다. 둘에게는 검정색 모자와 흰색 모자를 임의로 씌우는데, 자기가 쓴 모자의 색은 절대로 알 수가 없다. 서로 상대의 모자색만을 볼 수 있고, 이들이 살기 위해선 자신의 쓴 색의 모자를 맞춰야 한다. 단, 둘 중 한명만이라도 자신이 쓴 모자의 색을.
Quiz #7 다음 수들을 합병 정렬과 퀵 정렬 알고리즘을 이용하여 오름 차순으로 정렬하였을 때, 데이터 이동 회수를 각각 구하라. 여러분은 정렬 과정을 단계별로 보이면서 이동 회수를 추적해야 한다. 단, 퀵 정렬시에 피봇으로 배열의 왼쪽 첫 번째 원소를 선택한다. 5.
(independent variable)
Week 5:확률(Probability)
고체역학 2 - 기말고사 1. 단면이 정사각형이고 한번의 길이가 a 일 때, 최대굽힘응력과 최대전단응력의 비를 구하라(10).
두 모집단에 대한 검정.
합집합과 교집합이란 무엇인가? 01 합집합 두 집합 A, B에 대하여 A에 속하거나 B에 속하는 모든 원소로 이루어진 집합을 A와 B의 합집합이라고 하며, 기호 A∪B로 나타낸다. A∪B ={x | x∈A 또는 x∈B}
4. 조합 공식 Combinatorial Formula
3강. 컴퓨터와의 기본적인 소통수단 - I 연산자란? 컴퓨터와 소통하기 위한 다양한 방법들
보고서 #7 (기한: 6/2) 2개의 스택, stk1, stk2를 이용하여 큐를 구현하라.
Thevenin & Norton 등가회로 1등 : 임승훈 - Report 05 - 완소 3조 2등 : 박서연
Distribution(모의 실험에 자주 쓰이는 분포들)
제3장 함수와 배열수식 전진환
Sampling Distributions
3-5. 태양계와 행성(2).
Chapter 1 단위, 물리량, 벡터.
Chapter 1 단위, 물리량, 벡터.
3. 반/전 가산기, 반/전 감산기 제작 컴퓨터 구조 실습 안내서.
Ⅵ. 확 률 1. 확 률 2. 확률의 계산.
쉽게 배우는 알고리즘 2장. 점화식과 점근적 복잡도 분석
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
Week 4: 다변수(2변수) 데이터분석 5장_1(산포도: scatter plot) 동영상 1,2,3,4,5
통계학 R을 이용한 분석 제 2 장 자료의 정리.
실습 : Sampling / Excel macro
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
수치해석 ch3 환경공학과 김지숙.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
2 장. 베이시언 결정 이론 오일석, 패턴인식, 교보문고,
9장. spss statistics 20의 데이터 변수계산
전류의 세기와 거리에 따른 도선 주변 자기장 세기 변화에 대한 실험적 고찰
문제의 답안 잘 생각해 보시기 바랍니다..
Survey Sampling Sangji University.
Presentation transcript:

패턴인식 개론 Ch.4 기초 통계와 확률 이론 Translated from “CSCE 666 Pattern Analysis | Ricardo Gutierrez-Osuna | CSE@TAMU “

기초 통계 ■ 통계학 패턴인식에서는 통계학적인 여러 가지 기법들을 이용하며, 이미 알려진 자료에 대한 통계적인 분석이 필수 불확실성 하에서 미지의 데이터가 속하는 카테고리들에 대한 판별 결정을 위한 방법으로 확률적인 여러 기법들 사용 확률을 이용하여 미지의 자료가 어느 카테고리에 속하는가를 결정하고 인식 ■ 통계 용어 모집단 (population) : 데이터 분석의 관심이 되는 전체 대상, 분석하고자 하는 대상의 전체집합 표본 (sample) : 모집단의 특성을 파악하기 위해서 수집된 모집단의 일 부분인 개별 자료, 모집단으로부터 임의로 추출된 모집단의 부분집합 표본 분포 (sampling distribution) : 동일한 모집단으로부터 취해진 동일한 크기의 모든 가능한 표본으로부터 얻어진 통계값들의 분포

기초 통계 ■ 통계 파라미터 (모수: 모집단의 특성을 요약한 값) 평균 (mean) : 평균은 자료의 총합을 자료의 개수로 나눈 것을 말한다. 분산 (variance) : 자료로부터 평균값의 차이에 대한 제곱 값의 평균을 분산이라고 하는데, 자료의 흩어진 정도를 나타낸다.

기초 통계 ■ 통계 파라미터 표준 편차 (standard deviation) : 분산은 자료의 단위와 달라지므로 분산의 제곱근을 취하여 자료의 단위와 일치시킨 것을 표준 편차라고 한다. 공분산 (covariance) : 공분산이란 두 개 이상의 변량 데이터가 주어질 경우에 각 변량 간의 변화하는 양상을 나타내는 통계적 척도이다. 표본의 랜덤 데이터가 이변량 데이터(bivariate) (x1i, x2i )일 경우의 공분산은 다음과 같이 계산된다.

기초 통계 ■ 통계 파라미터 상관 계수 (correlation) : 두 변량 x, y 사이의 상관관계의 정도를 나타내는 수치(계수)를 "상관 계수(ρ ) (correlation)"라고 한다. 여기에서 sx, 와 sy 는 변량 x, y의 표준편차 값

기초 통계 ■ Example 평균 분산 (x1,x2) (x2,x3) 공분산 상관계수

기초 통계 ■ Example (Answer) 작은 상관 계수는 선형적으로 두 성분간의 관련성이 거의 없음을 나타낸다

확률 이론 ■ 확률 용어 정리 통계적 현상(statistical phenomena) : 불확정 현상을 반복하여 관찰하거나 혹은 집단 안에서 대량으로 관찰하거나 하여 그 현상 고유의 법칙성을 찾아내는 것이 가능한 현상. 확률 실험 (random experimental, trial) : (1) 같은 조건 아래에서 반복할 수 있으며, (2) 시행의 결과는 매 번 우연적으로 변하므로 예측할 수 없으나, 가능한 모든 결과의 집합을 알 수 있으며, (3) 시행을 반복할 때 낱낱의 결과는 불규칙하게 나타나지만, 반복의 수를 늘이면 어떤 규칙성이 나타나는 특징을 가지는 행위.  확률 (probability) : 이러한 통계적 현상의 확실함의 정도를 나타내는 척도이다. 즉, 랜덤 시행에서 어떠한 사건이 일어날 정도를 나타내는 사건에 할당된 수들을 말한다.  "확률 법칙(Probability law)"이란 랜덤 시행에서 사건에 확률을 할당하는 규칙을 말한다.  랜덤 시행의 표본 공간(Sample space) S 가 모든 가능한 출력 집합이 된다.

확률 이론 ■ 확률 용어 정리 수학적 확률 : 표본공간 S의 각 근원 사건이 일어날 가능성이 동등할 때, 사건 A에 대하여 n(A)/n(S) 을 사건 A 의 수학적 확률이라고 한다. (여기에서 n(A), n(S) 는 각각 A, S 에 속하는 표본의 개수를 말함) 통계적 확률 : 일반적인 자연 현상이나 사회 현상에는 일어날 가능성이 동일한 현상은 드물 뿐만 아니라, 일어날 가능성이 동일한지 어떤지가 분명하지 않는 경우가 대부분이다. 이러한 때에는 시행을 여러 번 반복하여 문제의 사건이 일어나는 확률을 상대돗수에 의하여 추정하게 된다. 여기서 상대돗수는 n회 시행에서 문제의 사건이 r 회 일어났다고 하면 r/n 이 된다. 이와 같이 추정되는 확률을 통계적 확률이라고 한다. 일정한 조건 아래에서 시행을 n 회 반복할 때 사건 A의 상대 돗수 r/n 이, n 이 커짐과 더불어 일정한 값 p 에 수렴하는 경향이 있으면, 이 p를 사건 A의 “통계적 확률” 또는 “확률”이라고 하고 기호 P(A)로 나타낸다. 사건과 배반 사건 : 우리가 관심을 갖는 것이 어떤 랜덤 시행에서 개별적으로 발생할 결과일 수도 있고, 또한 몇 가지의 복합된 결과의 집합이 될 수도 있다. 이러한 복합된 결과를 "사건"이라고 한다. 그러므로 어떤 사건의 확률은 그 사건에 포함되어 있는 각 결과의 발생 확률의 합으로 나타낸다. 그리고 두 사건 A, B가 동시에 일어날 수 없을 때 A, B는 서로 배반한다 고 한다.

확률 이론 ■ 확률 용어 정리 표본 공간(sample space)과 확률 공간 관찰할 면을 지정한다.  일어날 수 있는 결과의 범위를 규정한다.  그 범위 내의 각 결과에 기호를 대응시킨다. 이와 같이 하여 얻어진 기호화된 결과의 집합을 "표본 공간"이라고 한다. 이 때, 표본 공간의 원소를 "표본점"이라 하고 표본 공간의 부분 집합을 "사건", 오직 한 표본점으로 이루어진 사건을 "근원 사건"이라고 한다. 그리고 표본 공간을 확률까지 대응시킨 결과의 집합이라 생각할 때의 공간을 "확률 공간" 이라 한다. 즉, 확률 공간이란 확률 실험에서 가능한 모든 결과의 집합을 말한다.   확률에 관한 정리 (axioms)  확률은 항상 0 보다 크거나 같아야 한다  확률은 모두 더하면 1이 되어야 한다

확률 이론 ■ 확률에 관한 성질

확률 이론 ■ 확률 용어 정리 주변 확률 (marginal probability) : 어떤 하나의 사건이 일어날 단순한 확률로 아무 조건이 붙지 않는 확률 조건부 확률 (conditional probability) : A와 B 두 개의 사건이 있을 경우, 사건 B가 일어날 확률이 이미 알려져 있을 경우에 사건 A가 일어날 확률로서, P[A|B] 는 “B가 일어났다고 가정할 때, A의 조건부 확률” 또는 “주어진 B에 대한 A의 확률”이라 한다. Ex: 주사위 눈금이 3이 나올 확률은 1/6 이다. 만약 눈금이 홀수가 나왔다는 사실을 알고 있다면 (주어졌다면), 눈금이 3일 확률은 (1/6)/(1/2) = 1/3 이다.

확률 이론 ■ 확률 용어 정리 결합 확률 : 조건부 확률로부터 P[B]P[A|B] = P(A∩B) 또는 P[A]P[B|A]=P(A∩B) 가 성립한다. A와 B 사건이 동시에 발생하는 확률을 “결합확률(joint probability)” 또는 “동시확률”이라 하며, 조건부 확률의 수식으로 유도 할 수 있는데, 이를 "곱셈 법칙"이라고 한다. 만약, 각 사건 A와 B가 독립이라면, (동일한 시행을 반복할 때, 각 시행의 결과가 서로 독립일 경우 독립시행이라 한다. 예를 들어 주사위를 두 번 던지는 행위 등.) P[A|B]=P(A)이 되므로 위의 곱셈 법칙에 대입하면, P[B]×P[A]=P(A∩B)가 성립한다.

확률 이론 ■ 확률 용어 정리 전체 확률 이론 : B1, B2, ..., BN 의 합집합이 표본 공간이고, 서로 상호 배타적인 사건이라고 하자. 표본 공간 S의 분할 영역으로 이들 집합을 나타낼 수 있다. 이 때, 사건 A는 다음과 같이 표현된다. B1, B2, ..., BN 은 상호 배타적이므로 이를 사건 A의 전체 확률이라고 한다.

확률 이론 베이즈의 정리 : B1, B2, ..., BN 의 합집합이 표본 공간 S인 경우, A 사건이 일어났을 때 Bj 사건이 일어날 확률은? 또는 패턴 분류의 목적으로 여기에서 wj는 j-번째 클래스를 x는 특징벡터를 각각 말한다.          

확률 이론 예제 (전체 확률 이론) : 어느 공장에서 A, B, C 3종류의 기계를 사용하여 물건을 생산한다. A, B, C 종류의 기계가 생산하는 제품의 양은 전체생산량의 50%, 30%, 20% 이고 제품의 불량률은 각각 1%, 2%, 3% 라 한다. 이들 제품에서 임의의 1개를 뽑아 검사할 때, 그것이 불량품일 확률은 ? P[불량] = P[A∩불량] + P[B∩불량] + P[C∩불량] = P[불량|A]P[A] + P[불량|B]P[B] + P[불량|C]P[C] = _______________________________ = 0.017 예제 (베이즈의 정리) : 위의 문제에서 제품의 무더기에서 1개를 뽑아 검사하였더니 불량품이었다고 가정하면, 이것이 A기계에서 생산된 물건일 확률은?