Probability and Statistics for Computer Engineer

Slides:



Advertisements
Similar presentations
자동 제어 Sun Moon University 1 of 17 자동제어 목 차 강의 개요 Ch.10 주파수 응답 기법 Ch. 8 근궤적 기법.
Advertisements

Statistics 상지대학교 1 / 22 추정 개요 점추정과 구간추정 표본크기 두 모집단의 비교.
6σ 관련 기초 통계 (1) -. 통계적사고 -. 모집단과 표본. 통계적 사고 모든 작업은 상호연관된 프로세스의 시스템 예 ) 열처리 작업 공정 원료 투입 공정가열 공정 냉각 공정 모든 프로세스에는 산포가 존재 가피원인 불가피원인 동일 원료동일 생산공정 동일 작업자동일.
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
경영통계 제 1 장 통계란 무엇인가 도수분포표. 도수분포 도수분포 상대도수분포 상대도수분포 누적 도수 누적 도수 분석 도구 - 히스토그램 분석 도구 - 히스토그램.
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
5. 통계 1. 산포도와 표준편차.
Keller: Stats for Mgmt & Econ, 7th Ed
Eliminating noise and other sources of error
패턴인식 개론 Ch.4 기초 통계와 확률 이론 Translated from “CSCE 666 Pattern Analysis | Ricardo Gutierrez-Osuna | “
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
표본 이론.
제9장 샘플링과 오차 표본: 시료, Sample 모집단 : 공정, Lot Sampling
통계분석 특강(속성) 서구원 한양사이버대학교 미디어MBA.
경영통계학 통계학은 어떤 학문인가? What is Statistics? 1.1.
22장 통계적 품질관리(SQC) 1. 품질의 통계적 관리 2. 통계적 공정관리 3. 샘플링검사.
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
제 3장. 수치를 통한 연속형 자료의 요약.
22장 통계적 품질관리(SQC) 1. 품질의 통계적 관리 2. 통계적 공정관리 3. 샘플링검사
기 술 통 계 학 6 1 기술통계학 2 자료의 정리 3 위치척도 4 산포의 척도.
Multimedia Programming 10: Point Processing 5
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
확률통계론 2장 : 확률변수.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
수학10-가 Ⅳ. 통 계 백암고등학교 수학교사 : 양상옥.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
빅데이터 연구회 6주차 발표 주제 : 서포트 벡터 머신 통계학과 서태석.
Linear Mixed Model을 이용한 분석 결과
(independent variable)
Association between two measurement variables Correlation
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
(Data Exploration & Analysis)
자료의 표현.
자료와 자료 정리 자료 자료의 정리 중심위치의 측도 상대적 위치의 측도.
두 모집단에 대한 검정.
Frequency distributions and Graphic presentation of data
The normal distribution (정규분포)
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
제3장 함수와 배열수식 전진환
Sampling Distributions
Intelligent Systems and Control Lab. Dept. of EE, Yeungnam Univ.
벡터의 성질 - 벡터와 스칼라 (Vector and Scalars) - 벡터의 합 -기하학적인 방법
기초 통계학 지도위원 이광희.
제 5장 제어 시스템의 성능 피드백 제어 시스템 과도 성능 (Transient Performance)
Support Vector Machine
Chapter 1 단위, 물리량, 벡터.
Definitions (정의) Statistics란?
척도의 속성 - 목 차- 자료수집과정 척도의 속성 -명목척도 -서열척도 -등간척도 -비율척도 -리커트척도 3.Data(자료)
제2장 자료의 정리 및 기술통계 Min Gyoung Chan Ph.Dr..
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
Week 4: 다변수(2변수) 데이터분석 5장_1(산포도: scatter plot) 동영상 1,2,3,4,5
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
텍스트 분석 ㈜ 퀀트랩.
실습 : Sampling / Excel macro
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
경영통계학 제1장 통계학은 어떤 학문인가? What is Statistics? 1.1.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
문제의 답안 잘 생각해 보시기 바랍니다..
(Analysis of Variation, ANOVA)
Survey Sampling Sangji University.
Presentation transcript:

Probability and Statistics for Computer Engineer What is model? Type of Models Purpose of the Class Course Overview

Model Model Types of Models Virtual system to explain phenomena or behavior Example Stock price and weather forecasting rule, Ohm’s law Types of Models Deterministic v.s. Statistic(Stochastic) Chaotic v.s. Non-chaotic Deterministic Model Differential Equations, Functions, Transform

Model Uncertainty Probability Statistical Model Not data but statistics(mean, variance, probability density function) Uncertainty Ambiguity due to lack of evidence Relative Frequency Vagueness inherent in language Probability Mathematical model of relative frequency

Why we need to study? Purpose of Study Tool for analyzing & understanding statistical models Related Courses in Computer Engineering Statistical Pattern Recognition and Machine Learning Data Mining Data Communication Artificial Intelligence Simulation Engineering Statistical Communication Theory Digital Signal Processing Image Processing

Lecture Plan Text Topics to be covered 확률,랜덤변수,통계 및 랜덤과정 이준환 저 확률,랜덤변수,통계 및 랜덤과정 이준환 저 Topics to be covered Descriptive Statistics Probability and Random Variables Statistical Estimation Hypothesis Test Random Process

Lecture Plan Grading Policy Midterm 35%, Final 40% Home Work with Programming 15% Presence 10%

서술적 통계학 (Descriptive Statistics)

통계학(Statistics): 관찰 및 조사를 통해 얻은 데이터로부터, 응용 수학의 기법을 이용해 수치상의 성질, 규칙성 등을 찾아내는 학문분야 서술적 통계학(Descriptive Statistics): 데이터 표본의 주요 특징을 그저 정량적으로 표현하는데 사용되는 통계학의 학문분야 유추적 통계(Inferetial Statistics) 표본으로부터 모집단에 관한 다양한 정보를 추론하는 통계학

도수분포와 도수분포 그래프 주의도수분포와 그래프 빈도 및 상대도수(상대빈도) 누적상대도수(누적 상대빈도)

막대가 표현하는 모든 빈도를 더하면 총 데이터의 수와 같 만약 이들을 상대빈도로 표현했다면 그 합은 1 (a) 도수분포의 막대그래프 (b) 누적 도수분포의 막대그래프 주의 막대가 표현하는 모든 빈도를 더하면 총 데이터의 수와 같 만약 이들을 상대빈도로 표현했다면 그 합은 1 계단의 차이는 해당 등급의 빈도 해당 등급에 빈도가 클 경우 기울기가 급함 해당 등급의 빈도가 0이면 기울기가 0이 된다. 그림 (b)에서 오른쪽 끝은 빈도 전체의 합 즉 데이터 수와 같으며 상대빈도로는 1

평균, 분산 및 표준편차 모집단과 표본 예: Height data of all the students in this class (Not sample, but population) Weights of sampled male students in CBNU (Sample) 표본평균 제곱오차의 합을 최소화하는 대표치(representatives) 간략하지만 데이터가 가진 충분한 정보를 담고 있지 않음

주의: 표본평균은 Outlier (외톨이)에 민감 예: 98 96 97 68 97 Mean = 91.2 Is it reasonable? 표본분산 및 표본 표준편차

표본 분산과 표본표준편차의 성질 단위: standard deviation = Unit of data 일종의 데이터가 평균으로부터 퍼진 정도 평균에 분산을 덧붙인다 하더라도 데이터가 가진 정보를 충분히 표현 못함

스큐니스(Skewness)와 커토시스(Kurtosis) 모드가 평균으로부터 치우친 정도 커토시스 분포 상부의 펑퍼짐한 정도 주의: 평균, 분산, 스큐니스, 커토시스를 모두 지정해도 일반적으로 데이터 분포를 일의적으로 규정하지 못함. 무한대차 까지의 모멘트가 필요

도수 분포표에서 평균/분산 구하기 표 1.1의 예: 스큐니스, 커토시스도 위와 같이 변형 가능

도수분포와 척도들의 수학적 모델 주사위 실험의 예: 1200번, 시행회수를 늘려가면 약 1/6 대수의 법칙(Law of large number)

대표치(위치척도) 미디안(Median) 데이터를 크기 순으로 정렬 후 중간 값에 해당 예: P = {50,75,60,55,70,200,55,55} 산술평균= 77.5, 미디안 = (55+60)/2 = 57.5 Outlier = 200

예: Mode(2,3,2,1,4) = 2, Mode(5,6,7,8) = None     4분위(quartile) 데이터와 윈저드 평균(winsored mean)   예: S = {5,6,7,8,9,11,13} 윈저드 데이터= {6,6,7,8,9,11,11} 윈저드 평균 = 58/7 최빈값(mode) 빈도가 가장 많은 데이터 도수분포 그래프에서 첨두치 또는 누적도수가 가장 크게 증가하는 부분 예: Mode(2,3,2,1,4) = 2, Mode(5,6,7,8) = None Mode(9,5,4,8,9,8) = 8 or 9

분포와 대표치

산포척도 분산과 같이 데이터가 평균치로부터 흩어진 정도를 표현 평균편차(mean deviation) 변동계수 (coefficient of variation) z-점수 (z-score) 상자수염 그림(box-wisker plot)

다변량 데이터 이변량(bivariate) 데이터의 예 - 가로 또는 세로 축 방향으로 데이터를 투영하면 단일변량 데이터 변량을 동시에 고려해 분석 (예: 남편과 아내 나이의 상관관계, 남편나이에 따른 아내나이의 추정) 이변량(bivariate) 데이터의 도수분포표

이변량(bivariate) 데이터의 평균과 분산, 공분산, 상관계수 평균과 분산: 각각의 변량의 평균들과 분산들 공분산(covariance): 공분산(covariance) 구하기와 의미: 1상한-3상한(+), 2상한-4상한(-)

Population and Sample Population (모집단) Sample (표본) 예: 스마트 폰 공장의 불량검사 관심의 대상이 되는 모든 가능한 관측치나 측정값의 집단 유한모집단(선거인), 무한모집단(자연수 공간) Sample (표본) 일정기준에 의해 추출한 모집합의 부분집합 예: 스마트 폰 공장의 불량검사 Population: 생산된 모든 스마트 폰 Sample: 임의로 추출된 일정 대수의 스마트 폰

상관계수(correlation coefficient)

조건부 평균(conditional mean)과 추정 표 1.4의 예: 물리성적 70점이라는 가정하래 수학성적의 추정 평균제곱오차 관점에서 최적이지만 외톨이 데이터에 민감 일반적으로 비선형적인 관계 회귀 분석(regression analysis)과 주성분 분석(principal component analysis) 회귀식(regressor) 선형 회귀식

 

조건부 평균은 선형이 아님. 주성분 분석: 평균을 빼고 분산을 최대로 하는 방향  

일반적인 다차원 데이터의 경우 다차원 배열로 표현 한 변량만을 고려하면 단일변량 데이터 평균과 분산은 다차원 벡터 공분산은 한 변량과 다른 한 변량 사이의 관계 표현