수문통계분석 담당교수명 : 서 영 민 연 락 처 : elofy@naver.com.

Slides:



Advertisements
Similar presentations
Statistics 상지대학교 1 / 22 추정 개요 점추정과 구간추정 표본크기 두 모집단의 비교.
Advertisements

기초통계. -2- 통계  통계학 (statistics)  국가산술 (state arithmetic) 불확실성이 내포된 자료의 수집, 분석, 추정, 검정을 통하여 의사결정에 필요한 정보의 획득과 처리방법을 연구하는 학문 (decision-making science)
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
5. 통계 1. 산포도와 표준편차.
Keller: Stats for Mgmt & Econ, 7th Ed
제 4 장 정규분포로의 근사 단위변환 정규분포곡선 표준정규분포곡선 아래의 영역 찾기 자료에 대한 정규 근사 백분위수
Keller: Stats for Mgmt & Econ, 7th Ed
확률분포의 개념 미분과 적분의 개념을 사전에 공부한다.
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
기술 통계학 (Descriptive Statistics)
Excel과 통계학.
수치해석 6장 예제문제 환경공학과 천대길.
제9장 샘플링과 오차 표본: 시료, Sample 모집단 : 공정, Lot Sampling
결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값.
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
Probability and Statistics for Computer Engineer
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
제 3장. 수치를 통한 연속형 자료의 요약.
통계적 분석을 통한 Insulin의 정상참고치 설정
패턴인식 개론 Ch.5 확률 변수와 확률 분포.
기 술 통 계 학 6 1 기술통계학 2 자료의 정리 3 위치척도 4 산포의 척도.
Multimedia Programming 10: Point Processing 5
제2장 기초통계 양윤권 교수.
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
확률통계론 2장 : 확률변수.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
상관분석 (p , p ).
제9 강 표준정규분포 학습목표: 표준정규분포의 이해 학습내용: 표준정규분포의 계산방법과 실습 지난강의
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
수학10-가 Ⅳ. 통 계 백암고등학교 수학교사 : 양상옥.
Keller: Stats for Mgmt & Econ, 7th Ed
(independent variable)
Descriptive statistics
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
자료의 표현.
연 속 확 률 분 포 5 1 균등분포 2 지수분포 3 감마분포 4 정규분포.
자료와 자료 정리 자료 자료의 정리 중심위치의 측도 상대적 위치의 측도.
두 모집단에 대한 검정.
Frequency distributions and Graphic presentation of data
홍수추적 담당교수명 : 서 영 민 연 락 처 :
Distribution(모의 실험에 자주 쓰이는 분포들)
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
Excel 일차 강사 : 박영민.
제3장 함수와 배열수식 전진환
감마분포 gamma distribution
Sampling Distributions
제2장 통계학의 기초 1절 확률 기본정의 확률의 기본 공리와 법칙 2절 확률변수와 확률분포 3절 정규분포와 관련 분포 정규분포
홍수추적 담당교수명 : 서 영 민 연 락 처 :
통계해석 및 오차의 제거.
Chapter 3: 확률변수와 분포함수 Pilsung Kang
Chapter2. 기술통계(Descriptive Statistics)
결 합 확 률 분 포 3 1 결합확률분포 2 조건부확률분포 3 결합분포에 대한 기대값.
제2장 자료의 정리 및 기술통계 Min Gyoung Chan Ph.Dr..
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
의학자료분석론 교재: 강의록 Rosner B, Fundamentals of Biostatistics, 7th ed. Brooks/Cole Cengage Learning, Canada, 강의 평가: 출석 20% 숙제 30% 기말고사 50%
상관계수.
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
실습 : Sampling / Excel macro
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
경영통계학 제1장 통계학은 어떤 학문인가? What is Statistics? 1.1.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
표본분포 개요 랜덤추출법 표본분포 모양과 CLT.
Survey Sampling Sangji University.
Presentation transcript:

수문통계분석 담당교수명 : 서 영 민 연 락 처 : elofy@naver.com

확률분포

확률분포 확률분포 (probability distribution) - 확률변수의 거동 (분포)을 나타내는 함수 PMF PDF (2) 확률분포의 구분 - 자료가 이산형 또는 연속형인가에 따라 이산 또는 연속확률분포로 구분 - 이산확률분포함수 (probability mass function, PMF) - 연속확률밀도함수 (probability density function, PDF) PMF PDF CDF

확률분포 (3) 이산확률분포 (probability mass function, PMF) - 확률변수 X의 값 x가 a와 b 사이 (a, b 포함)에 있을 확률(의 합) - 누가확률분포함수 (cumulative probability distribution function, CDF) : 확률변수 X가 x보다 작거나 같을 확률의 합 [예제] P(75)=0.013, P(125)=0.173, P(175)=0.360, P(225)=0.267, P(275)=0.093, P(325)=0.080, P(375)=0.000, P(425)=0.013 X가 225보다 크지 않을 확률? P(X≤225)=F(225) =0.013+0.173+0.360+0.267=0.813 (81.3%)

확률분포 (4) 연속확률분포 (probability density function) - 확률변수 X의 값 x가 a와 b 사이 (a, b 포함)에 있을 확률 - 확률밀도함수 아래의 총면적 = 1 - 누가확률밀도함수 (cumulative probability density function, CDF) : 확률변수 X가 x보다 작거나 같은 확률밀도함수 아래의 면적 PMF CDF

확률분포 (5) PDF와 CDF 관계  f(x)는 F(x)의 도함수 (기울기) (여기서, dx: 계급구간 Δx 0) - 확률밀도함수에 계급구간을 곱한 f(x)Δx는 그 계급구간에 해당하는 확률 = 누가확률밀도함수에서 Δx 구간에 해당하는 누가확률의 변화 ΔF(x)와 같음

확률분포 [참고] 확률분포의 주요 성질 확률밀도함수 f(x) 아래의 총면적은 1이다. 확률변수의 값 x가 어떤 다른 두 값 x1, x2 사이에 있을 확률은 확률밀도함수를 이 두 값의 범위에 대하여 적분한 것과 같고, 이 두 값에 대한 누가확률을 뺀 것과 같다. 누가확률 F(x)는 0과 1사이의 값을 가진다. 누가확률 F(x)의 기울기는 확률밀도함수 f(x)와 같다.

확률분포의 특성

확률분포의 특성: 중앙집중성향 If (1) 중앙집중성향 (central tendency) - 표본자료가 가장 집중되어 있는 곳이 어딘가를 나타내는 것 - 산술평균 (arithmetic mean), 중앙값 (median), 최빈값 (mode) ① 산술평균 (arithmetic mean) - 관측자료의 합을 그 개수로 나누어 산정 where, : 모집단 (population)에 대한 평균 (모평균, population mean) : 표본집합 (sample set)에 대한 평균 (표본평균, sample mean) : 자료의 수 If - 모집단 (population) 확률변수의 관측 가능한 모든 값을 포함하는 집합 - 표본집합 (sample set) 모집단으로부터 선택된 부분집합

확률분포의 특성: 중앙집중성향 [참고] 모집단 (population)과 표본집단 (sample) Random Sampling Statistic (Sample mean) Parameter (Population mean) Inference Image source. https://s-media-cache-ak0.pinimg.com/236x/90/11/5a/90115a947e3729e702e4fcf1d2c195e6.jpg

확률분포의 특성: 중앙집중성향 ② 중앙값 (median) - 자료집단의 중간에 위치하는 관측치 - 관측자료를 크기 순으로 나열했을 때 중앙에 위치하고 있는 값 ③ 최빈값 (mode) - 관측치를 가장 많이 포함하고 있는 확률변수의 값 또는 계급구간값 [Ref.] http://www.geoib.com/uploads/7/6/3/9/7639044/9928670.jpg?396

확률분포의 특성: 중앙집중성향 중앙집중 성향을 나타내는 매개변수들의 위치 음의 왜곡 대칭 양의 왜곡

확률분포의 특성: 분산도 (1) 자료가 흩어져 있는 정도의 측정 ① 범위 (overall range) = 최대값 (maximum) – 최소값 (minimum) ② 사분위수 범위 (interquartile range) = 제3사분위수 (3rd quartile) – 제1사분위수 (1st quartile) ③ 분산 (variance) - 자료가 평균치 주위로 어떻게 분포하고 있는지 측정 (자료 퍼짐의 정도) (2) 분산 (variance) (모집단)  편차 제곱의 평균 (표본집단) n-1 : 표본평균을 사용함으로써 발생하는 왜곡의 보정

확률분포의 특성: 분산도 (3) 표준편차 (standard deviation) (모집단) 분산의 단위: 표본자료를 제곱한 단위 원래 자료의 단위로 표현을 위해 표준편차를 사용하기도 함. (표본집단) (4) 변동계수 (coefficient of variation) (모집단) 표준편차와 평균의 비 서로 다른 표본자료 (단위가 다른)의 퍼짐 정도를 비교 (예. 강우량과 유출량) (표본집단)

확률분포의 특성: 왜곡도와 첨예도 (1) 왜곡도 (skewness) - 자료의 평균에 대한 대칭 정도(왜곡된 정도)를 나타내는 매개변수 - 양의 왜곡 (positively skewed) · 분포의 중심이 좌측으로 치우쳐지고 분포의 꼬리가 우측으로 길게 늘어져 있는 상태 · 대부분의 수문자료는 양의 왜곡 (모집단) (표본집단)

확률분포의 특성: 왜곡도와 첨예도 (2) 왜곡도 계수 (coefficient of skewness) - 왜곡도를 표준편차의 3승으로 나눈 값 (모집단)  대칭  양의 왜곡 (표본집단)  음의 왜곡 Cs < 0 Cs = 0 Cs > 0 [Ref.] http://www.geoib.com/uploads/7/6/3/9/7639044/9928670.jpg?396

확률분포의 특성: 왜곡도와 첨예도 (3) 첨예도 (kurtosis) - 확률밀도함수의 첨두의 뾰족한 정도를 나타내는 매개변수 (모집단) (표본집단) (4) 첨예도 계수 (coefficient of kurtosis) - 첨예도를 표준편차의 4승으로 나눈 것 - 정규분포의 경우 첨예도 계수가 3 (Ck=3) (모집단) (표본집단)

예제 1925~1999년 사이의 유량자료가 다음과 같을 경우, 이 자료에 대한 산술평균, 중앙값, 최빈값, 기하평균, 조화평균, 범위, 사분위수 범위, 분산, 표준편차, 변동계수, 왜곡도, 왜곡도 계수, 첨예도를 구하라.

산술평균 기하평균 중앙값 조화평균 최빈값 [참고] =MODE.SNGL(D3:D77)

최소값 최대값 범위

제1사분위수 제3사분위수 사분위수 범위 [참고] =QUARTILE.EXC(D3:D77,1)  경계값 제외 =QUARTILE.INC(D3:D77,10)  경계값 포함 사분위수 범위

분산 변동계수 표준편차 [참고] =VAR.P(D3:D77)  모분산 =VAR.S(D3:D77)  표본분산 [참고] =STDEV.P(D3:D77)  모표준편차 =STDEV.S(D3:D77)  표본 표준편차

[주의] 엑셀의 KURT 함수 정의는 수업자료의 정의와 다름!! - 양의 값  정규분포와 비해 상대적으로 뾰족한 분포 왜곡도 계수 [참고] =SKEW.P(D3:D77) 첨예도 [주의] 엑셀의 KURT 함수 정의는 수업자료의 정의와 다름!! - 양의 값  정규분포와 비해 상대적으로 뾰족한 분포 - 음의 값  정규분포에 비해 상대적으로 평평한 분포

median 1st quartile 3rd quartile maximum 3rd quartile median 1st quartile minimum