Mean and Variance.

Slides:



Advertisements
Similar presentations
전자통신연구실 1 확률과 랜덤 해석 잡음 분석 확률 - 실험 (experiment) - 결과 (outcome) - 사건 (event)
Advertisements

신진영 현지 조사 방법 및 보고서 작성법 제 10 강 - 측정 및 척도 - - 통계적 추론 원리 -
일과 삶의 균형잡힌 조화를 통한 올바른 직업생활을 지원하는. CONTENTS 왜 인성교육인가 ? 01 인성교육 전문가 양성 교육과정 소개 02 인성교육 전문가 양성과정 특장점 / 기대효과 03.
1 ‘ 우리나라의 주요공업 ’ - 정도웅, 주민혁, 안수진, 백경민, 엄다운, 박경찬 -.
수유부의 약물복용 시 주의점 발표자 조기성. 모유 수유의 장점 모유 수유의 장점은 ? 위장관 질환 발생감소 영아 돌연사 발생감소 아토피 질환 발생감소 정서적 안정.
1 통계를 왜 공부해야 하나 ? Dept. of Public Administration Chungnam National University.
미국의 미디어교육 신문방송학과 강진구 한인수 곽모란 이명현.
Keller: Stats for Mgmt & Econ, 7th Ed
공부할 내용 조상들이 살던 곳 자연과 잘 어울리는 한옥 지방에 따라 서로 다른 집의 모양 섬 지방의 집
사랑, 데이트와 성적 자율성 :데이트 성폭력!!! 성폭력예방교육 전문강사 / 여성학 전공 신 순 옥.
퇴계와 율곡의 사회사상 비교 남 일 재 동서대학교 교수/ 정치학 박사 1. 퇴계 이황과 율곡 이이의 약전(略傳)
통계적 품질관리(SQC).
기술 통계학 (Descriptive Statistics)
501. 군인들의 세상 502. 민정 이양과 한일회담 이선용.
쌓지 말고 해소하자 이 주휘 이 진영 전 민석 전 혜림.
2015년 하반기 소방교육 자 유 전 공 학 부 (금) 안녕하십니까 자유전공학부 행정실 입니다.
건설관리학 강의슬라이드 8장. 품질관리.
Excel과 통계학.
의료의 질 평가 분석 기법 김 민 경.
운영리스크 고급측정법 모형의 적합성 검증방안에 대한 연구
EPS Based Motion Recognition algorithm Comparison
아파트관리비 청구서 이용 프로세스 안내 ㈜한국전산기술.
CHAPTER 21 UNIVARIATE STATISTICS
Chap 3. 표본조사 3.1 표본추출(Sampling)의 기초 3.2 단순임의표본추출 3.3 표본으로부터 모집단 추정
신규 검사 소개 Free light chain
Cluster Analysis (군집 분석)
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
- 나는 내 마음의 주인공 – 집단상담프로그램 인제대학교 교육대학원 상담심리전공 하 정 선
행정학과 김수민 중국 춘절의 교통문제.
Medical Instrumentation
4-1 Gaussian Distribution
확 률 변 수 2 1 이산확률변수 2 연속확률변수 3 기대값.
Keller: Stats for Mgmt & Econ, 7th Ed 그래프와 표를 이용한 기술통계학 기법
3장 데이터의 특성을 대표적인 수치로 표현하기 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분
Week 10:확률변수(Random Variable)
(Data Exploration & Analysis)
대한민국 No1. 고속열차 KTX 강릉선 광고매체 제안서.
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
2017년 인천항만공사 고객만족도 조사 결과 보고서 [ ].
Inferences concerning two populations and paired comparisons
Keller: Stats for Mgmt & Econ, 7th Ed
Association between two measurement variables Correlation
패시브하우스 신안산대학교 l 건축과 l 박효동, 박창준, 지예림.
Statistical inference I (통계적 추론)
정치개혁의 가능성 논의 권력구조 개편을 통하여 본 -개헌을 통한 정부형태의 변화를 중심으로 [한국정치론] 윤성이 교수님
제1장 통계란? 제2장 데이터의 정리 제3장 데이터의 요약.
The normal distribution (정규분포)
사용자 경험 측정 (Measuring User Experience)
치료 레크레이션 프로그램 (지적 장애 대상) 과 목: 학 과: 학 번: 이 름: 제 출 일 자 담 당 교 수:
통계방법의 이해.
Chapter 4: 통계적 추정과 검정 Pilsung Kang
노년기 발달 장안대 행정법률과 세류반 정 오 손
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
세계화와 소득 불평등 사회과학부 변형우 사회과학부 정은주 사회과학부 김진영 관광학부 문경신.
태국 문학 욜라다 왓짜니 싸란차나 팟차라와라이 끼따야펀 르앙다우 타니다.
Definitions (정의) Statistics란?
GIMCHEON HIGH SCHOOL (전국단위 자사고)
의학자료분석론 교재: 강의록 Rosner B, Fundamentals of Biostatistics, 7th ed. Brooks/Cole Cengage Learning, Canada, 강의 평가: 출석 20% 숙제 30% 기말고사 50%
기 술 통 계 학 6 1 기술통계학 2 자료의 정리 3 위치척도 4 산포의 척도.
경영학의 상황학파에 대해서… 경제학과 3학년 최준용 회계학과 4학년 진현빈
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
볼링 지도 – 학습 과정안.
워밍업 실뭉치 전달게임.
경영통계학 제1장 통계학은 어떤 학문인가? What is Statistics? 1.1.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
표본분포 개요 랜덤추출법 표본분포 모양과 CLT.
음파성명학 최종욱.
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
안전문화 정착을 위한 의식 변화 금정 소방서.
RISK POOLING.
Presentation transcript:

Mean and Variance

Distribution ?

statistics pop’n dist’n dist’n of a sample (sample) statistic (population) parameter

pop’n dist’n dist’n of a sample X %freq Head 1 0.5 Tail Total 1.0 X Total 1.0 dist’n of a sample X freq %freq Head 1 20 0.4 Tail 30 0.6 Total 50 1.0 X %freq Head 1 0.35 Tail 0.65 Total 1.0

Y freq %freq 1 10 0.1 2 20 0.2 3 4 5 6 Total 100 1.0 Y %freq 1 1/6 2 3 4 5 6 Total 1.0

A new variable X from mseg of credit card data mseg X Low Spender 1 Med Low Spender 2 Average Spender 3 Med High Spender 4 High Spender 5

? Variable X of credit card data X freq %freq 1 26 0.26 2 20 0.20 3 11 0.11 4 25 0.25 5 18 0.18 Total 100 1.00 X %freq 1 ? 2 3 4 5 Total 1.00

Mean, Mode Median (truncated, winsorized) Mean Measure for location (center)

Mean

Median

50% 50% Median

Mode

Hit/Stop Burst

Dealer's hidden card ?

2 - 9 1,11 10

Outlier

Truncated mean / Winsorized mean 5 6 6 4 Truncated mean / Winsorized mean

Truncated mean / Winsorized mean 5 6 6 4 6 4 5 1 9 6 4 5 6 4 5 Truncated mean / Winsorized mean

Quartiles 25% 75% 50% 50% 75% 25% Q Q Q 25 percentile 50 percentile 1 Q 2 Q 3 25 percentile 50 percentile 75 percentile Median Quartiles

Wrong housing statistics make wrong real estate policy. While median is better statistic than mean in representing house prices, Korean government publishes statistics calculated by mean on house prices. Mean price can be distorted by just one or two extreme prices. 일러스트=유재일 기자 jae0903@chosun.com 빗나간 주택통계 부동산 정책도 헛발질 한국의 PIR은 주택의 평균 가격과 도시근로자의 평균 가계소득을 기준으로 계산한다. 반면 미국의 PIR은 미디언 가격(MEDIAN PRICE·중간가격)과 미디언 소득을 기준으로 한다. 미디언 가격은 그 지역에서 거래된 가장 가격이 싼 주택에서부터 가장 비싼 주택을 일렬로 늘어 놓은 뒤 그 중간치를 선택한다. 건설산업전략연구소 김선덕 소장은 “평균가격이나 평균소득은 고가의 주택이나 엄청난 고소득자가 일부 포함되면 통계가 왜곡될 수 있다”고 말했다. 더군다나 한국의 주택가격은 호가(呼價)이고 미국의 주택가격은 실거래가를 기준으로 한다. 차학봉 기자 , hbcha@chosun.com 입력 : 2007.03.26 23:31

p% (100-p)% p-th percentile percentile

Range InterQuartile Range (IQR) Variance Standart Deviation Measure for variability

Range

variance, standard deviation

Mean (Y) = 1*(1/6) + 2*(1/6) + ... + 6*(1/6) = 3.5 freq %freq 1 10 0.1 2 20 0.2 3 4 5 6 Total 100 1.0 Y %freq 1 1/6 2 3 4 5 6 Total 1.0 Mean (Y) = 1*0.1 + 2*0.20 + 3*0.1 + ... + 6*0.2 = 3.8 Mean (Y) = 1*(1/6) + 2*(1/6) + ... + 6*(1/6) = 3.5

Mean of X Mean (X) = 1*0.26 + 2*0.20 + 3*0.11 + 4*0.25 + 5*0.18 = 2.89 X freq %freq Low Spender 1 26 0.26 Med Low Spender 2 20 0.20 Average Spender 3 11 0.11 Med High Spender 4 25 0.25 High Spender 5 18 0.18 ----------------------------------------------- Total 100 1.00 Mean (X) = 1*0.26 + 2*0.20 + 3*0.11 + 4*0.25 + 5*0.18 = 2.89

A new variable Q = (X – 3)2 X Q %freq Low Spender 1 (-2)2 0.26 Med Low Spender 2 (-1)2 0.20 Average Spender 3 02 0.11 Med High Spender 4 12 0.25 High Spender 5 22 0.18 ----------------------------------------------- Total 1.00 Mean (Q) = (-2)2*0.26 + (-1)2*0.20 + 02*0.11 + 12*0.25 + 22*0.18

Let ,

Distribution of a sample

Sample mean

(O) Sample variance

For large n, large enough

Standard deviation

V = (X – 2.89 )2 X V freq Low Spender 1 (1-2.89)2 26 Med Low Spender 2 (2-2.89)2 20 Average Spender 3 (3-2.89)2 11 Med High Spender 4 (4-2.89)2 25 High Spender 5 (5-2.89)2 18 ----------------------------------------------- Total 100 Var*(X)= (1/99)[(1-2.89)2*26 + …+ (5-2.89)2*18] = 2.22 sd*(X) = 1.49

statistics pop’n dist’n dist’n of a sample sample median population median sample mean population mean sample variance population variance …. ….

no. of teeth no. of phone calls weight of body

no. of teeth weight of body no. of phone calls

Expected value

X f(xi) Head 1 0.5 Tail 1

Y f(yi) 1 1/6 2 3 4 5 6

X f(xi) 1 1/2 1/4 1/8

X 3X f(xi) 1 3 1/2 2 6 1/4 9 1/8 4 12

100 x + 10 x

100 x + 10 x X Y 100X 10Y 100X+10Y f 1 (H) 1 100 10 110 1/12 0 (T) 2 20 120 6 60 160

For any constant

Thank you !!