자료의 표현.

Slides:



Advertisements
Similar presentations
Statistics 상지대학교 1 / 22 추정 개요 점추정과 구간추정 표본크기 두 모집단의 비교.
Advertisements

기초통계. -2- 통계  통계학 (statistics)  국가산술 (state arithmetic) 불확실성이 내포된 자료의 수집, 분석, 추정, 검정을 통하여 의사결정에 필요한 정보의 획득과 처리방법을 연구하는 학문 (decision-making science)
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
경영통계 제 1 장 통계란 무엇인가 도수분포표. 도수분포 도수분포 상대도수분포 상대도수분포 누적 도수 누적 도수 분석 도구 - 히스토그램 분석 도구 - 히스토그램.
통계학 강의 허만형 ( 건국대 ) Darrell Huff 는 How to Lie with Statistics 를 썼습니다. 통계는 거짓말 하는 도구일까요 ?
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
5. 통계 1. 산포도와 표준편차.
Keller: Stats for Mgmt & Econ, 7th Ed
제 4 장 정규분포로의 근사 단위변환 정규분포곡선 표준정규분포곡선 아래의 영역 찾기 자료에 대한 정규 근사 백분위수
제 7 장 함수 사용을 통해 엑셀 정복하기.
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
표본분포 Sampling Distribution
4.3.3 초기하분포 (Hypergeometric distribution)
고장률 failure rate 어떤 시점까지 동작하여 온 품목이 계속되는 단위기간내에 고장을 일으키는 비율(횟수). 고장률은 확률이 아니며 따라서 1 보다 커도 상관없다. 고장이 발생하기 쉬운 정도를 표시하는 척도. 일반으로 고장률은 순간고장률과 평균고장률을 사용하고 있지만.
기술 통계학 (Descriptive Statistics)
Excel과 통계학.
제12주 회귀분석 Regression Analysis
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
Probability and Statistics for Computer Engineer
비모수 분석 및 복습.
6장 그룹 함수.
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
제 3장. 수치를 통한 연속형 자료의 요약.
기 술 통 계 학 6 1 기술통계학 2 자료의 정리 3 위치척도 4 산포의 척도.
Multimedia Programming 10: Point Processing 5
제 3 장 수치요약 ∙ 상자그림 다섯 수치 요약 평균(Mean) – 어떤 경우에는 상당히 불확실 하다. 예를 들면
제2장 기초통계 양윤권 교수.
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다.
확률통계론 2장 : 확률변수.
상관함수 correlation function
Missing Value.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
ANOVA.
제 7장 연관성분석 화장품과학과 홍보람.
제4장 제어 시스템의 성능.
기술통계.
수학10-가 Ⅳ. 통 계 백암고등학교 수학교사 : 양상옥.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
제 3 장 수치요약 ∙ 상자그림 다섯 수치 요약 평균(Mean) – 어떤 경우에는 상당히 불확실 하다. 예를 들면
Quiz #7 다음 수들을 합병 정렬과 퀵 정렬 알고리즘을 이용하여 오름 차순으로 정렬하였을 때, 데이터 이동 회수를 각각 구하라. 여러분은 정렬 과정을 단계별로 보이면서 이동 회수를 추적해야 한다. 단, 퀵 정렬시에 피봇으로 배열의 왼쪽 첫 번째 원소를 선택한다. 5.
(independent variable)
Descriptive statistics
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
(Data Exploration & Analysis)
데이터 탐색 (Data Exploration) 2014년 가을학기 강원대학교 컴퓨터과학전공 문양세.
사용자 경험 측정 (Measuring User Experience)
자료와 자료 정리 자료 자료의 정리 중심위치의 측도 상대적 위치의 측도.
두 모집단에 대한 검정.
Frequency distributions and Graphic presentation of data
논문작성을 위한 연구모형 설정 양동훈.
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
Excel 일차 강사 : 박영민.
제3장 함수와 배열수식 전진환
Sampling Distributions
Excel 일차 강사 : 박영민.
기초 통계학 지도위원 이광희.
통계해석 및 오차의 제거.
Chapter2. 기술통계(Descriptive Statistics)
척도의 속성 - 목 차- 자료수집과정 척도의 속성 -명목척도 -서열척도 -등간척도 -비율척도 -리커트척도 3.Data(자료)
제2장 자료의 정리 및 기술통계 Min Gyoung Chan Ph.Dr..
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
제 16장 비율의 정확성 머리말 신뢰구간 신뢰구간의 해석.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
Survey Sampling Sangji University.
Presentation transcript:

자료의 표현

Data Abstraction 대표 값 흩어짐 Skewness (歪度, 비대칭도) Kurtosis(尖度) Average 산술평균 가중평균 기하평균 조화평균 Median Mode 흩어짐 Range Variance Standard Deviation Quantile Skewness (歪度, 비대칭도) 자료 집단의 분포 모양이 어느 정도 비대칭인지를 표현하는 척도 Kurtosis(尖度) 자료집단의 분포모양이 정점부근에서 집중된 정도

산술평균 산술평균은 자료가 등간척도나 비율척도로 측정된 경우에 사용

가중평균 (Weighted Average) 중요도에 따라서 측정한 값의 가중치를 고려한 평균 가중물가지수

기하평균 (Geometric Mean) 시간적으로 변화하는 자료의 비율에 대한 대표 값 계산에 많이 활용 인구증가율, 물가변동율 등 고대 이집트 인들이 나일 강 홍수로 범람한 토지 제분배를 위한 측량 시 활용

조화평균 (Harmonic Mean) 시간적으로 변화하는 자료의 평균을 구할 때 사용 속도, 상품가격 예 : 서울에서 부산으로 갈 때는 시속 100Km로 돌아올 때는 110Km로 온 경우 평균 속도는? (거리는 A라고 가정)

중앙 값 (Median) 데이터를 오름차순이나 내림차순으로 정렬하였을 때 중앙에 위치한 값

최빈치 (Mode) 변수들의 빈도를 구하였을 때, 도수가 가장 높은 값 Fashion Mode!

중심과 퍼짐 히스토그램에서 자료를 요약할 때 중심과 중심 주위로 퍼진 정도를 사용 중심 : 평균, 중앙값, 최빈치 퍼진 정도 : 표준편차, 사분위수 범위 중심과 퍼진 정도만으로 자료를 요약할 수는 없다 Bimodal 사례

중심과 산포 범위(Range) : 측정된 값들 중 최대 값과 최소값의 차이

평균이 중요하긴 하지만 자료의 대표치는 아니다, 평균이 같아도 분산이 다르면 다른 분포를 한다. 히스토그램에서는 평균에서 균형을 이룬다

대표 값 비교 Mean과 median을 아는 경우 unimodal 분포에서는 Mode  3(median) - 2(mean)

자유도 (degree of freedom) 정의 하나의 역학계에서 물체의 운동상태나 평형상태를 기술하는데 필요한 (물체의 위치를 가리키는) 독립변수의 개수 의미 합쳐진 값들 중에서 실질적으로 독립인 값들의 개수와 같음 잔차들의 합은 항상 0 이 되기 때문에 잔차들 중 자유로운 것의 개수는 “표본크기 – 1” 표준편차를 구할 때의 자유도 = 표본크기 - 1

평균편차

분산(Variance)과 표준편차(Standard Deviation)

표준편차의 의미 관측치들이 평균으로부터 얼마나 떨어져 있는 지 정도 표현 일반적으로 관측치 들의 68%가 1SD 내에 존재하고, 95%가 2SD 내에 분포함

왜도 (Skewness) 분포의 기울어짐 정도 좌우대칭분포 : 정규분포 비대칭분포 : 2, F분포 Long-tail의 법칙

첨도 (Kurtosis) 관측치들이 중심 근처에 얼마나 집중되어 있는 지 정도

자료의 표현 관련 Excel 함수 엑셀 통계함수 참조 Data set의 설정 : data의 범위를 잡고 data set 정의 평균 : =average (data) 중위수 : =median(data) 최빈치 : =mode(data) 표준편차 : =stdev (data) 분산 : =var(data) 최대값 : =max(data) 최소값 : =min(data) 범위 : 함수가 없음 (최대값-최소값) 백분위수 : =percentile(data,1) , k(0-1) 사분위수 : =quartile(data,1) , quart (1-4) 첨도 : =kurt(data) 왜도 : =skew(data) 기하평균 : =geomean(data) 조화평균 : =harmean(data) 엑셀 통계함수 참조