Presentation is loading. Please wait.

Presentation is loading. Please wait.

자료의 표현.

Similar presentations


Presentation on theme: "자료의 표현."— Presentation transcript:

1 자료의 표현

2 Data Abstraction 대표 값 흩어짐 Skewness (歪度, 비대칭도) Kurtosis(尖度) Average
산술평균 가중평균 기하평균 조화평균 Median Mode 흩어짐 Range Variance Standard Deviation Quantile Skewness (歪度, 비대칭도) 자료 집단의 분포 모양이 어느 정도 비대칭인지를 표현하는 척도 Kurtosis(尖度) 자료집단의 분포모양이 정점부근에서 집중된 정도

3 산술평균 산술평균은 자료가 등간척도나 비율척도로 측정된 경우에 사용

4 가중평균 (Weighted Average)
중요도에 따라서 측정한 값의 가중치를 고려한 평균 가중물가지수

5 기하평균 (Geometric Mean) 시간적으로 변화하는 자료의 비율에 대한 대표 값 계산에 많이 활용
인구증가율, 물가변동율 등 고대 이집트 인들이 나일 강 홍수로 범람한 토지 제분배를 위한 측량 시 활용

6

7 조화평균 (Harmonic Mean) 시간적으로 변화하는 자료의 평균을 구할 때 사용 속도, 상품가격
예 : 서울에서 부산으로 갈 때는 시속 100Km로 돌아올 때는 110Km로 온 경우 평균 속도는? (거리는 A라고 가정)

8 중앙 값 (Median) 데이터를 오름차순이나 내림차순으로 정렬하였을 때 중앙에 위치한 값

9 최빈치 (Mode) 변수들의 빈도를 구하였을 때, 도수가 가장 높은 값 Fashion Mode!

10

11 중심과 퍼짐 히스토그램에서 자료를 요약할 때 중심과 중심 주위로 퍼진 정도를 사용 중심 : 평균, 중앙값, 최빈치
퍼진 정도 : 표준편차, 사분위수 범위 중심과 퍼진 정도만으로 자료를 요약할 수는 없다 Bimodal 사례

12 중심과 산포 범위(Range) : 측정된 값들 중 최대 값과 최소값의 차이

13 평균이 중요하긴 하지만 자료의 대표치는 아니다,
평균이 같아도 분산이 다르면 다른 분포를 한다. 히스토그램에서는 평균에서 균형을 이룬다

14 대표 값 비교 Mean과 median을 아는 경우 unimodal 분포에서는 Mode  3(median) - 2(mean)

15 자유도 (degree of freedom)
정의 하나의 역학계에서 물체의 운동상태나 평형상태를 기술하는데 필요한 (물체의 위치를 가리키는) 독립변수의 개수 의미 합쳐진 값들 중에서 실질적으로 독립인 값들의 개수와 같음 잔차들의 합은 항상 0 이 되기 때문에 잔차들 중 자유로운 것의 개수는 “표본크기 – 1” 표준편차를 구할 때의 자유도 = 표본크기 - 1

16 평균편차

17 분산(Variance)과 표준편차(Standard Deviation)

18 표준편차의 의미 관측치들이 평균으로부터 얼마나 떨어져 있는 지 정도 표현
일반적으로 관측치 들의 68%가 1SD 내에 존재하고, 95%가 2SD 내에 분포함

19 왜도 (Skewness) 분포의 기울어짐 정도 좌우대칭분포 : 정규분포 비대칭분포 : 2, F분포 Long-tail의 법칙

20 첨도 (Kurtosis) 관측치들이 중심 근처에 얼마나 집중되어 있는 지 정도

21 자료의 표현 관련 Excel 함수 엑셀 통계함수 참조 Data set의 설정 : data의 범위를 잡고 data set 정의
평균 : =average (data) 중위수 : =median(data) 최빈치 : =mode(data) 표준편차 : =stdev (data) 분산 : =var(data) 최대값 : =max(data) 최소값 : =min(data) 범위 : 함수가 없음 (최대값-최소값) 백분위수 : =percentile(data,1) , k(0-1) 사분위수 : =quartile(data,1) , quart (1-4) 첨도 : =kurt(data) 왜도 : =skew(data) 기하평균 : =geomean(data) 조화평균 : =harmean(data) 엑셀 통계함수 참조


Download ppt "자료의 표현."

Similar presentations


Ads by Google