제 3장. 수치를 통한 연속형 자료의 요약.

Slides:



Advertisements
Similar presentations
기초통계. -2- 통계  통계학 (statistics)  국가산술 (state arithmetic) 불확실성이 내포된 자료의 수집, 분석, 추정, 검정을 통하여 의사결정에 필요한 정보의 획득과 처리방법을 연구하는 학문 (decision-making science)
Advertisements

6 장. printf 와 scanf 함수에 대한 고찰 printf 함수 이야기 printf 는 문자열을 출력하는 함수이다. – 예제 printf1.c 참조 printf 는 특수 문자 출력이 가능하다. 특수 문자의 미 \a 경고음 소리 발생 \b 백스페이스 (backspace)
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
1/44 엑셀에서 제공하는 함수는 300 개가 넘으며, 이 함수들 중에는 매우 전문적인 분야에서만 사용되거나 자주 사용되지 않는 것들도 많다. 여기서는 일상에서 자주 사용되는 통계 함수, 수학 / 삼각 함수, 논리 함수, 날짜 함수, 찾기 / 참조 함수를 학습해보자. 06_.
경영통계 제 1 장 통계란 무엇인가 도수분포표. 도수분포 도수분포 상대도수분포 상대도수분포 누적 도수 누적 도수 분석 도구 - 히스토그램 분석 도구 - 히스토그램.
통계학 강의 허만형 ( 건국대 ) Darrell Huff 는 How to Lie with Statistics 를 썼습니다. 통계는 거짓말 하는 도구일까요 ?
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
5. 통계 1. 산포도와 표준편차.
Keller: Stats for Mgmt & Econ, 7th Ed
제 2장. 표와 그림을 통한 자료의 요약.
재료수치해석 HW # 박재혁.
제 4 장 정규분포로의 근사 단위변환 정규분포곡선 표준정규분포곡선 아래의 영역 찾기 자료에 대한 정규 근사 백분위수
제 7 장 함수 사용을 통해 엑셀 정복하기.
수문통계분석 담당교수명 : 서 영 민 연 락 처 :
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
Excel 일차 강사 : 박영민.
공차 및 끼워맞춤.
Excel과 통계학.
수치해석 6장 예제문제 환경공학과 천대길.
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
6장 그룹 함수.
디지털영상처리 및 실습 대구보건대학 방사선과.
기 술 통 계 학 6 1 기술통계학 2 자료의 정리 3 위치척도 4 산포의 척도.
제 3 장 수치요약 ∙ 상자그림 다섯 수치 요약 평균(Mean) – 어떤 경우에는 상당히 불확실 하다. 예를 들면
제2장 기초통계 양윤권 교수.
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
확률통계론 2장 : 확률변수.
제 10장 주성분 분석(PCA) 주성분 분석(PCA)이란? 여러 개의 양적변수들 사이의 분산-공분산 관계를
11장. 1차원 배열.
제4장 제어 시스템의 성능.
수학10-가 Ⅳ. 통 계 백암고등학교 수학교사 : 양상옥.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
제 3 장 수치요약 ∙ 상자그림 다섯 수치 요약 평균(Mean) – 어떤 경우에는 상당히 불확실 하다. 예를 들면
박성진 컴퓨터 프로그래밍 기초 [09] 배열 part 1 박성진
(Data Exploration & Analysis)
데이터 탐색 (Data Exploration) 2014년 가을학기 강원대학교 컴퓨터과학전공 문양세.
ITQ 정보기술자격 국가공인 Excel 2007 Ⅱ 함수- 11회차 강사 : 박영민.
자료의 표현.
자료와 자료 정리 자료 자료의 정리 중심위치의 측도 상대적 위치의 측도.
두 모집단에 대한 검정.
PSD센서 명령어 이해하기 목차 재료준비 및 브레드 보드 배선 구성하기 PSD센서 명령어 이해 및 실습 응용 작품 만들기.
구조체 배열 실습: 평점이 최고인 학생의 정보를 출력하기
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
Excel 일차 강사 : 박영민.
제3장 함수와 배열수식 전진환
Excel 일차 강사 : 박영민.
Chapter2. 기술통계(Descriptive Statistics)
2장 PHP 기초 PHP의 시작과 끝을 이해한다. 주석문에 대하여 이해한다. echo 문을 이용하여 화면에 출력하
제 5장 제어 시스템의 성능 피드백 제어 시스템 과도 성능 (Transient Performance)
DA :: 퀵 정렬 Quick Sort 퀵 정렬은 비교방식의 정렬 중 가장 빠른 정렬방법이다.
5장. 선택 알고리즘.
척도의 속성 - 목 차- 자료수집과정 척도의 속성 -명목척도 -서열척도 -등간척도 -비율척도 -리커트척도 3.Data(자료)
제2장 자료의 정리 및 기술통계 Min Gyoung Chan Ph.Dr..
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
11장 배열 1. 배열이란? 1.1 배열의 개요 1.2 배열의 선언과 사용.
비교분석 보고서 Template 2015.
상관계수.
Week 4: 다변수(2변수) 데이터분석 5장_1(산포도: scatter plot) 동영상 1,2,3,4,5
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
Excel 2007을 이용한 통계학 제 2 장 자료의 정리.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
영역 기반 처리.
NACST progress report 신수용.
Ch12. Deep Learning (Backpropagation)
문제의 답안 잘 생각해 보시기 바랍니다..
Presentation transcript:

제 3장. 수치를 통한 연속형 자료의 요약

1. 중심위치의 측도 (Measure of Center) 평균(mean) 중앙값(median) : 관측값을 크기 순으로 배열했을 때 가운데 값 자료의 개수(n) 홀수 일 때 번째 관측값 자료의 개수(n) 짝수 일 때 번째 관측값과 번째 관측값의 평균 최빈값(mode) :가장 자주 나오는 값

p52 예제1) 6명의 성적 89(5), 74(2), 91(6), 88(4), 72(1), 84(3) 평균=83, 중앙값=(3번째 성적+4번째 성적)/2 = (84+88)=86 p54 예제4) 6명의 성적/한 명의 성적 변동 89(5), 50(1), 91(6), 88(4), 72(2), 84(3) 평균=79, => 평균은 극단적인 값에 영향을 받는다

중심위치의 측도

2. 퍼진 정도의 측도 중심위치는 같으나 퍼진 정도가 다른 분포

2. 퍼진 정도의 측도(Measure of Dispersion) 1) 분산(Variance)과 표준편차 (Standard Deviation): 관측값이 자료의 중심 위치로부터 떨어진 정도.

2) 백분위수(Percentile) 와 사분위수범위(interquartile range) 최소 25% 50% 75% 최대 중앙값=50%백분위수

2) 백분위수(Percentile) 와 사분위수범위(interquartile range) 제 100xp 백분위수(the 100xpth percentile) 전체 관측값을 (100xp)%와 100x(1-p)%로 나눌 수 있는 값 자료수가 n일때, 그 값보다 작거나 같은 관측값의 수가 np개 이상, 크거나 같은 관측값이 n(1-p)개 이상인 값

(100xp)%백분위수 구하는 법 1. 관측값을 크기 순으로 2. np를 구한다 1) np가 정수이면 np 번째와 np+1 번째 관측값의 평균 2) np가 정수가 아니면 np정수부분에 1 을 더한 값 예제)

p64 예제8) n=6 자료: 72, 74, 84, 88, 89, 91 25% 백분위수(100x0.25% 백분위수) n=6, p=0.25=> np=1.5 1.5는 정수가 아니므로 (INT(1.5)+1)=2번째 관측값이 25% 백분위수 2번째 관측값=> 74

p67 예제8) n=6 자료: 72, 74, 84, 88, 89, 91 75% 백분위수(100x0.75%) np=6 x 0.75=4.5 4.5는 정수가 아니므로 (INT(4.5)+1)=5번째 관측값이 75% 백분위수 => 5번째 관찰값=>89

p67 예제8) n=6 자료: 72, 74, 84, 88, 89, 91 50% 백분위수(100x0.5%) np=6 x 0.5=3 =>정수 정수인 경우 (np번째 관측값+(np+1)번째관측값)/2 =>(3번째+4번째)/2 =(84+88)/2=86

p67 예제8) n=6 자료: 72, 74, 84, 88, 89, 91 25% 백분위수=Q1=74 75% 백분위수=Q3=89 사분위수범위(IQR)=Q3-Q1 최소 25% 50% 75% 최대 p67 예제8) n=6 자료: 72, 74, 84, 88, 89, 91 25% 백분위수=Q1=74 75% 백분위수=Q3=89 IQR=89-74=15

p65 예제7) 목적지까지 전철 소요시간42 40 38 37 43 39 78 38 45 44 40 38 41 35 31 44 중앙값을 구하라 30%백분위수를 구하라 사분위수범위를 구하라 EXCEL에 데이터 입력 정렬=>필요한 크기에 있는 값 선택

변동계수 상대적 퍼진 정도를 나타냄 단위에 영향을 받지 않음 P68예제10)

P68 예제10) A, B 두 회사 주식가격 날짜 A회사 B회사 1 76300 6400 2 77400 7000 3 77900 7400 4 77200 6900 5 76900 7300 6 78800 7600 변동계수=표준편차/표본평균 A회사 주식평균 및 표준편차: 77417, 861 1.11 B회사 주식평균 및 표준편차: 7100, 429 6.04 => B주식의 단위가격당 변동성이 더 크다.

EXCEL 실습 p80 예제14>음료수 한 병에 대한 부피 p42 예제13 데이터 ch2_ex13.xls 대표값과 퍼진 정도 값을 구하라 데이터=>데이터분석=>기술통계 수식=>함수=>통계=>AVERAGE, MEDIAN, VAR, STDEV, MAX, MIN, QUARTILE 사용 대화상자의 Value에 데이터 범위지정

3. 상자그림(BOX-PLOT) 위범위내 최대값 상사분위수(Q3) 중앙값 하사분위수(Q1) 아래범위내 최소값 * 이상값 * 이상값 위범위내 =Q3+1.5xIQR 아래범위내=Q1-1.5xIQR (IQR=Q3-Q1)

P75 예제12) 남녀를 구분한 키에 대한 자료

Excel 실습 p42 예제13 데이터 ch2.ex13.xls에서 상자그림을 그려라. 상자그림을 보고 분포모양을 설명하라.

4. 돗수분포표에서 자료의 요약 자료가 돗수분포표 형태이고 원 자료가 주어지지 않았을 때=>계급구간의 중간값 사용 계급의 개수: k, 계급의 중간값: 계급의 돗수: , 자료의 갯수: 표본평균 표본분산 표준편차

4. 돗수분포표에서 자료의 요약 P78 예제13)

EXCEL 실습 ch2_ex7.xls 자료를 이용하여 만든 돗수분포표로(앞장) 부터 구한 평균과 분산을 원 데이터로 부터 구한 값과 비교하라.

HW2 p87 #6.15 P89 #6.24, #6.25