Keller: Stats for Mgmt & Econ, 7th Ed

Slides:



Advertisements
Similar presentations
19 장. 보건통계 (Public Health Statistics). 제 1 절. 보건통계의 정의 ▶ 보건통계의 의미 1. 지역사회나 국가의 보건 수준및 보건 상태 2. 보건사업의 필요성 결정 3. 보건입법을 촉구하며, 보건사업에 대한 공공지원을 촉진하게 할수 있음 4.
Advertisements

신진영 현지 조사 방법 및 보고서 작성법 제 10 강 - 측정 및 척도 - - 통계적 추론 원리 -
폭력. 폭력이란 무엇인가 우상의 눈물 물리적인 폭력 ( 최기표 ) VS 지능적인 폭력 ( 임형우, 담임선생님 )
통계학 강의 노트 제 2 장 0/10 기 초 통 계기 초 통 계 기 초 통 계기 초 통 계.
1 통계를 왜 공부해야 하나 ? Dept. of Public Administration Chungnam National University.
1 박 2 일 !!! 인천마장초등학교 유수아. 1 박 2 일 멤버 인기순 위 1 위 이승기 2 위 엄태웅 3 위 은지원 4 위 김종민, 이수근 ※인터넷에서 본것이기 때문에 사람에따라 서 다를 수 있다. ※
석관중앙교회 5남전도회 석 관 중 앙 교 회 회원 소식 통권 05-04호 발행일 : 2005년 04월 회 장 : 장진호 집사
2. 문학의 활동 방법 [1] 문학의 수용 01 소설가 구보 씨의 일일 작가 소개 작품 정리 읽기 중 활동 학습 활동.
1. 기관별 맞춤형 집중교육 : 실습 및 개인별 집중지도    1. 기관별 맞춤형 집중교육 : 실습 및 개인별 집중지도 (상설) 기관별 맞춤형 교육 - 당 교육기관에서.
지역사회복지론 1조. 요양보호시설에 대해서 황성국 임재형 이동영
표 및 그래프 작성.
Table과 Figure의 이해 장수희.
Keller: Stats for Mgmt & Econ, 7th Ed
통계적 품질관리(SQC).
기술 통계학 (Descriptive Statistics)
2장. 데이터의 시각적 묘사.
I 문학의 개념과 역할 1. 문학의 개념 (1) 언어 예술로서의 문학 (2) 소통 활동으로서의 문학
4. 목적론적 윤리와 의무론적 윤리 01. 경험주의와 이성주의 01. 경험주의와 이성주의 02. 결과론적 윤리와 공리주의
총괄생산계획 총괄생산계획 : 기업의 중기 또는 장기에 해당되는 생산계획으로 기업이 생산하는 제품의 포괄적인 범위에 대한 생산일정과 수량을 결정하는 과정. 시장수요를 충족시키기 위해 기업의 가용자원을 활용하고 관리하는 행위 총괄생산계획이 사용하는 자원의 대상 : 노동력,
Excel과 통계학.
의료의 질 평가 분석 기법 김 민 경.
제1장 과학과 사회조사방법 과학적 지식(scientific knowledge): 과학적 방법에 의해 얻어진 지식, 즉 논리적, 체계적, 경험적, 객관적 절차를 통해 얻어진 지식 과학적 지식의 특성 1) 재생가능성(reproducibility) 2) 경험가능성(empiricism)
엑셀을 이용한 테이블 자료 분석 한국어 정보의 전산 처리
아파트관리비 청구서 이용 프로세스 안내 ㈜한국전산기술.
9.확률 분포 정규 분포 형태 : 평균을 중심으로 좌우대칭의 종 모양을 가진 분포이다.
CHAPTER 21 UNIVARIATE STATISTICS
2016년 9월 전자전기컴퓨터공학부 김한준 소프트웨어시스템 실습 2016년 9월 전자전기컴퓨터공학부 김한준
MINITAB for Six Sigma.
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
4-1 Gaussian Distribution
대제목 -소제목 ?.
1. 논리적이란? 논리적이지 못하다 말이나 글에 두서가 없다. 1. 논리적이란? 논리적이지 못하다 말이나 글에 두서가 없다.
Keller: Stats for Mgmt & Econ, 7th Ed 그래프와 표를 이용한 기술통계학 기법
개항기 조선과 동아시아 박 범 한국역사입문Ⅱ.
Week 10:확률변수(Random Variable)
4. 도표 다루기.
(Data Exploration & Analysis)
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
경제통계학 개요 사공 용 서강대학교 경제학과.
Part3 . 경영관리 Week 4 경영학배움터 (The Future of Business) 6인공역 2판.
Inferences concerning two populations and paired comparisons
통계DB관리 시스템 소개 통계포털운영과 1.
Association between two measurement variables Correlation
Keller: Stats for Mgmt & Econ, 7th Ed 다중회귀분석 Multiple Regression
Statistical inference I (통계적 추론)
제1장 통계란? 제2장 데이터의 정리 제3장 데이터의 요약.
[ 강남구 청담동 “이동수에프엔지” ].
The normal distribution (정규분포)
대구의 부도심 대구의 주요축 동대구 부도심 4조 강민석 / 박성균 / 최은지/ 황재현/김예지.
사용자 경험 측정 (Measuring User Experience)
통계방법의 이해.
5장 사진 바꾸기, 2011년 제작 및 운영제안서 측정 및 척도구성.
■ 척도의 종류 : 변도(variance)를 나타내는 수치들이 가지는 특성에 따라 측정수준에 따른 분류 → 척도분류
Demand Forecast.
조 형 예 술.
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
2015년 2학년 1반.
경찰행정과 세미나 결과를 공개해야한다. VS 비공개로 해야한다. 경찰의 근무성적평정 제도.
제3장 사회조사방법의 기본개념 변수(variable): 사람, 물건, 사건 등의 특성이나 속성이 두 가지 이상의 가치(value)를 가질 때 변수라고 함. 즉 상호배타적인 속성들의 집합 1) 속성에 따른 분류 -. 명목변수(Nominal Variable): 분류에 기초를.
성전기공식(안) 식 순 1. 기공미사 2. 기 공 식 3. 축 하 연 천주교 수원교구 퇴촌성당.
의학자료분석론 교재: 강의록 Rosner B, Fundamentals of Biostatistics, 7th ed. Brooks/Cole Cengage Learning, Canada, 강의 평가: 출석 20% 숙제 30% 기말고사 50%
제안 제도 운영방안.
▶서류관리 프로그램 1. 로그인….2 2. 서류등록 … 서류도착 서류스티커발행
기 술 통 계 학 6 1 기술통계학 2 자료의 정리 3 위치척도 4 산포의 척도.
식중독 예방, 이렇게 합니다! - 수지노인복지관 식중독 예방 교재 - 1.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
산점도 (Scatter Diagram) (1) 개요
경영통계학 제1장 통계학은 어떤 학문인가? What is Statistics? 1.1.
Excel 2007을 이용한 통계학 제 2 장 자료의 정리.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
Presentation transcript:

Keller: Stats for Mgmt & Econ, 7th Ed April 12, 2019 켈러의 경영경제통계학 제2장 그래프와 표를 이용한 기술통계학 기법 Graphical and Tabular Descriptive Techniques Copyright © 2006 Brooks/Cole, a division of Thomson Learning, Inc.

기술통계학 Statistics Data Information -기술통계학(Descriptive statistics)은 유용한 정보가 생산되는 방식으로 데이터를 정리하고 요약한다. -기술통계학은 데이터를 요약하고 나타내기 위해 그래프 기법들과 수치적 기술척도들(예를 들면 평균)을 사용한다. Statistics Data Information

-그래프와 표를 이용한 기술통계학 방법들은 모집단과 표본 모두에 대하여 적용된다. Population Sample 부분집합 -그래프와 표를 이용한 기술통계학 방법들은 모집단과 표본 모두에 대하여 적용된다.

정의 -변수(variable) 는 모집단 또는 표본의 어떤 특성을 나타낸다. 예. 학생 학점. 일반적으로 대문자 X, Y, Z…로 나타낸다. -변수의 값(value)은 변수가 가질 수 있는 범위이다. 예. 학생 경영통계학 점수(0..100) -데이터(Data)는 변수의 관측값이다. 예. 학생 경영통계학 점수: {67, 74, 71, 83, 93, 55, 48}

데이터의 형태와 정보 -데이터는 (통계학의 관점에서 적어도) 3가지의 형태를 가진다: 구간데이터(Interval Data) 범주데이터(Nominal Data) 서열데이터(Ordinal Data)

구간데이터 -구간데이터(실수데이터) • 실수, 예:높이, 무게, 가격 등. • 정량데이터(quantitative data) 또는 수치데이터( numerical data)라고도 한다. -산술적 계산이 수행될 수 있음. 따라서 2 x 높이 또는 가격 +\2,000 등이 의미를 가진다.

범주데이터 예. 결혼상태에 대한 질문응답은 다음과 같은 코드로 나타낼 수 있다: -범주데이터 • 범주데이터의 값은 특정한 범주(category )를 나타낸다. 예. 결혼상태에 대한 질문응답은 다음과 같은 코드로 나타낼 수 있다: 독신= 1, 기혼= 2, 이혼= 3, 과부= 4 -범주데이터는 카테고리 특성을 가진다. 따라서 산술적 계산은 의미를 가지지 않는다. (예 과부÷ 2 = 기혼?!) -범주데이터는 정성데이터(qualitative data) 또는 카테고리 데이터 (categorical data)라고도 부른다.

서열데이터 -서열데이터는 범주의 성격을 가지나 서열데이터의 값들은 순서 또는 순위를 나타낸다. 예. 대학과목의 학점평가시스템: 부실=1, 보통=2, 양호=3, 매우 양호=4, 우수=5 -서열데이터에 대한 산술적 계산은 의미가 없지만(예. 2X보통=매우 양호?!), 단지 서열데이터 간의 순위만이 의미를 가진다 (예. 우수>부실 또는 보통<매우 양호). -순위는 각 범주에 부여되는 수치 값에 관계없이 유지된다.

데이터의 형태와 계산 • 모든 계산은 구간데이터에 대하여 가능하다. • 서열데이터의 경우 순위를 나타내는 계산만이 허용된다. • 명목데이터에 대한 어떠한 계산도 허용되지 않는다. 각 범주에 속한 수를 세는 것만이 의미를 가진다. ->이에 따라 다음과 같은 데이터의 순위구조(“hierarchy of data”)가 주어진다.

데이터의 순위구조 -구간데이터 값들은 실수이다. - 모든 계산이 가능하다.- 데이터는 서열데이터 또는 범주데이터로 전환될 수 있다. -서열데이터 -값들은 데이터의 순위를 나타내야 한다. -순위를 유지하는 계산만이 가능하다. -데이터는 범주데이터로 전환될 수 있으나 구간데이터로 전환될 수 없다. -범주데이터 -값들은 범주들을 나타내는 임의로 부과된 수치들이다. -발생도수에 기초한 계산만이 가능하다. -데이터는 서열데이터 또는 구간데이터로 전환될 수 없다.

범주데이터를 표와 그래프로 작성 -명목데이터의 경우에 허용되는 유일한 계산은 변수의 각 값에 속한 도수를 세는 것이다. -범주와 범주에 속한 도수를 나타내는 표, 즉 도수분포(frequency distribution)로 데이터를 요약할 수 있다. -상대도수분포(relative frequency distribution )는 범주와 범주의 발생비율을 정리한 것이다.

자료의 그래프적 표현 통계학에 대한 전문적인 지식이 없는 경우에도 쉽게 자료의 특성을 파악할 수 있도록 하는 기초적인 자료 요약방법이다. 대표적으로 도수분포표, 막대그림표, 기둥그림표, 원그림표, 상자그림(box plot), 줄기와 잎 그림(stem-and-leaf plot) 등이 있다. 기둥그림표와 원그림표 그림을 이용한 질적자료의표현방법은 기둥그림표(bar chart)와 원그림표(pie chart)가 있다. ▶ 기둥그림표란 질적 자료에서 각 범주에 속한 관측도수를 기둥형태로 표현하는 방법으로 기둥의 크기에 의하여 상대적인 도수의 크기를 비교할 수 있다. ▶ 원그림표는 각 범주의 관측도수의 상대적인 크기를 원을 분할한 형태로 표현하는 방법으로 파이(pie)를 분할하는 형태와 비슷하다고 하여 파이그림(pie chart)이라고 부르기도 한다.

원그래프 (pie chart) 적절한 수의 범주를 선택한다. 너무 많은 수의 범주를 선택하면 원그림표의 이해가 어렵게 된다. 각 부분의 크기는 실제 관측도수의 비율과 같도록 그리고 크기 순서로 정리한다.

원그래프(pie chart) 파이챠트는 상대도수를 나타낸다…

도수분포표 한 변수의 빈도수를 나타낸 표 예) 출신지별 도수 - 자료의 특성을 쉽게 이해할 수 있도록 수집된 자료를 적절한 범주로 나누고, 각 범주에 해당되는 빈도수를 기입하여 정리한 표 - 자료를 체계적으로 정리하는데 가장 간단하면서도 많이 사용 출신지 도수 서울 광역시 시군 21 16 13 합계 50 예) 출신지별 도수

- 되도록 정수, 짝수, 5의 배수를 사용하는 것이 좋다. 도수분포표의 작성방법 자료를 크기 순으로 배열 구간수 결정 구간 폭의 결정 -자료의 개수나 분포에 따라 달라져야 한다. -각 구간에 5개 이상의 숫자가 들어가도록 해야 한다. -구간의 개수가 20개를 넘지않도록 한다.(일반적으로 5-15구간) 구간폭 = (최대값-최소값)/구간수 - 되도록 정수, 짝수, 5의 배수를 사용하는 것이 좋다. - 구간 수와 폭이 결정되면, 각 구간의 하한값과 상한값을 표시하고, 모든 자료가 한 구간에 한번씩 들어가도록 작성함.

막대그래프는 종종 도수를 나타내기 위해 사용된다…. 도수분포표(막대그래프) 막대그래프는 종종 도수를 나타내기 위해 사용된다….

구간데이터를 위한 그래프 기법 -데이터가 구간데이터일 때 사용되는 그래프 기법들이 존재한다. -이와 같은 그래프 기법들 중에서 가장 중요한 기법이히스토그램 (histogram)이다. -히스토그램은 구간데이터를 요약하기 위해 사용되는 그래프기법일뿐만 아니라 확률을 설명하는데도 사용된다.

예2.4의 히스토그램

예2.4의 히스토그램 (18+28+14=60)÷200 = 30% 즉 장거리 전화비용의 거의 1/3은 $90이상이다. 월간 장거리 비용의 약 ½ (71+37=108) 은 $30 미만으로 “적다l” 월간 장거리 비용이 중간범위 에 존재하는 신규계약자 수는 적다

히스토그램 그리기 데이터의 수집 데이터의 도수분포 구하기… How? a) 계급의 수 결정… How? 표2.6 참조 관측치 수가 200인 경우, 계급 수는 7~10개이다… 또는 스터지 공식(Sturges’ formula), 즉 계급의 수 = 1 + 3.3 log (n), n=관측치 수 를 사용한다.

히스토그램 그리기 데이터의 수집 데이터의 도수분포 구하기… How? a) 계급의 수 결정. [8] b) 계급구간의 크기 결정… How? 데이터의 범위(range)를 구한다. 범위 = 최대값-최소값 = $119.63 – $0 = $119.63따라서 계급구간의 크기는 범위 ÷ (계급의 수) = 119.63 ÷ 8 ≈ 15

히스토그램 모습 대칭성(Symmetry) -히스토그램의 중심에 수직선을 그리고 수직선의 양측이 모습에서 동일하면 히스토그램은 대칭이라고 말한다. Frequency Frequency Frequency Variable Variable Variable

히스토그램 모습 왜도(비대칭성의 정도:Skewness) -비대칭 히스토그램은 왼쪽 또는 오른쪽으로 긴 꼬리를 가진다. Frequency Frequency Variable Variable 양의 비대칭 음의 비대칭

최빈계급(modal class)은 관측치의 수가 최대인 계급이다 히스토그램 모습 봉우리 계급구간의 수(Modality) -단봉(unimodal )히스토그램은 하나의 봉우리 를 가진 히스토그램이고, 양봉(bimodal )히스토그램은 두 개의 봉우리 를 가진 히스토그램이다 Bimodal Unimodal Frequency Frequency Variable Variable 최빈계급(modal class)은 관측치의 수가 최대인 계급이다

히스토그램 모습 종모양(Bell Shape) -대칭 단봉 히스토그램(symmetric unimodal histogram)의 한 가지 특별한 형태가 종모양의 히스토그램이다. -많은 통계 기법은 모집단이 종모양이어야 한다는 조건을 요구한다. -히스토그램을 그려보는 것은 모집단의 모습이 가져야 하는 조건이 충족되는지를 살펴보는데 도움이 된다. Frequency Variable 종모양 히스토그램

히스토그램의 비교 -예제2.6의 히스토그램과 예제 2.7의 히스토그램을 비교하라. 단봉 vs. 양봉l 경영통계학 점수의 히스토그램과 수리통계학 점수의 히스토그램은 매우 다르다. 단봉 vs. 양봉l 점수의 분포(좁다 /넓다)

누적백분율곡선 (Ogive) -Ogive(pronounced “Oh-jive”)는 누적도수분포 (cumulative frequency distribution )의 그래프이다. -Ogive는 3단계로 그린다… (1) 도수분포로부터 상대도수(relative frequencies)를 계산한다. (2) 누적상대도수를 계산한다. (3) 누적상대도수를 그래프로 그린다.

누적백분율곡선 (Ogive)

50번째 퍼센타일(50th percentile)에 해당되는 장거리 전화비용은 얼마인가? 누적백분율곡선 (Ogive) 50번째 퍼센타일(50th percentile)에 해당되는 장거리 전화비용은 얼마인가? “약 $35”

시계열 데이터 설명 -동일한 시점에 측정되는 관측치들은 횡단면 데이터(cross- sectional data)라고 부른다. -연속적인 시점들에서 측정되는 관측치들은 시계열 데이터(time-series data)라고 부른다. -시계열 데이터는 선 그래프(line chart )에 의해 그래프로 그려진다. 선 그래프에서 수직축은 변수의 값을 나타내고 수평축은 시간을 나타낸다.

예 2.8가솔린 가격선 그래프

1982-84 불변가격으로 나타낸 가솔린 가격

2.6 두 구간변수의 관계 설명하기… ->두 구간변수간의 관계를 그래프로 나타내기 2.6 두 구간변수의 관계 설명하기… ->두 구간변수간의 관계를 그래프로 나타내기 -두 구간변수간의 관계를 나타내기 위해 산포도(scatter diagram )가 사용된다. -독립변수(independent variable)는 X로 표시하고 일반적으로 수평축에 나타내는 반면 종속변수 (dependent variable)는 Y로 표시하고 수직축에 나타낸다.

예제 2.12 주택가격과 주택크기의 관계분석 -한 부동산 중개인은 주택의 판매가격이 주택크기와 어느 정도 관계가 있는지를 알고자 하였다. -이와 같은 정보를 얻기 위해 그는 최근에 판매된 12개의 주택 표본을 선택하고 주택판매가격(1000달러기준)과 주택크기(100 제곱피트 기준)를 기록하였다. 이와 같은 데이터가 아래와 같이 정리되어 있고 Xm02-12에 저장되어 있다. Size 23 18 26 20 22 14 33 28 23 20 27 18 Price 315 229 355 261 234 216 308 306 289 204 265 195 -주택가격과 주택크기 간의 관계를 나타내기 위해 그래프기법을 사용

예제 2.12 주택가격과 주택크기의 관계분석 -산포도에 의하면 주택크기가 더 클수록 주택가격은 더 높다는 관계가 존재하는 것으로 보인다.…

산포도의 모습 -선형관계의 강도와 선형관계의 방향이 산포도에서 중요한 두 가지 개념이다. 양의 선형관계 음의 선형관계 -선형관계의 강도와 선형관계의 방향이 산포도에서 중요한 두 가지 개념이다. 양의 선형관계 음의 선형관계 비선형 관계

요약… 구간데이터 명목데이터 일 변수 데이터 히스토그램, 누적백분율곡선, 줄기-잎 그림 빈도/상대빈도분포막대그래프, 파이차트 두 변수의 관계 산포도 교차분류표, 막대그래프