2장. 데이터의 시각적 묘사
예제1-출산율 (1) 출산율 데이터의 시각화 데이터 정렬 출산율 도수분포표(histogram) 누적분포표 2008년 1학기 경영통계 예제1-출산율 (1) 출산율 데이터의 시각화 데이터 정렬 방법: 범주 선정 → 데이터→ 정렬 → 선택영역확장 → 정렬기준선정 출산율이 가장 높은 국가와 가장 낮은 국가는? 출산율 도수분포표(histogram) 5% 단위로 출산율에 따른 국가별 분포 파악 ‘Countif’ 함수를 사용 삽입 → 함수 → Countif 선택 → 범위 설정 → 기준제시 누적분포표 도구 → 데이터 분석 → 순위와 백분율 선택 히스토그램과 누적분포표를 한 번에 표현 도구 → 데이터 분석 → 히스토그램 선택 출산율 그래프 원형 그래프와 막대 그래프 그리기 데이터 범위에 빈도수, 계열의 항목 레이블에 계급을 선택함
예제1-출산율 (2) SPSS를 이용한 출산율 데이터의 시각화 도수분포표 그리기 용어설명 SPSS에서 도수분포표 그리기1 2008년 1학기 경영통계 예제1-출산율 (2) SPSS를 이용한 출산율 데이터의 시각화 도수분포표 그리기 용어설명 계급: 도수분포에서의 데이터가 속해 있는 기본 범주 빈도(수): 각 계급에 속하는 데이터 수 계급구간: 계급간 간격(폭) SPSS에서 도수분포표 그리기1 계급이나 계급구간을 분석자가 원하는 대로 결정한 후에 그림 우선 엑셀에서 구한 히스토그램 데이터를 SPSS로 복사 Graph→ Bar→ Values of individual cases 선정 → 빈도를 Bars represent에, 계급을 Category labels의 variable에 선정 SPSS에서 도수분포표 그리기2 컴퓨터가 자동으로 계급을 선정하고, 빈도를 계산하여 제시 이 경우 엑셀의 raw data를 그대로 SPSS에 복사 Graph→ Histogram→ Variables에 출산율 선정
예제1-출산율 (3) SPSS를 이용한 출산율 데이터의 시각화 도수분포표 그리기(계속) 도수분포표와 누적분포의 동시 확인 2008년 1학기 경영통계 예제1-출산율 (3) SPSS를 이용한 출산율 데이터의 시각화 도수분포표 그리기(계속) SPSS에서 누적분포표 그리기 Graph → Bar → Summaries for groups of cases 선정 → Bars represent에 Cum. % of cases 선정, Category axis에 출산율 선정 도수분포표와 누적분포의 동시 확인 Analyze→ Descriptive statistics→ Frequencies→ Variables에 출산율 선정 누적확률분포표와 히스토그램을 동시에 보여줌
예제2-연봉과 승수 연봉과 승수의 관계 산점도(Scatter chart) 데이터의 분포를 2차원 평면에 점으로 표현 2008년 1학기 경영통계 예제2-연봉과 승수 연봉과 승수의 관계 산점도(Scatter chart) 데이터의 분포를 2차원 평면에 점으로 표현 예제: 미국 프로야구 구단의 연봉과 승수 수평축에 연봉을, 수직축에 승수를 선정하여 양자간의 관계에 대해 개략적으로 확인 회귀분석(regression analysis) 관점에서는 연봉이 독립변수, 승수가 종속변수의 개념 SPSS에서 산점도 그리기 Graph→ Scatter→ Simple→ X axis에 연봉을, Y axis에 승수를 선정 산점도를 살핌으로써 양자 간에 어떠한 관계가 있는지 확인함
예제3-ATM 이용시간 (1) 교차제표(crosstab) 만들기 성별과 연령대에 따른 고객 수 2008년 1학기 경영통계 예제3-ATM 이용시간 (1) 교차제표(crosstab) 만들기 성별과 연령대에 따른 고객 수 Countif 함수를 이용, 아래의 경우에 대해 빈도를 계산 성별에 따른 고객 구분 연령대에 따른 고객 구분 성별과 연령대에 따른 고객 구분 성별과 연령대에 따른 평균 ATM 이용시간 엑셀에서 ‘Sumif’함수를 사용 성별에 따른 평균 ATM 이용시간 연령대에 따른 평균 ATM 이용시간
예제3-ATM 이용시간 (2) 피벗 테이블(pivot table) 만들기 1단계: 데이터 범주 선정 2008년 1학기 경영통계 예제3-ATM 이용시간 (2) 피벗 테이블(pivot table) 만들기 1단계: 데이터 범주 선정 A1부터 C51셀까지 데이터 범주를 선정함 2단계: 피벗 테이블 불러오기 데이터→ 피벗 테이블/피벗 차트 보고→ 디폴트 상태에서 테이블 입력 영역 선정 3단계: 피벗 데이트 만들기 레이아웃 선정 연령구분을 행에, 성별구분을 열과 데이터 영역으로 끌어다 부침 데이터 영역의 ‘합계: 성별구분’을 더블클릭 사용함수에서 ‘개수’선택 확인 후 마침 만약 빈도가 아닌 평균시간을 알고 싶다면? 데이터 영역에 ATM 이용시간을 끌어다 부친 후, 평균을 선정함