제 2장. 표와 그림을 통한 자료의 요약
소개 자료에 내포된 전반적인 내용 쉽고 빠르게 내용파악을 위해 자료의 조직화, 축소화 표, 그림, 수치 사용 자료의 형태 - qualitative data, categorical data - quantitative data(양적데이터)
자료의 종류 변수 : 관심의 대상이 되는 특성. (변수의 종류는 자료의 종류에 대응된다.) 범주형 자료 명목형 자료 : 전공, 성별, 출생도, 혈액형 (질적 자료) 순위형 자료 : 선호도 조사 (ex. 매우 좋다, … , 매우 싫다.) 수치형 자료 이산형 자료 : 개수, 명수 등 주로 세는 것. (양적 자료) 연속형 자료 : 키, 몸무게, 온도 변수 : 관심의 대상이 되는 특성. (변수의 종류는 자료의 종류에 대응된다.)
질적자료(qualitative data) 특정성질의 소유 유무(명목형:nominal) 예) 성별(남,녀), 혈액형, 흡연유무 순위가 있는 범주(순위형: ordinal) 예) 학점, 선호도, 설문조사 응답항목
범주형 자료의 요약 : 관측 결과가 몇 개의 범주로 나타나는 자료 돗수분포표 돗수(frequency):각 범주에 속하는 관측 값의 개수 상대돗수(relative frequency): 돗수를 자료의 전체 개수로 나눈 비율 돗수분포표(frequency table): 범주와 돗수, 그리고 상대돗수를 나열한 표
범주형 자료의 요약 원형그래프(Pie Chart) 막대그래프(Bar Chart) 원을 범주의 상대돗수에 비례하여 중심각을 나눈 그림 상대돗수를 기입하여 돗수차이 파악 막대그래프(Bar Chart) 각 범주에서 돗수의 크기를 막대로 표시한 그래프
P9. 예제2) 60명에 대한 혈액검사 혈액형 돗수 상대돗수(%) 각도 A B AB O 22 20 7 11 36.67 33.33 11.67 18.33 132 120 42 66 합 60 100 360
파레토그림(Preto Diagram) 명목형 자료에서 다수를 점유하는 중요한 소수(vital few)를 찾는데 사용 예) 80% 고장 요인이 두 가지 요인에 기인 예) 전체 부의 80%를 대략 20%의 사람이 소유 상대돗수가 큰 순서로 막대그래프 크기 순서로 배열된 범주에 누적상대돗수를 표시한다. 상대돗수 증가 비율을 파악 p12: 예제4) 미용용 화장지 500장 조사: 불량원인 조사 =>찢어짐과 구멍 뚫림이 78% 차지함
파레토그림 혈액형 파레토그림
엑셀 데이터 분석 설치 EXCEL 2010 파일->옵션->추가기능->선택 후 이동단추 클릭 분석도구 선택 후-> 확인 데이터메뉴에 데이터분석 항목 확인
Excel 실습 아래 표를 이용하여 원형그래프, 막대그래프와 파레토그래프를 그린다. 먼저 엑셀 작업시트에 표를 입력한다. 혈액형 혈액형돗수 상대돗수(%) 각도 A B AB O 22 20 7 11 36.67 33.33 11.67 18.33 132 120 42 66 합 60 100 360
세로막대 누적도수그래프 삽입->차트 1단계: 데이터선택: 표 전체를 지정 => 계열 및 가로축 레이블 확인 2단계: 차트종류 선택(세로막대형 선택, 하위종류로 누적세로막대형 선택) 3단계 : 디자인=>차트레이아웃 선택 레이아웃=>차트제목:차트 위 축제목: 가로 축, 세로 축 제목 데이터레이블에서 값 표시 선택 축, 눈금선 조정
원형차트(Pie Chart) 삽입->차트 1단계: 데이터범위 지정: 표 전체를 지정 => 계열 위치가 열로 표시됨 지정 => 계열 위치가 열로 표시됨 2단계: 차트종류 선택(‘원형’을 선택) 나머지 단계는 동일
파레토그림 상대돗수를 구한다 상대돗수의 크기순으로 돗수분포표 정렬 상대누적돗수 계산 데이터=> 정렬=> 정렬기준으로 상대돗수 열 선택(내림차순) 상대누적돗수 계산 막대그래프를 그린다(혈액형, 돗수, 상대돗수, 상대누적돗수) 이중 축 사용 상대누적도수 막대그래프 선택 막대그래프에서 마우스오른쪽 단추 ->데이터선택->상대돗수제거 데이터계열 지정=> 보조축 선택 누적상대돗수 막대그래프에서 마우스오른쪽 단추 => 차트선택=>꺽은선 선택
양적자료의 요약 1. 돗수분포표 돗수분포표란 관측값의 종류가 많기 때문에 관측값의 범위를 몇 개의 구간으로 구분 계급: 나뉘어진 각 부분 계급구간: 계급에 포함된 값의 범위 도수: 계급 구간에 들어간 관찰값의 수
양적자료의 요약 돗수분포표 작성 방법 자료의 범위: 최대값-최소값 계급구간의 폭 계급구간의 경계점을 구한다 계급의 수 결정: 5~15 계급구간의 폭 >= 범위/계급의 수 계급구간의 경계점을 구한다 계급구간 별 돗수를 구한다 계급구간 별 상대돗수를 구한다
양적자료의 요약 p19_예제7) 신입생 51명의 키(cm) 자료: ch2_ex_7.xls 1. 범위=31, 최소값=152, 최대값=183 2. 계급 개수=7, 계급의 폭>=31/7=4.4 => 계급의 폭=5 3. 계급구간: 최소값=152, 최대값=183 149.5~154.5, 154.5~159.5,….. 각 빈도수는 하나 낮은 계급값보다 크고 해당 계급값보다 작거나 같은 값을 갖는 빈도수 4. 계급별 돗수 5. 상대돗수
양적자료의 요약 2. 히스토그램 3. 돗수다각형(Frequency Polygon) 양적자료에서 돗수분포표에 기초한 막대그래프 막대의 높이는 상대돗수를 계급구간의 폭으로 나눈 값 히스토그램의 전체 면적은 1 3. 돗수다각형(Frequency Polygon) 히스토그램에서 막대 상단의 중앙점을 직선으로 연결 관측값의 분포 정도를 알 수 있다.
양적자료의 요약 4. 줄기-잎 그림(Stem-and-leaf Plot) 자료의 분포를 시각적으로 표시하면서 개개의 관찰값을 표시 작성방법 관측값의 앞 단위와 뒷 단위 구분 앞 단위를 줄기로 세로로 배열한 후 수직선 뒷 단위를 잎으로 하여 크기 순으로 관측값 앞 단위 오른쪽에 기입
양적자료의 요약 5. 분포의 모양 좌우대칭형 오른쪽 편중(skewed to the left) 왼쪽 편중 (skewed to the right) 균일형 이봉형
Excel 실습(예제7) 1) Data 입력: p19 2) 수식 -> 함수삽입 -> 통계 ch2_ex_7.xls 자료 오른쪽에 구간대표값과 계급구간(5씩)을 입력 152 154.5 157 159.5 ⋮ ⋮ 182 184.5 2) 수식 -> 함수삽입 -> 통계 MAX, MIN을 호출 (범위 지정) 계급의 수=7 (MAX 183-MIN 152)/7=4.4 계급의 너비=5 계급: 152+5/2=154.5, 159.5……
히스토그램 막대에서=> 오른쪽 마우스 클릭=>차트종류=>꺽은선 선택 3) Histogram(오피스그림->엑셀옵션1->추가기능->분석도구) 데이터 -> 데이터분석 -> 히스토그램 입력데이터 범위지정 계급구간지정:돗수분포표에서 작성한 계급구간 이용 데이터 이름표 유무 지정 출력범위 지정 파레토그림, 누적백분률, 차트출력 4) 돗수다각형 히스토그램 막대에서=> 오른쪽 마우스 클릭=>차트종류=>꺽은선 선택
돗수 다각형은 삽입-> 영역선택후 꺽은 선 그래프를 선택한 후 그릴 수도 있다. 참고로 다음 슬라이드와 같이 돗수를 구할 수도 있다
Excel 실습(예제7) 1) Data 입력: p19 ch2_ex_7.xls 자료 오른쪽에 구간대표값과 계급구간(5씩)을 입력 152 154.5 157 159.5 ⋮ ⋮ 182 184.5 2) 수식 -> 함수삽입 -> 통계 -> FREQUENCY FREQUENCY 대화상자에서 - Data_array: 데이터 범위(절대주소 사용: $A$2:$A$52) - Bins_array: 계급구간이 있는 셀 주소(첫구간만) - Ctrl+Shift+Enter => 결과 누적도수 => 절대도수표를 만든다.
Excel 실습 p35 P42 예제12, 13 데이터를 직접 입력하고 과정을 따라 해 본다. 130명의 사망자 목록의 사망원인 자료. 원인별 돗수분포표 작성, 원형그래프 작성 및 파레토 그림 그려볼 것 p.9 예제 2와 같이 데이터가 주어졌을 때 히스토그램 그리기
HW.#1 자료 정리하기 관심대상 분야를 하나 선정 할 것. P.44 # 6.3 P. 49 #6.13(엑셀화일이나 다른 에디터 사용하여편집해서 종합정보시스템에 제출) 자료 정리하기 관심대상 분야를 하나 선정 할 것. 자료를 수집하여 정리할 것 (예를 들면 지역별 성비(남/여), 대학별 입시 지원율, ….) www.nso.go.kr (통계청)참조 레포트 제출할 때는 자료수집 경과와 자료를 제출할 것. 물론 자료에 대한 정리(수치, 표, 그림)도 같이 할 것