3장 데이터의 특성을 대표적인 수치로 표현하기 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

Slides:



Advertisements
Similar presentations
Symantec DLP 솔루션 1 Symantec DLP 주요기밀 유출 방지 솔루션. Agenda 정보보호 현황 1 Symantec DLP 정보유출 방지 솔루션 2 DRM / DLP비교 3 레퍼런스 및 요약 4 Q&A 5 Symantec DLP 솔루션 2.
Advertisements

기회 관리 SAP Best Practices for CRM SAP Best Practices.
신진영 현지 조사 방법 및 보고서 작성법 제 10 강 - 측정 및 척도 - - 통계적 추론 원리 -
마이크로소프트 OLAP 및 리포팅 솔루션을 근간으로 기간 시스템과 연계한 분석 시스템 구축 방안 우철웅기술이사컨설팅사업부 ㈜인브레인 I N B R E I N.
사전 프로세스 단계 SAP Best Practices. ©2012 SAP AG. All rights reserved.2 목적, 장점 및 주요 프로세스 절차 목적  이 비즈니스 프로세스 절차에는 특정 물류 시나리오의 표준 비즈니스 프로세스 절차를 진행하기 위해 사전에.
2 IE 8 과 ActiveX 컨트롤 정 성태 책임 컨설턴트 ㈜ 닷넷 엑스퍼트 3 MIC ( 신뢰등급 : Mandatory Integrity Control) 보호 모드와 MIC 의 관계 LCIE (Loosely-coupled Internet Explorer) ActiveX.
여신 관리 SAP Best Practices. ©2012 SAP AG. All rights reserved.2 목적, 장점 및 주요 프로세스 절차 목적  판매 문서를 생성하거나 변경할 때 여신 한도 점검을 수행합니다. 장점  대손 리스크 감소  안정성과 수익성 높은.
반복 제조 SAP Best Practices. ©2012 SAP AG. All rights reserved.2 목적, 장점 및 주요 프로세스 절차 목적  반복 제조는 일반적으로 생산 프로세스가 아래와 같은 기준에 부합하는 경우 사용됩니다. – 동일하거나 유사한 제품이.
포토 스탬프 제안서 제 안 사 : ㈜디제이어퍼 커뮤니케이션 대표이사 : 김강일. © 2006 DJ Upper Communication. All rights reserved. This presentation is for informational purposes only.
Windows 시스템 복구의 최강 ! Backup Exec System Recovery 7.0 서린정보기술㈜ 윤주병 대리.
NOROO R & C CO.,LTD. 615,PAKDAL-DONG, MANAN-GU, ANYANG-CITY, KYONGGI-DO, KOREA The information contained herein is believed to be reliable, but no representations,
완제품 (FERT) 자재 생성 ( 구성 자재에 대한 자재 변형 ) SAP Best Practices Baseline Package ( 한국 ) SAP Best Practices.
약식 캠페인 관리 SAP Best Practices for CRM SAP Best Practices.
SQL Server 2005 기반의 Microsoft Business Intelligence 전략 박명은 차장 SQL Technology Specialist 기술사업부 기업고객사업 한국마이크로소프트.
전국공무원노동조합 교육기관본부 경북대지부
Lync 2013 소개 및 구축 가이드 화상, 음성 및 회의 SMS&P TSS 양영건 차장 Microsoft Lync
한-칠레 FTA 협상 1. FTA (자유무역 협정) 2. FTA 첫 상대국으로서 칠레 3. 한-칠레 FTA 체결 과정
발표 순서 1 개 요 2 설계 단계에서 피로 건전성 평가 운영 단계에서 피로 건전성 평가 및 관리 3 4
사회보험 징수통합 관련 조사 결과 보고서 한국갤럽조사연구소
1953년 설탕회사로 시작한 제일제당의 영문사명이 CheilJedang Corp.에서 CJ Corp.으로 변경.
글로벌 비즈니스를 위한 클라우드 플랫폼 Microsoft Azure
Microsoft Operations Management Suite
Backup Exec System Recovery Manager 7.01 Configurations Guide
PaaS와 IaaS가 연계된 클라우드 서비스
Hillstone Next-Generation Firewall E-Series
Essential System Manager
안재훈 기업고객사업본부/기술사업부 한국마이크로소프트
11/9/2018 © 2014 Microsoft Corporation. All rights reserved. Microsoft, Windows, and other product names are or may be registered trademarks and/or trademarks.
Excel과 통계학.
Windows CE 5.0 Networking Internals
iGrafx Consulting Group
2장 데이터가 가지고 있는 특성을 정리하여 그래프로 표현하기
8가지 TIP으로 Windows 8 완전정복하기
Young Jun, Son Partner Account Manager
Name Title Company Name
원가회계의 기초 & 분류.
SQL Server 2000, SQL Server 2005 비교 자료
New 2007 Microsoft Office system
DAT305 SQL Server AlwaysOn Technologies: 올바른 고 가용성 기능 선택
SSAS 변화된 구조와 사용자 분석 화면 구현 우철웅 기술이사 BI 사업부 인브레인.
파생금융상품시장의 동향과 전망 -수익률 곡선과 통화스왑 베이시스를 중심으로
Windows Server 2008 보안 한국마이크로소프트.
Name Title Company Name
ASP.NET Mobile Controls
일타쌍피!! 아이유(IU)가 아니라 UI 테스트 길(Road)이 아니라 Load 테스트
.NET Application Upgrade 방안 및 TFS Upgrade
Social Web Development Platform ASP.NET Razor
시나리오: 사물 인터넷 (Internet of Things)
11장 세 개 이상의 모집단 평균에 대한 추론(분산분석)
13장 카이제곱(χ2)분석 2019년 2월 24일 오전 3시 39분2019년 2월 24일 오전 3시 39분
Volume Licensing Service Center
Visual Studio 2013 IDE의 새로운 기능 소개
Rain drop v1.o 기공소 운영관리 프로그램 COPYRIGHT 2015 TEAMK ALL RIGHTS RESERVED
1장 생활과 통계학 2019년 2월 25일 오전 9시 37분2019년 2월 25일 오전 9시 37분
산학협력단 연구지원금 시스템 사용자 매뉴얼 Copyrightⓒ2014 UOSICF. All Rights Reserved. 1.
기업고객사업본부 / 기술사업부 한국마이크로소프트
웹 성능 및 부하 테스트(Load Test)를 통한 소프트웨어 품질 향상방안
10장 두 개의 모집단에 대한 추론 2019년 4월 5일 오후 4시 22분2019년 4월 5일 오후 4시 22분
9장 모집단이 한 개인 경우의 통계적 추론 2019년 4월 6일 오후 2시 22분2019년 4월 6일 오후 2시 22분
UI 테스트 자동화(Coded UI Test)를 통한 품질 혁신 가이드
VS 2005와 VS 2003 동급 제품, upgrade path
Visual Studio 2013을 활용한 개발 생산성 및 코드 품질 혁신
8장 무죄인가 유죄인가를 판단하는 가설의 검정 2019년 5월 1일 오전 8시 29분2019년 5월 1일 오전 8시 29분
Visual Studio 2013을 활용한 개발 생산성 및 코드 품질 혁신
Name Title Company Name
7장 표본의 결과를 이용하여 모집단의 특성을 밝혀내자
Name Title Company Name
Name Title Company Name
7/10/2019 6:22 AM © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered.
5장 세상의 많은 현상들은 정규분포를 따른다. 2019년 7월 31일 오후 6시 46분2019년 7월 31일 오후 6시 46분
Presentation transcript:

3장 데이터의 특성을 대표적인 수치로 표현하기 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분 3장 데이터의 특성을 대표적인 수치로 표현하기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

학습할 내용 데이터의 중심을 나타내는 대푯값 데이터가 흩어져 있는 정도를 나타내는 산포도 엑셀을 이용한 대푯값과 산포도의 계산 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

데이터의 요약은 데이터의 성질이나 특징을 대표적인 수치로 표현하는 방법으로서, 요약의 대상으로 데이터의 중심위치가 어디인가를 나타내는 수치를 대푯값(measure of central tendency)이라 하고, 데이터들이 대푯값을 기준으로 얼마나 흩어져 있는가를 나타내는 것을 산포도(measure of dispersion)라 한다. 대푯값과 산포도 표시 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

3.1 데이터의 중심을 나타내는 대푯값 대푯값은 데이터의 중심을 나타내는 수치 가장 많이 사용하는 것이 평균(mean)이고, 평균 외에 중앙값(median)과 절사평균(trimmed mean)을 사용 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

평균(mean) 평균(mean)은 가장 많이 사용되는 대푯값으로서 아래의 수식과 같이 모든 데이터의 합을 데이터의 개수로 나눈 값을 말하며 통계분석에서 가장 많이 사용된다. 평균은 모든 데이터를 고려하기 때문에 데이터에 극단적인 값이 포함 될 경우에는 그 값으로 인해 평균이 왜곡되는 경향이 있으며, 이 경우에는 대푯값으로 중앙값을 사용하는 것이 바람직하다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

중앙값(median) 중앙값은 데이터를 크기 순서대로 나열할 때 가운데 위치하는 숫자를 말한다. 데이터의 개수가 홀수 일 때는 가운데 위치하는 유일한 숫자를, 짝수일 경우에는 가운데 위치하는 2개의 평균값을 이용한다. 중앙값은 평균과는 달리 극단적인 값에 영향을 받지 않는 장점이 있지만 가운데 위치하는 한 개 또는 두 개의 데이터만으로 계산된다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[참고 1] 극단적인 값이 포함된 데이터의 대푯값 비교 평균은 모든 데이터를 전부 고려하여 계산한 값으로서 역학적으로는 무게 중심이지만 중앙값은 데이터의 개수와 순서만을 고려하여 계산한다. 예를 들어 세 개의 추(10kg, 20kg, 60kg)가 있다고 가정. 이 데이터의 평균)은 아래와 같이 세 무게의 균형을 나타내는 시소의 중심이며, 중앙값은 개수(3)의 중앙(2)을 나타낸다. 만약 60kg의 추를 80kg으로 대체할 경우 평균을 나타내는 시소의 중심은 오른쪽으로 이동하지만, 중앙값은 변화하지 않고 그대로 20kg이 된다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

절사평균(trimmed mean) 절사평균은 평균의 장점과 중앙값의 장점을 갖는 대푯값. 체조, 다이빙 그리고 피겨스케이팅 등에서 심판의 주관적인 편견을 배제, 보완하기 위해 제일 높은 점수와 제일 낮은 점수를 제외(중앙값의 장점)한 나머지 심판들의 점수에 대한 평균(평균의 장점)으로 판정하는데 이를 절사평균이라 한다. 절사평균을 계산하려면 절사비율(%)을 결정해야 한다. 절사비율은 전체 데이터의 개수에 대해 몇 %의 데이터(상위+하위)를 배제할 것인가로 결정한다. 만약 5개의 데이터에 대해 가장 낮은 점수와 가장 높은 점수 각각 1개씩을 배제한다면 절사율은 40%(2/5)가 된다. 따라서 5개의 데이터에 대해 40% 절사평균은 데이터를 순서대로 나열했을 때, 가운데 위치하는 3개의 평균으로 계산한다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[예제 3-1] 평균, 중앙값, 절사평균의 계산 프로야구 선수들의 연봉 데이터(CD : 2장\프로야구연봉데이터.xlsx). 이 데이터에 대해 평균, 중앙값, 20% 절사평균을 계산 계산 결과 결과 파일 open © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[실습문제 1] 어느 회사의 출장비 데이터(CD:3장\출장비.xlsx)를 이용하여 출장일수와 출장비에 대해 평균, 중앙값, 20% 절사평균을 계산 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[실습문제 2] 어느 회사의 직원급여 데이터(CD:3장\직원급여.xlsx)를 이용하여 기본급, 가족수당에 대해 평균, 중앙값, 20% 절사평균을 계산 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

3.2 데이터가 흩어져 있는 정도를 나타내는 산포도 데이터들이 얼마나 흩어져 있는가를 나타내는 것을 산포도(measure of dispersion)라하며 대푯값과 마찬가지로 하나의 수치로 데이터가 흩어진 정도를 계산한다. 산포도는 대푯값과 더불어 데이터를 비교하는 경우에 유용하게 사용. 예를 들어 A와 B반의 성적을 비교할 때 평균은 50으로 같지만 두 집단의 히스토그램이 아래와 같이 나타난다면 평균이 같다고 하여 두 집단을 동일한 집단이라 볼 수 없다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

범위(range) 범위는 데이터의 최댓값과 최솟값의 차이로써 데이터가 퍼져 있는 정도를 나타내는 가장 간단한 방법. 범위가 클수록 산포가 크다고 말할 수 있지만 범위는 중앙값과 마찬가지로 극단적인 값에 영향을 받고, 데이터 중에서 오직 2개의 정보(최댓값, 최솟값)만을 이용하므로 적절한 척도로 사용하기가 어렵다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

사분위수 편차(quartile deviation) 사분위수 편차는 범위의 문제점을 보완한 척도 사분위수 편차를 계산하기 위해서 먼저 사분위 범위(interquartile range)를 계산해야 한다. 사분위 범위는 데이터를 크기순서로 나열한 다음, 개수로 4등분할 때 첫 번째 사분위수(Q1:1사분위수, 25%지점)와 세 번째 사분위수(Q3:3사분위수, 75%지점)의 차이를 말하며, 사분위수 편차는 이 값을 2로 나눈 값으로써 사분위 범위의 평균값이다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

분산(variance) 분산은 산포도의 척도로서 가장 널리 사용되는 방법. 분산은 데이터가 퍼져 있는 정도의 기준으로 평균을 사용하며 계산방법은 각 데이터와 평균( )과의 차이를 제곱하여 합한 값의 평균 분산을 계산할 때 데이터가 모집단 전체일 경우에는 데이터의 개수(n)로 나누어 주고, 표본일 경우에는 위의 식과 같이 (n-1)로 나누어 준다. 이렇게 계산하는 이유는 표본의 경우 n으로 나누어주는 것보다 (n-1)로 나누어 주는 것이 더 좋은 척도가 되기 때문인데 표본의 크기가 큰 경우에는 별 차이가 없다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

표준편차(standard deviation) 표준편차는 계산된 분산의 제곱근으로 계산. 표준편차는 산포도를 나타내는데 있어서 평균을 중심으로 일정한 거리에 포함된 데이터의 비율이 얼마인가를 계산할 때 사용되는 척도이며 단위를 사용할 수 있다. 분산과 표준편차는 모든 데이터를 고려한 척도이며, 모든 데이터가 동일한 값을 갖는다면 분산과 표준편차는 0으로 계산. 분산과 표준편차는 모든 데이터에 동일한 값을 더해 주거나 빼주어도 변하지 않는다. 단, 모든 데이터에 동일한 값(C)을 곱하면 분산은 분산×C2 으로 표준편차는 표준편차×C 만큼 커진다. 결과 표시 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[참고 2] 데이터의 비대칭도(왜도) 왜도는 분포의 모양이 대푯값(예를 들어 평균)을 중심으로 좌우의 모양이 대칭적인가 아닌가를 측정하는데 이를 통해 데이터가 한쪽 방향으로 얼마나 치우쳐져 있는가를 나타낸다. 왜도가 0에 가까운 값을 가지면 분포의 모양은 좌측 히스토그램과 같이 대푯값을 중심으로 좌우 대칭적인 모양을 한다. 왜도가 음수로 나타나면 가운데 히스토그램과 같이 오른쪽으로 치우친 분포(왼쪽 꼬리분포) 모양을 한다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[참고 2] 데이터의 비대칭도(첨도) 첨도는 분포가 대푯값을 중심으로 얼마나 모여 있는가를 나타내는 척도인데 나중에 설명할 정규분포(첨도=3)를 기준으로 비교. 데이터가 대푯값을 중심으로 상당히 많이 몰려 있다면 분포 가운데 모양이 아래 그림과 같이 뾰족한 모양(첨도>3)으로 나타날 것이고, 대푯값을 중심으로 좌우에 퍼져 있다면 가운데 모양은 완만(첨도<3)하게 나타난다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[예제 3-2] 산포도 계산 프로야구 선수들의 연봉 데이터(CD : 2장\프로야구연봉데이터.xlsx) 이 데이터에 대해 범위, 사분위수, 사분위 편차, 분산 그리고 표준편차를 계산. 함수사용 방법은 다음과 같다. 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[실습문제 3] 어느 회사의 출장비 데이터(CD:3장\출장비.xlsx)를 이용하여 출장일수와 출장비에 대해 범위, 사분위편차, 분산, 표준편차를 계산하시오. 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[실습문제 4] 어느 회사의 직원급여 데이터(CD:3장\직원급여.xlsx)를 이용하여 기본급, 가족수당에 대해 범위, 사분위편차, 분산, 표준편차를 계산하시오. 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

3.3 엑셀을 이용한 대푯값과 산포도의 계산 [기술 통계법]의 결과 표시 엑셀에서는 [통계 데이터 분석]에서 [기술 통계법]을 선택하면 다양한 척도를 한꺼번에 계산하여 출력할 수 있다. [기술 통계법]의 결과 표시 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[단계 1] 데이터의 입력과 통계 데이터 분석 프로야구 선수들의 연봉 데이터(CD : 2장\프로야구연봉데이터.xlsx) 리본(메뉴) 탭에서 [데이터] 탭을 선택한 다음 [데이터 분석]을 선택하면 [통계 데이터 분석] 대화상자가 나타나고, [기술 통계법]을 선택 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[단계 2] 기술 통계법 대화상자 기술 통계법 대화상자가 나타나면 데이터의 범위와 필요한 값을 입력 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[실습문제 5] 어느 회사의 출장비 데이터(CD:3장\출장비.xlsx)를 이용하여 출장일수와 출장비에 대해 기술통계법의 결과를 표시하시오. 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[실습문제 6] 어느 회사의 직원급여 데이터(CD:3장\직원급여.xlsx)를 이용하여 기본급, 가족수당에 대해 기술통계법의 결과를 표시하시오. 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[단원정리] 1/4 데이터의 요약 데이터의 요약은 데이터의 성질이나 특징을 대표적인 수치로 표현하는 방법으로서, 요약의 대상으로 데이터의 중심위치가 어디인가를 나타내는 수치를 대푯값(measure of central tendency)이라 하고, 데이터들이 대푯값을 기준으로 얼마나 흩어져 있는가를 나타내는 것을 산포도(measure of dispersion)라 한다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[단원정리] 2/4 대푯값 대푯값은 데이터의 중심을 나타내는 수치로서 가장 많이 사용하는 것이 평균(mean)이며 그 외에 중앙값(median)과 절사평균(trimmed mean)을 사용한다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[단원정리] 3/4 산포도 데이터들이 얼마나 흩어져 있는가를 나타내는 것을 산포도(measure of dispersion)라하며 대푯값과 마찬가지로 하나의 수치로 데이터가 흩어진 정도를 계산한다. 산포도는 대푯값과 더불어 데이터를 비교하는 경우에 유용하게 사용되며 범위, 사분위수 편차, 분산 그리고 표준편차를 척도로 사용한다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

[단원정리] 4/4 엑셀에서 기술 통계법 사용하기 엑셀에서는 [통계 데이터 분석]에서 [기술 통계법]을 선택하면 다양한 척도를 한꺼번에 계산하여 출력할 수 있다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분