Presentation is loading. Please wait.

Presentation is loading. Please wait.

3장 데이터의 특성을 대표적인 수치로 표현하기 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

Similar presentations


Presentation on theme: "3장 데이터의 특성을 대표적인 수치로 표현하기 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분"— Presentation transcript:

1 3장 데이터의 특성을 대표적인 수치로 표현하기 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분
3장 데이터의 특성을 대표적인 수치로 표현하기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

2 학습할 내용 데이터의 중심을 나타내는 대푯값 데이터가 흩어져 있는 정도를 나타내는 산포도 엑셀을 이용한 대푯값과 산포도의 계산
© 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

3 데이터의 요약은 데이터의 성질이나 특징을 대표적인 수치로 표현하는 방법으로서,
요약의 대상으로 데이터의 중심위치가 어디인가를 나타내는 수치를 대푯값(measure of central tendency)이라 하고, 데이터들이 대푯값을 기준으로 얼마나 흩어져 있는가를 나타내는 것을 산포도(measure of dispersion)라 한다. 대푯값과 산포도 표시 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

4 3.1 데이터의 중심을 나타내는 대푯값 대푯값은 데이터의 중심을 나타내는 수치
가장 많이 사용하는 것이 평균(mean)이고, 평균 외에 중앙값(median)과 절사평균(trimmed mean)을 사용 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

5 평균(mean) 평균(mean)은 가장 많이 사용되는 대푯값으로서 아래의 수식과 같이 모든 데이터의 합을 데이터의 개수로 나눈 값을 말하며 통계분석에서 가장 많이 사용된다. 평균은 모든 데이터를 고려하기 때문에 데이터에 극단적인 값이 포함 될 경우에는 그 값으로 인해 평균이 왜곡되는 경향이 있으며, 이 경우에는 대푯값으로 중앙값을 사용하는 것이 바람직하다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

6 중앙값(median) 중앙값은 데이터를 크기 순서대로 나열할 때 가운데 위치하는 숫자를 말한다. 데이터의 개수가 홀수 일 때는 가운데 위치하는 유일한 숫자를, 짝수일 경우에는 가운데 위치하는 2개의 평균값을 이용한다. 중앙값은 평균과는 달리 극단적인 값에 영향을 받지 않는 장점이 있지만 가운데 위치하는 한 개 또는 두 개의 데이터만으로 계산된다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

7 [참고 1] 극단적인 값이 포함된 데이터의 대푯값 비교
평균은 모든 데이터를 전부 고려하여 계산한 값으로서 역학적으로는 무게 중심이지만 중앙값은 데이터의 개수와 순서만을 고려하여 계산한다. 예를 들어 세 개의 추(10kg, 20kg, 60kg)가 있다고 가정. 이 데이터의 평균)은 아래와 같이 세 무게의 균형을 나타내는 시소의 중심이며, 중앙값은 개수(3)의 중앙(2)을 나타낸다. 만약 60kg의 추를 80kg으로 대체할 경우 평균을 나타내는 시소의 중심은 오른쪽으로 이동하지만, 중앙값은 변화하지 않고 그대로 20kg이 된다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

8 절사평균(trimmed mean) 절사평균은 평균의 장점과 중앙값의 장점을 갖는 대푯값.
체조, 다이빙 그리고 피겨스케이팅 등에서 심판의 주관적인 편견을 배제, 보완하기 위해 제일 높은 점수와 제일 낮은 점수를 제외(중앙값의 장점)한 나머지 심판들의 점수에 대한 평균(평균의 장점)으로 판정하는데 이를 절사평균이라 한다. 절사평균을 계산하려면 절사비율(%)을 결정해야 한다. 절사비율은 전체 데이터의 개수에 대해 몇 %의 데이터(상위+하위)를 배제할 것인가로 결정한다. 만약 5개의 데이터에 대해 가장 낮은 점수와 가장 높은 점수 각각 1개씩을 배제한다면 절사율은 40%(2/5)가 된다. 따라서 5개의 데이터에 대해 40% 절사평균은 데이터를 순서대로 나열했을 때, 가운데 위치하는 3개의 평균으로 계산한다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

9 [예제 3-1] 평균, 중앙값, 절사평균의 계산 프로야구 선수들의 연봉 데이터(CD : 2장\프로야구연봉데이터.xlsx). 이 데이터에 대해 평균, 중앙값, 20% 절사평균을 계산 계산 결과 결과 파일 open © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

10 [실습문제 1] 어느 회사의 출장비 데이터(CD:3장\출장비.xlsx)를 이용하여 출장일수와 출장비에 대해 평균, 중앙값, 20% 절사평균을 계산 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

11 [실습문제 2] 어느 회사의 직원급여 데이터(CD:3장\직원급여.xlsx)를 이용하여 기본급, 가족수당에 대해 평균, 중앙값, 20% 절사평균을 계산 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

12 3.2 데이터가 흩어져 있는 정도를 나타내는 산포도 데이터들이 얼마나 흩어져 있는가를 나타내는 것을 산포도(measure of dispersion)라하며 대푯값과 마찬가지로 하나의 수치로 데이터가 흩어진 정도를 계산한다. 산포도는 대푯값과 더불어 데이터를 비교하는 경우에 유용하게 사용. 예를 들어 A와 B반의 성적을 비교할 때 평균은 50으로 같지만 두 집단의 히스토그램이 아래와 같이 나타난다면 평균이 같다고 하여 두 집단을 동일한 집단이라 볼 수 없다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

13 범위(range) 범위는 데이터의 최댓값과 최솟값의 차이로써 데이터가 퍼져 있는 정도를 나타내는 가장 간단한 방법.
범위가 클수록 산포가 크다고 말할 수 있지만 범위는 중앙값과 마찬가지로 극단적인 값에 영향을 받고, 데이터 중에서 오직 2개의 정보(최댓값, 최솟값)만을 이용하므로 적절한 척도로 사용하기가 어렵다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

14 사분위수 편차(quartile deviation)
사분위수 편차는 범위의 문제점을 보완한 척도 사분위수 편차를 계산하기 위해서 먼저 사분위 범위(interquartile range)를 계산해야 한다. 사분위 범위는 데이터를 크기순서로 나열한 다음, 개수로 4등분할 때 첫 번째 사분위수(Q1:1사분위수, 25%지점)와 세 번째 사분위수(Q3:3사분위수, 75%지점)의 차이를 말하며, 사분위수 편차는 이 값을 2로 나눈 값으로써 사분위 범위의 평균값이다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

15 분산(variance) 분산은 산포도의 척도로서 가장 널리 사용되는 방법.
분산은 데이터가 퍼져 있는 정도의 기준으로 평균을 사용하며 계산방법은 각 데이터와 평균( )과의 차이를 제곱하여 합한 값의 평균 분산을 계산할 때 데이터가 모집단 전체일 경우에는 데이터의 개수(n)로 나누어 주고, 표본일 경우에는 위의 식과 같이 (n-1)로 나누어 준다. 이렇게 계산하는 이유는 표본의 경우 n으로 나누어주는 것보다 (n-1)로 나누어 주는 것이 더 좋은 척도가 되기 때문인데 표본의 크기가 큰 경우에는 별 차이가 없다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

16 표준편차(standard deviation)
표준편차는 계산된 분산의 제곱근으로 계산. 표준편차는 산포도를 나타내는데 있어서 평균을 중심으로 일정한 거리에 포함된 데이터의 비율이 얼마인가를 계산할 때 사용되는 척도이며 단위를 사용할 수 있다. 분산과 표준편차는 모든 데이터를 고려한 척도이며, 모든 데이터가 동일한 값을 갖는다면 분산과 표준편차는 0으로 계산. 분산과 표준편차는 모든 데이터에 동일한 값을 더해 주거나 빼주어도 변하지 않는다. 단, 모든 데이터에 동일한 값(C)을 곱하면 분산은 분산×C2 으로 표준편차는 표준편차×C 만큼 커진다. 결과 표시 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

17 [참고 2] 데이터의 비대칭도(왜도) 왜도는 분포의 모양이 대푯값(예를 들어 평균)을 중심으로 좌우의 모양이 대칭적인가 아닌가를 측정하는데 이를 통해 데이터가 한쪽 방향으로 얼마나 치우쳐져 있는가를 나타낸다. 왜도가 0에 가까운 값을 가지면 분포의 모양은 좌측 히스토그램과 같이 대푯값을 중심으로 좌우 대칭적인 모양을 한다. 왜도가 음수로 나타나면 가운데 히스토그램과 같이 오른쪽으로 치우친 분포(왼쪽 꼬리분포) 모양을 한다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

18 [참고 2] 데이터의 비대칭도(첨도) 첨도는 분포가 대푯값을 중심으로 얼마나 모여 있는가를 나타내는 척도인데 나중에 설명할 정규분포(첨도=3)를 기준으로 비교. 데이터가 대푯값을 중심으로 상당히 많이 몰려 있다면 분포 가운데 모양이 아래 그림과 같이 뾰족한 모양(첨도>3)으로 나타날 것이고, 대푯값을 중심으로 좌우에 퍼져 있다면 가운데 모양은 완만(첨도<3)하게 나타난다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

19 [예제 3-2] 산포도 계산 프로야구 선수들의 연봉 데이터(CD : 2장\프로야구연봉데이터.xlsx) 이 데이터에 대해 범위, 사분위수, 사분위 편차, 분산 그리고 표준편차를 계산. 함수사용 방법은 다음과 같다. 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

20 [실습문제 3] 어느 회사의 출장비 데이터(CD:3장\출장비.xlsx)를 이용하여 출장일수와 출장비에 대해 범위, 사분위편차, 분산, 표준편차를 계산하시오. 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

21 [실습문제 4] 어느 회사의 직원급여 데이터(CD:3장\직원급여.xlsx)를 이용하여 기본급, 가족수당에 대해 범위, 사분위편차, 분산, 표준편차를 계산하시오. 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

22 3.3 엑셀을 이용한 대푯값과 산포도의 계산 [기술 통계법]의 결과 표시
엑셀에서는 [통계 데이터 분석]에서 [기술 통계법]을 선택하면 다양한 척도를 한꺼번에 계산하여 출력할 수 있다. [기술 통계법]의 결과 표시 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

23 [단계 1] 데이터의 입력과 통계 데이터 분석 프로야구 선수들의 연봉 데이터(CD : 2장\프로야구연봉데이터.xlsx)
리본(메뉴) 탭에서 [데이터] 탭을 선택한 다음 [데이터 분석]을 선택하면 [통계 데이터 분석] 대화상자가 나타나고, [기술 통계법]을 선택 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

24 [단계 2] 기술 통계법 대화상자 기술 통계법 대화상자가 나타나면 데이터의 범위와 필요한 값을 입력 완성한 엑셀파일 열기
© 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

25 [실습문제 5] 어느 회사의 출장비 데이터(CD:3장\출장비.xlsx)를 이용하여 출장일수와 출장비에 대해 기술통계법의 결과를 표시하시오. 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

26 [실습문제 6] 어느 회사의 직원급여 데이터(CD:3장\직원급여.xlsx)를 이용하여 기본급, 가족수당에 대해 기술통계법의 결과를 표시하시오. 완성한 엑셀파일 열기 © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

27 [단원정리] 1/4 데이터의 요약 데이터의 요약은 데이터의 성질이나 특징을 대표적인 수치로 표현하는 방법으로서, 요약의 대상으로 데이터의 중심위치가 어디인가를 나타내는 수치를 대푯값(measure of central tendency)이라 하고, 데이터들이 대푯값을 기준으로 얼마나 흩어져 있는가를 나타내는 것을 산포도(measure of dispersion)라 한다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

28 [단원정리] 2/4 대푯값 대푯값은 데이터의 중심을 나타내는 수치로서 가장 많이 사용하는 것이 평균(mean)이며 그 외에 중앙값(median)과 절사평균(trimmed mean)을 사용한다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

29 [단원정리] 3/4 산포도 데이터들이 얼마나 흩어져 있는가를 나타내는 것을 산포도(measure of dispersion)라하며 대푯값과 마찬가지로 하나의 수치로 데이터가 흩어진 정도를 계산한다. 산포도는 대푯값과 더불어 데이터를 비교하는 경우에 유용하게 사용되며 범위, 사분위수 편차, 분산 그리고 표준편차를 척도로 사용한다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분

30 [단원정리] 4/4 엑셀에서 기술 통계법 사용하기
엑셀에서는 [통계 데이터 분석]에서 [기술 통계법]을 선택하면 다양한 척도를 한꺼번에 계산하여 출력할 수 있다. © 2007 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분


Download ppt "3장 데이터의 특성을 대표적인 수치로 표현하기 2019년 2월 25일 오전 9시 36분2019년 2월 25일 오전 9시 36분"

Similar presentations


Ads by Google