제2장 기초통계 양윤권 교수.

Slides:



Advertisements
Similar presentations
1)RACK 2)UPS 3)P D U 장치 4)Server Group 5)KVM Switch 7)UPS 를 위한 HUB 6) RACK Monitor.
Advertisements

1. 도형의 연결 상태 2. 꼭지점과 변으로 이루어진 도형 Ⅷ. 도형의 관찰 도형의 연결상태 연결상태가 같은 도형 단일폐곡선의 성질 연결상태가 같은 입체도형 뫼비우스의 띠.
5. 통계 1. 산포도와 표준편차.
Keller: Stats for Mgmt & Econ, 7th Ed
적외선으로 감지하는 추적 카메라 조원 : 최승호, 백진영, 이현지.
재료수치해석 HW # 박재혁.
제 4 장 정규분포로의 근사 단위변환 정규분포곡선 표준정규분포곡선 아래의 영역 찾기 자료에 대한 정규 근사 백분위수
제 7 장 함수 사용을 통해 엑셀 정복하기.
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
고장률 failure rate 어떤 시점까지 동작하여 온 품목이 계속되는 단위기간내에 고장을 일으키는 비율(횟수). 고장률은 확률이 아니며 따라서 1 보다 커도 상관없다. 고장이 발생하기 쉬운 정도를 표시하는 척도. 일반으로 고장률은 순간고장률과 평균고장률을 사용하고 있지만.
공차 및 끼워맞춤.
수치해석 6장 예제문제 환경공학과 천대길.
제9장 샘플링과 오차 표본: 시료, Sample 모집단 : 공정, Lot Sampling
제12주 회귀분석 Regression Analysis
제 3장. 수치를 통한 연속형 자료의 요약.
Multimedia Programming 10: Point Processing 5
Error Detection and Correction
멀티미디어 시스템 (아날로그 이미지,신호를 디지털로 변환 방법) 이름 : 김대진 학번 :
제 13 장 정규분포곡선과 확률히스토그램 동전던지기와 정규분포 개념이 다른 두 히스토그램 : 경험적 히스토그램과 확률히스토그램
비선형 방정식 김영광.
상관함수 correlation function
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
제 7장 연관성분석 화장품과학과 홍보람.
제4장 제어 시스템의 성능.
별의 밝기와 거리[2] 밝다고 가까운 별은 아니야! 빛의 밝기와 거리와의 관계 별의 밝기 결정.
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
기술통계.
수학10-가 Ⅳ. 통 계 백암고등학교 수학교사 : 양상옥.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
군집 분석.
자료의 표현.
8장. spss statistics 20의 데이터 변환
Frequency distributions and Graphic presentation of data
제4장 검사 및 품질인증 II Topic: 품질관리 Q: 대량생산되는 부품의 품질은 어떻게 관리하는가?
P 등속 직선 운동 생각열기 – 자동차를 타고 고속도로를 달릴 때, 속력계 바늘이 일정한 눈금을 가리키며 움직이지 않을 때가 있다. 이 때 자동차의 속력은 어떠할까? ( 속력이 일정하다 .)
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
Excel 일차 강사 : 박영민.
제3장 함수와 배열수식 전진환
Sampling Distributions
바넘효과 [Barnum effect] 사람들이 보편적으로 가지고 있는 성격이나 심리적 특징을 자신만의 특성으로 여기는 심리적 경향. 19세기 말 곡예단에서 사람들의 성격과 특징 등을 알아 내는 일을 하던 바넘(P.T. Barnum)에서 유래하였다. 1940년대 말 심리학자인.
통계해석 및 오차의 제거.
2장 PHP 기초 PHP의 시작과 끝을 이해한다. 주석문에 대하여 이해한다. echo 문을 이용하여 화면에 출력하
Chapter 1 단위, 물리량, 벡터.
제 5장 제어 시스템의 성능 피드백 제어 시스템 과도 성능 (Transient Performance)
DA :: 퀵 정렬 Quick Sort 퀵 정렬은 비교방식의 정렬 중 가장 빠른 정렬방법이다.
1. MTBF의 정의 평균고장간격시간 (Mean Time Between Failures)의 의미로 신뢰성을 나타내는 지표이다.
5장. 선택 알고리즘.
Chapter 1 단위, 물리량, 벡터.
1. 정투상법 정투상법 정투상도 (1) 정투상의 원리
척도의 속성 - 목 차- 자료수집과정 척도의 속성 -명목척도 -서열척도 -등간척도 -비율척도 -리커트척도 3.Data(자료)
제2장 자료의 정리 및 기술통계 Min Gyoung Chan Ph.Dr..
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
7장 원운동과 중력의 법칙.
상관계수.
기체상태와 기체분자 운동론!!!.
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
제 16장 비율의 정확성 머리말 신뢰구간 신뢰구간의 해석.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
8장 표면거칠기 1. 표면 거칠기의 종류 - KS의 가공 표면의 거칠기(요철현상)를 지시하는 방법 최대높이 거 칠기(Ry), 10점 평균 거칠기(Rz), 산술(중심선) 평균 거칠기(Ra), 요철의 평균 간격(Sm), 국부 산봉우리의 평균 간격(S), 부하 길이 율(tp)
Ch12. Deep Learning (Backpropagation)
문제의 답안 잘 생각해 보시기 바랍니다..
알렌 인지 수준 판별검사와 한국판 간이 정신상태 판별검사의 상관관계
Survey Sampling Sangji University.
피보나치수열에 대하여 한림초 5학년 신동오.
Presentation transcript:

제2장 기초통계 양윤권 교수

2장 기초통계 백분위(percentile rank)는 주어진 한 어느 집단 내에서 개인의 위치를 나타내는 것 1. 백분위와 즉, 전체사례에 대한 백분율을 말함 백분점수(percentile score)란 점수의 분포상에서 어떤 점수가 분포의 위나 아래로부터 몇%에 해당하느냐를 나타낸 점수 2장 기초통계 1. 백분위와 백분점수

2. 집중경향(Central tendency) 한 집단의 어떤 특성은 개개의 여러 가지 특성들이 종합되어 그 집단의 특성을 이루게 됨 한 집단의 전체적인 특성을 이해하기 위해서는 개개의 특성을 측정하여 점수화 하였을 때 이 집단의 특성을 하나의 수치로 대표하고자 하는 것이 집중경향의 목적 한 집단의 특성을 단일한 수치로 기술해주는 대표치 가운데 흔히 사용하는 예로 -평균값, 중앙값, 최빈값 이있다.

2. 집중경향 (1)평균값(mean) 평균의 특징 평균값은 한 집단에 속해 있는 모든 측정값의 합을 이 집단의 전체 인원수 또는 사례수로 나눈 값을 의미 X, M으로도 표시하며 집중 경향값으로서 가장 많이 사용 평균값의 평균 1반 평균=A, 1반 총인원=a, 2반 평균=B, 2반 총인원=b, 3반 평균=C, 3반 총인원=c라 했을 때 평균값의 평균은? A×a+B×b+C×c/A+B+C=X 평균의 특징 평균으로부터 모든 점수의 차의 합은 0 이 된다 평균은 점수 분포의 균형을 이루는 점이 된다.

2. 집중경향 (2)중앙값(median) 중앙값의 개념 중앙값의 특성 중앙값의 용도 중앙값이란 한 집단의 점수분포 상에서 전체사례를 상위반과 하위반으로 나누는 점을 말함. 이 중앙치를 중심으로 전체사례의 반이 이 점수의 상위에, 나머지 반이 이 점수의 하위에 있게 됨 (예) 측정치가 4, 6, 7, 8, 9, 11, 14, 15, 17 일 때 중앙치는 중간인 9가 된다 중앙값의 개념 몇 개의 극단값이 출현할 때, 중앙값은 단지 상위와 하위를 반으로 나누는 점이기 때문에 평균치보다 그 영향을 적게 받는다. 분포가 매우 편포되어 불균형을 이루거나, 몇 개의 극단적인 점수를 가졌을 때는 중앙값이 평균값보다 집단의 특성을 더 잘 나타내 줄 수 있음 중앙값의 특성 1) 평균값을 계산할 만한 충분한 시간이 없을 때 2) 분포가 심하게 편포되어 있을 때, 또는 극단에(맨 끝) 점수가 하나 둘 있을 때 3) 분포의 상반부, 하반부에 관심이 있을 뿐, 중앙에서의 거리에는 관심이 없을 때 4) 측정단위의 동간성이 의심될 때 중앙값의 용도

2. 집중경향 (3)최빈값(mode) 최빈값의 개념 최빈값의 특징 최빈값의 용도 최빈값은 한 분포에서 가장 빈도가 많은 점수, 즉 가장 많이 나타나는 점수를 의미한다. (예) 측정값이 12, 12, 14, 14, 18, 18, 18, 19, 20, 20. 18 일 때 18은 빈도가 4개로 가장 많으므로 18이 최빈값이 됨. 최빈값의 개념 최빈값은 중심경향을 계산하지 않고 대강 빨리 짐작하려는 경우에만 사용 최빈값의 특징 1) 대표값을 빨리 추정하고 싶을 때 2) 대표값을 대략적으로 파악해도 좋을 때 3) 가장 흔하게 일어나는 경우를 알고 싶을 때 최빈값의 용도

평균, 중앙값, 최빈값의 비교 부적편포 M Mdn MO Mo Mdn M 정적편포 정상 분포 쌍봉 분포

3. 분산도(산포도) 평균값, 중앙값, 최빈값 등과 같은 집중경향값 들은 자료의 대표적 경향을 나타내 주기는 하지만 두 집단의 평균은 같으나 분산도가 다른 경우 평균값, 중앙값, 최빈값 등과 같은 집중경향값 들은 자료의 대표적 경향을 나타내 주기는 하지만 점수의 분포상태 즉 전체적인 모습에 정보는 제공해 주지 못함

여러 가지가 있는데 그 특징과 제한점은 각각 다르다. 두 집단의 평균은 같으나 분산도가 다른 경우 두 개 이상의 집단을 비교할 때는 그 집단의 집중경향 값을 살펴보는 것 이외 각 점수 또는 측정값들이 평균값에서 어떻게 분산되었는가 확인 할 필요가 있다. 두 집단의 평균값이 같으면서 분산의 정도가 다를 수 있을 뿐 아니라 반대로 그 분산의 정도는 같으면서 평균값은 다를 수 있기 때문 두 집단을 보다 정확하게 설명하려면 집중경향값과 함께 분산의 정도를 알아야 함 분산의 정도, 즉, 분산도를 나타내는 지수에는 여러 가지가 있는데 그 특징과 제한점은 각각 다르다. 범위 사분편차 평균편차 표준편차

3. 분산도(산포도) (1) 범위(Range) 범위는 분산도를 측정하는데 가장 간단하고 빠른 방법 어떠한 분포의 최고점수에서 최하점수까지의 거리를 의미 R=최고점수-최하점수+1 단점은 극단의 점수에 영향을 받게 됨으로 분산도 값으로서 안정성과 신뢰성이 떨어 짐 어떤 집단의 분산도를 한 눈에 빨리 파악하는 정도로 사용하고 그 이상 통계적 처리 방법으로는 사용이 불가능 범위

3. 분산도(산포도) (2) 사분편차(Q.D) Q=Q3-Q1/2 사분편차는 얻어진 측정값을 작은 점수부터 큰 점수의 순으로 늘어놓았을 경우 작은 쪽에서 세어 전체 사례수의 ¼(25%)에 해당되는 측정값인 Q1과 ¾(75%)의 위치에 해당되는 측정값인 Q3와의 차를 반분한 값을 의미 Q=Q3-Q1/2 사분편차는 중앙값 주위의 동산에 모여있는 50%의 측정값이 어느정도의 범위로 분포되에 있는가를 알아보는 것 사분편차가 크면 중앙값이 중심으로 분포되어있는 정도가 크다, 사분편자가 작으면 측정값이 중앙값으로 부터 분포되어있는 정도가 작다 동일한 변인에 대한 사분편차가 작은 집단은 큰 집단에 비해 측정값들이 중심으로 더 모여있다.

3. 분산도(산포도) (3) 평균편차(A.D) 한 집단의 산술평균으로부터 모든 점수까지의 거리의 절대값을 합하여 구한 평균값 각 점수 도는 측정값이 평균값에서 얼마나 떨어져 있는가를 살펴보는 방법으로서 범위나 사분편차보다 신뢰할 수 있는 분산도값 분산도 값으로서 매력이 있는 것처럼 보이지만 수리적인 조작에 한계가 있기 때문에 추리통계에서는 전혀 사용하고 있지 않다. AD=∑|X-|/ N 또는 ∑|x|/ N 평균편차

3. 분산도(산포도) ★(4) 표준편차(S.D) 여러가지 분산도값 가운데 널리 사용되고 가장 신뢰로운 지수 각 측정값들이 평균값으로부터 떨어져 있는 편차를 기초로 하여 한 분포의 분산의 정도를 나타내고 있는 것을 의미 집단의 개인차의 정도나 오차의 범위를 지시해 주는데 이용되기도 하며 척도로도 사용 측정에서 얻어진 자료는 동간적이거나 비율적인 것일 때만 계산할 수 있으며, 점수분포가 좌우 대칭일 때 합리적으로 적용할 수 있다. 또한 집단의 사례수가 될 수 있는 한 많아야 안정된 값을 얻을 수 있음 표준편차가 큰 집단은 작은 집단에 비해서 개인의 차이가 크거나 이질적이라고 해석할 수 있음

3.분산도(산포도) 표준편차의 의미와 해석 모든점수를 대상으로 하며 분포상의 점수변화에 예민하게 영향을 받음 표준편차는 그 분포상에 있는 모든 점수의 영향을 받는다 측정된 점수의 크기가 지나치게 클 때, 각 측정치에서 일정한 점수를 뺀 다음 계산하면 매우 편리함 한 집단의 모든 점수에 일정한 점수를 빼거나 더해도 표준편차는 변하지 않음 표집을 통하여 분산도의 지수를 계산, 변화를 보면 표준편차가 그 변화의 폭, 즉 표집의 정도가 가장 작은 안정성 있은 분산의 지수가 되기 때문에 집단의 분산도를 이해하기 쉬운 지수 한 점수의 분포가 정규분포곡선으 이루고 있고 그 분포의 산술평균과 표준편차를 알면 일정한 점수와 거기에 포함되는 정규분포곡선의 면적(빈도)의 관계를 알수 있음 표준편차는 분산의 정도를 지시하여 줌

4. 표준점수 4. (1)표준점수의 의미 둘 또는 그 이상의 측정 ,검사성적을 정확하게 비교하는 경우, 공통된 수치로 표시함으로써 가능 하나의 측정값이 분포의 중심이 되는 평균에서 얼마나 떨어져 있느냐는 거리를 말함 비교를 위해 원점수를 표준점수로 바꿈-원점수들의 평균이 0이고, 표준편차가 1인 분포로 바뀜 원점수 분포의 표준편차를 하나의 단위척도로 사용하고 있음

4. 표준점수 (2)표준점수 (Z)의 계산 평균으로부터의 편차점수를 그 분포의 표준편차로 나누어 얻어지는 점수 원점수를 의의있게 비교할 수 있다 Z점수는 동간적이기 때문에 비교되는 점수를 서로 가감승제를 할 수 있어서 비교가 용이함 Z점수는 동간적이다.

4. 표준점수 (3) 표준점수(T) Z점수의 설명과 같이 평균, 표준편차, 그리고 그 주위에는 (-),(+)가 있어 사용하기 불편한 점이 있는데 이를 보완한 것이 T점수이다. T점수는 Z점수에 표준편차 10을 곱해주고 여기에 50을 더해 주면 된다 T=10Z+50

4. 표준점수 (4) 표준점수(H) 비교적 단위가 간단하고 표준점수가 필요할 때 사용되는 점수 ‘ H점수’ H점수는 평균이50 표준편차14인 척도 H=14Z+50 (4) 표준점수(H)

4. 표준점수 (5)표준점수(C) C=2Z+5 C점수는 평균이 5인 표준점수이고 표준편자는 2인 척도이다

각표준 점수의 비교