Presentation is loading. Please wait.

Presentation is loading. Please wait.

제2장 기초통계 양윤권 교수.

Similar presentations


Presentation on theme: "제2장 기초통계 양윤권 교수."— Presentation transcript:

1 제2장 기초통계 양윤권 교수

2 2장 기초통계 백분위(percentile rank)는 주어진 한 어느 집단 내에서 개인의 위치를 나타내는 것 1. 백분위와
즉, 전체사례에 대한 백분율을 말함 백분점수(percentile score)란 점수의 분포상에서 어떤 점수가 분포의 위나 아래로부터 몇%에 해당하느냐를 나타낸 점수 2장 기초통계 1. 백분위와 백분점수

3 2. 집중경향(Central tendency)
한 집단의 어떤 특성은 개개의 여러 가지 특성들이 종합되어 그 집단의 특성을 이루게 됨 한 집단의 전체적인 특성을 이해하기 위해서는 개개의 특성을 측정하여 점수화 하였을 때 이 집단의 특성을 하나의 수치로 대표하고자 하는 것이 집중경향의 목적 한 집단의 특성을 단일한 수치로 기술해주는 대표치 가운데 흔히 사용하는 예로 -평균값, 중앙값, 최빈값 이있다.

4 2. 집중경향 (1)평균값(mean) 평균의 특징 평균값은 한 집단에 속해 있는 모든 측정값의 합을 이 집단의 전체 인원수
또는 사례수로 나눈 값을 의미 X, M으로도 표시하며 집중 경향값으로서 가장 많이 사용 평균값의 평균 1반 평균=A, 1반 총인원=a, 2반 평균=B, 2반 총인원=b, 3반 평균=C, 3반 총인원=c라 했을 때 평균값의 평균은? A×a+B×b+C×c/A+B+C=X 평균의 특징 평균으로부터 모든 점수의 차의 합은 0 이 된다 평균은 점수 분포의 균형을 이루는 점이 된다.

5 2. 집중경향 (2)중앙값(median) 중앙값의 개념 중앙값의 특성 중앙값의 용도
중앙값이란 한 집단의 점수분포 상에서 전체사례를 상위반과 하위반으로 나누는 점을 말함. 이 중앙치를 중심으로 전체사례의 반이 이 점수의 상위에, 나머지 반이 이 점수의 하위에 있게 됨 (예) 측정치가 4, 6, 7, 8, 9, 11, 14, 15, 17 일 때 중앙치는 중간인 9가 된다 중앙값의 개념 몇 개의 극단값이 출현할 때, 중앙값은 단지 상위와 하위를 반으로 나누는 점이기 때문에 평균치보다 그 영향을 적게 받는다. 분포가 매우 편포되어 불균형을 이루거나, 몇 개의 극단적인 점수를 가졌을 때는 중앙값이 평균값보다 집단의 특성을 더 잘 나타내 줄 수 있음 중앙값의 특성 1) 평균값을 계산할 만한 충분한 시간이 없을 때 2) 분포가 심하게 편포되어 있을 때, 또는 극단에(맨 끝) 점수가 하나 둘 있을 때 3) 분포의 상반부, 하반부에 관심이 있을 뿐, 중앙에서의 거리에는 관심이 없을 때 4) 측정단위의 동간성이 의심될 때 중앙값의 용도

6 2. 집중경향 (3)최빈값(mode) 최빈값의 개념 최빈값의 특징 최빈값의 용도
최빈값은 한 분포에서 가장 빈도가 많은 점수, 즉 가장 많이 나타나는 점수를 의미한다. (예) 측정값이 12, 12, 14, 14, 18, 18, 18, 19, 20, 일 때 18은 빈도가 4개로 가장 많으므로 18이 최빈값이 됨. 최빈값의 개념 최빈값은 중심경향을 계산하지 않고 대강 빨리 짐작하려는 경우에만 사용 최빈값의 특징 1) 대표값을 빨리 추정하고 싶을 때 2) 대표값을 대략적으로 파악해도 좋을 때 3) 가장 흔하게 일어나는 경우를 알고 싶을 때 최빈값의 용도

7 평균, 중앙값, 최빈값의 비교 부적편포 M Mdn MO Mo Mdn M 정적편포 정상 분포 쌍봉 분포

8 3. 분산도(산포도) 평균값, 중앙값, 최빈값 등과 같은 집중경향값 들은 자료의 대표적 경향을 나타내 주기는 하지만
두 집단의 평균은 같으나 분산도가 다른 경우 평균값, 중앙값, 최빈값 등과 같은 집중경향값 들은 자료의 대표적 경향을 나타내 주기는 하지만 점수의 분포상태 즉 전체적인 모습에 정보는 제공해 주지 못함

9 여러 가지가 있는데 그 특징과 제한점은 각각 다르다.
두 집단의 평균은 같으나 분산도가 다른 경우 두 개 이상의 집단을 비교할 때는 그 집단의 집중경향 값을 살펴보는 것 이외 각 점수 또는 측정값들이 평균값에서 어떻게 분산되었는가 확인 할 필요가 있다. 두 집단의 평균값이 같으면서 분산의 정도가 다를 수 있을 뿐 아니라 반대로 그 분산의 정도는 같으면서 평균값은 다를 수 있기 때문 두 집단을 보다 정확하게 설명하려면 집중경향값과 함께 분산의 정도를 알아야 함 분산의 정도, 즉, 분산도를 나타내는 지수에는 여러 가지가 있는데 그 특징과 제한점은 각각 다르다. 범위 사분편차 평균편차 표준편차

10 3. 분산도(산포도) (1) 범위(Range) 범위는 분산도를 측정하는데 가장 간단하고 빠른 방법 어떠한 분포의
최고점수에서 최하점수까지의 거리를 의미 R=최고점수-최하점수+1 단점은 극단의 점수에 영향을 받게 됨으로 분산도 값으로서 안정성과 신뢰성이 떨어 짐 어떤 집단의 분산도를 한 눈에 빨리 파악하는 정도로 사용하고 그 이상 통계적 처리 방법으로는 사용이 불가능 범위

11 3. 분산도(산포도) (2) 사분편차(Q.D) Q=Q3-Q1/2
사분편차는 얻어진 측정값을 작은 점수부터 큰 점수의 순으로 늘어놓았을 경우 작은 쪽에서 세어 전체 사례수의 ¼(25%)에 해당되는 측정값인 Q1과 ¾(75%)의 위치에 해당되는 측정값인 Q3와의 차를 반분한 값을 의미 Q=Q3-Q1/2 사분편차는 중앙값 주위의 동산에 모여있는 50%의 측정값이 어느정도의 범위로 분포되에 있는가를 알아보는 것 사분편차가 크면 중앙값이 중심으로 분포되어있는 정도가 크다, 사분편자가 작으면 측정값이 중앙값으로 부터 분포되어있는 정도가 작다 동일한 변인에 대한 사분편차가 작은 집단은 큰 집단에 비해 측정값들이 중심으로 더 모여있다.

12 3. 분산도(산포도) (3) 평균편차(A.D) 한 집단의 산술평균으로부터 모든 점수까지의 거리의 절대값을 합하여 구한 평균값
각 점수 도는 측정값이 평균값에서 얼마나 떨어져 있는가를 살펴보는 방법으로서 범위나 사분편차보다 신뢰할 수 있는 분산도값 분산도 값으로서 매력이 있는 것처럼 보이지만 수리적인 조작에 한계가 있기 때문에 추리통계에서는 전혀 사용하고 있지 않다. AD=∑|X-|/ N 또는 ∑|x|/ N 평균편차

13 3. 분산도(산포도) ★(4) 표준편차(S.D) 여러가지 분산도값 가운데 널리 사용되고 가장 신뢰로운 지수
각 측정값들이 평균값으로부터 떨어져 있는 편차를 기초로 하여 한 분포의 분산의 정도를 나타내고 있는 것을 의미 집단의 개인차의 정도나 오차의 범위를 지시해 주는데 이용되기도 하며 척도로도 사용 측정에서 얻어진 자료는 동간적이거나 비율적인 것일 때만 계산할 수 있으며, 점수분포가 좌우 대칭일 때 합리적으로 적용할 수 있다. 또한 집단의 사례수가 될 수 있는 한 많아야 안정된 값을 얻을 수 있음 표준편차가 큰 집단은 작은 집단에 비해서 개인의 차이가 크거나 이질적이라고 해석할 수 있음

14 3.분산도(산포도) 표준편차의 의미와 해석 모든점수를 대상으로 하며 분포상의 점수변화에 예민하게 영향을 받음
표준편차는 그 분포상에 있는 모든 점수의 영향을 받는다 측정된 점수의 크기가 지나치게 클 때, 각 측정치에서 일정한 점수를 뺀 다음 계산하면 매우 편리함 한 집단의 모든 점수에 일정한 점수를 빼거나 더해도 표준편차는 변하지 않음 표집을 통하여 분산도의 지수를 계산, 변화를 보면 표준편차가 그 변화의 폭, 즉 표집의 정도가 가장 작은 안정성 있은 분산의 지수가 되기 때문에 집단의 분산도를 이해하기 쉬운 지수 한 점수의 분포가 정규분포곡선으 이루고 있고 그 분포의 산술평균과 표준편차를 알면 일정한 점수와 거기에 포함되는 정규분포곡선의 면적(빈도)의 관계를 알수 있음 표준편차는 분산의 정도를 지시하여 줌

15 4. 표준점수 4. (1)표준점수의 의미 둘 또는 그 이상의 측정 ,검사성적을 정확하게 비교하는 경우, 공통된 수치로 표시함으로써 가능 하나의 측정값이 분포의 중심이 되는 평균에서 얼마나 떨어져 있느냐는 거리를 말함 비교를 위해 원점수를 표준점수로 바꿈-원점수들의 평균이 0이고, 표준편차가 1인 분포로 바뀜 원점수 분포의 표준편차를 하나의 단위척도로 사용하고 있음

16 4. 표준점수 (2)표준점수 (Z)의 계산 평균으로부터의 편차점수를 그 분포의 표준편차로 나누어 얻어지는 점수
원점수를 의의있게 비교할 수 있다 Z점수는 동간적이기 때문에 비교되는 점수를 서로 가감승제를 할 수 있어서 비교가 용이함 Z점수는 동간적이다.

17 4. 표준점수 (3) 표준점수(T) Z점수의 설명과 같이 평균, 표준편차, 그리고 그 주위에는 (-),(+)가 있어 사용하기
불편한 점이 있는데 이를 보완한 것이 T점수이다. T점수는 Z점수에 표준편차 10을 곱해주고 여기에 50을 더해 주면 된다 T=10Z+50

18 4. 표준점수 (4) 표준점수(H) 비교적 단위가 간단하고 표준점수가 필요할 때 사용되는 점수 ‘ H점수’ H점수는 평균이50
표준편차14인 척도 H=14Z+50 (4) 표준점수(H)

19 4. 표준점수 (5)표준점수(C) C=2Z+5 C점수는 평균이 5인 표준점수이고 표준편자는 2인 척도이다

20 각표준 점수의 비교


Download ppt "제2장 기초통계 양윤권 교수."

Similar presentations


Ads by Google