1 통계를 왜 공부해야 하나 ? Dept. of Public Administration Chungnam National University
통계의 필요성 대부분의 연구는 통계기법을 통한 자료분석에 의해 작 성 사회과학이 과학으로서 존재하는 이유는 객관적 인 자료를 제시할 수 있다는 점 통계를 통해 가능 거의 모든 사회현상은 객관적인 입증을 위해 통계로 표 현되기에 통계는 필수 통계는 수집한 자료에 대해 양적 (quantitative) 인 표현을 한다 ( 숫자로 표현 ) 통계처리가 가해지기 전까지 수집된 자료는 무의미한 숫자 덩어리에 불과 통계처리 의미 있는 자료 “ 남자가 여자보다 공간지각 능력에서 더 월등 ”
3/23 경제학, 경영학, 사회과학, 인문과학, 법학, 의학, 공학, 자연 과학 등 분야를 막론하고 통계학을 쓴다. 우리는 통계에 묻 혀 산다. ‘ 특정 광고가 매출을 증가시키는가 ? ’ ‘ 유명 배우가 출연하면 시청률이 올라가는가 ? ’ ‘ 노동시장에서 여성에 대한 차별이 존재하는가 ’ ‘ 외국인 직접 투자가 늘면 경제성장률이 제고되는가 ? ’ … 통계학의 유용성
통계의 구분 I 기술통계 : 큰 수치 집단을 요약하는 통계절차 - 오로지 큰 수치 집단의 특성을 기술하기 위해 설계된 것 ( 예, 심리통계연구법 수업에 대한 평균적 사실 : 연령, 성, 종교 ) - 집중경향치, 변산도치, 그리고 관계성 측정치외 그래프 추리통계 : 얻은 수치에 대한 단순한 기술을 넘어 보다 일반화된 진 술을 획득 - 표본 (sample) 이라 불리는 피험자 집단으로부터 수치를 얻는다. 표본은 전집 (population) 이라 불리는 보다 큰 피험자 집단으로부터 추출된 것으로 고려 과학적 추론 - 가설검증 절차 - 집단 평균간에 유의한 차이가 존재하는지의 여부를 결정하는 추 론기법 (t 검증, 변량분석, 공변량 분석, 중다회귀, 판별함수 분석, 그리고 중다변량 분석, 비모수 통계절차 )
5/23 추론 (inference) 표본추출 (sampling) 표본 (sample) 통계량 (statistic) 모집단 (population) 모수 (parameter) 모집단과 표본의 관계 통계학은 표본의 자료를 수집, 정리, 요약하는 작업 ( 기술통계학 ) 뿐 만 아니라, 요약된 자료를 토대로 그 자료의 모태가 되는 모집단에 대해 짐작, 추측해 보는 작업 ( 추론통계학 ) 을 포함한다.
용어 설명 전집 (population): 연구의 관심 대상이나 사람의 전체 집합 - 표본으로부터 얻어진 정보에 기초하여 전집에 대한 일반화 를 하기를 원한다 표본 (sample): 실제로 관찰되고 자료가 그것으로부터 자료 가 수집되는 전집의 하위집합 사례 (case): 측정하는 특성의 개개 단위 ( 예, 각 개인, 각 도시, 각 학교, 각 학년 … ) 변인 (variable): 각 사례에 대해 측정하고자 하는 특성 ( 예, 연 령, 성, IQ, 점수, 인종 등 ) 자료 (data): 표본에 대해 수집된 정보의 전체 ( 모든 사례에 대 해 측정한 각 변인에 대한 모든 값 )
용어 설명 독립변인 (independent variable): 종속변인에 선행되거나 종 속변인에 영향을 미치는 것으로 추정되는 변인 종속변인 (dependent variable): 연구의 관심 변인. 다른 변인 ( 독립변인 ) 의 조작에 의해 영향을 받는 것으로 가정되는 변 인 예 : “ 통계 교수법이 통계성적에 영향을 미치는가 ? ” 독립변인 : 교수법 ( 강의법, 발견법, 소집단 토론법, 컴퓨터 프 로그램법 ) 명명척도 종속변인 : 통계성적 등간척도
통계 (Statistics)? 경험적 이론적 표본 전집 통계치 모수치 ( 표본에 대해 계산된 ( 전집에 대해 계산된 수치 ) 수치 ) 예 : 키, 체중 예 : 키, 체중 Y 1 …. Y n Y 1 ….. Y N
이론 (Theory) 과학자들은 일반적으로 이론을 확장시키기 위해 사상들을 설명하는 데 목적을 둔다 이론 : 관심 사상들에 대한 체계적인 관점을 제시하기 위한 상호관련된 정의의 집합 - 그 사상의 설명과 예측 예 ) 학업실패에 대한 이론 : 관련이 될 수 있는 것 ? a. 사회경제적 상태 b. 대학 학력고사 c. IQ d. 동기 e. 언어 및 수리 적성 f. 자존감 ……….
이론 (Theory) 경험적 이론적 측정을 통하여 연구 문제 수학적 모형 가설 가설검증 이론통계적 모형
측정 (Measurement) 한 사례에 대해 변인의 값을 나타내기 위해 수치를 할당하는 규칙 - 일반적으로 측정도구의 사용을 통해 달성 (IQ – 표준화된 IQ 검사 실시 ) ( 수학 능력 – California Achievement Test 점 수, 교사가 실시한 수학시험 점수 등 )
측정척도 (Measurement Scale) 측정수준이 중요한 이유 ? - 측정수준에 따라 적용될 통계기법이 달라진다 ( 예, 명명자료의 경우 모수 통계를 사용할 수 없다 ) * 모수 통계 (parametric statistics): 표본이 정규분포되어 있 는 전집으로 선택된다는 가정에 기초 변량의 동질성 검증 * 비모수 통계 (nonparametric statistics): 분포가 자유로운 전집에 대한 정규분포나 변량의 동질성 가정을 규정하지 않 음 4 가지 질문 1. 절대영점이 있는가 ? 2. 등간격은 동일한 양을 나타내는가 ? 3. 다른 값은 다른 양을 나타내는가 ? 4. 다른 값은 양적 혹은 질적 차이를 나타내는가 ?
측정척도 (Measurement Scale) 명명척도 (nominal scale): 한 사건이나 한 사물을 다른 것과 구별하기 위해 사용되는 측정 양적인 표현이 아니라 단지 구별을 요하는 측정 ( 계산적 의미가 없다 ) 예 ) 성 : 남 =0, 여 =1 종교 : 기독교 =1, 카톨릭 =2, 불교 =3, 기타 =4 0 번 25 번 50 번 75 번 100 번 1. 절대영점이 있는가 ? 0 이라는 수치는 측정되는 것이 없다 는 것을 나타내는가 ? 아니오. 수치는 단지 범주를 나타내는 것으로써만 사용된다 2. 등간격은 동일한 양을 나타내는가 ? 25 와 50 의 차이는 50 과 75 의 차이와 동일한 양 ? 아니오. 번호간 차이는 아무런 의미가 없다. 단지 구분을 위한 것 3. 다른 값은 다른 양을 나타내는가 ? 수치가 크다는 것은 작 은 수치보다 더 크거나 많다는 것을 의미하는가 ? 아니오
측정척도 (Measurement Scale) 명명척도 ( 계속 ): 4. 다른 값은 양적 혹은 질적 차이를 나타내는가 ? 50 과 75 는 양적 혹은 질적인 차이를 나타내는가 ? 양적인 차이는 없으나, 질적인 차이가 있다. 즉 50 번과 75 번의 선수는 다른 사람, 즉 팀내 고유한 정 체성을 제공한다.
측정척도 (Measurement Scale) 서열척도 (ordinal scale): 대상자들을 구별하면서 서열을 알 수 있다. “ 어떤 제품의 질을 0 점에서 100 점까지 점수로 평가 ” 0 점 25 점 50 점 75 점 100 점 1. 0 점이란 측정되는 것이 없다는 것을 의미 ? 아니오. 다른 제 품과 비교해서 질에서 가장 떨어진다는 것을 나타낸다. 주관 적 평가 척도에서 0 점이란 특질이 전혀 없다는 것을 나타내 는 것이 아니다 점과 50 점의 차이는 50 점과 75 점의 차이와 정확하게 동 일한 양을 나타내는가 ? 아니오. 두 25 점의 차이는 정확하게 동일한 질적인 차이를 나타내지 않는다. 이는 점수들이 주관 적 평가에 기초하여 할당되기 때문이다. ( 예, 성적 고려 )
측정척도 (Measurement Scale) 서열척도 ( 계속 ): 0 점 25 점 50 점 75 점 100 점 3. 수치가 클수록 작은 수치보다 더 많다는 것을 의 미 ? 네. 점수가 클수록 제품의 질이 높다는 의미 4. 다른 값은 양적 혹은 질적 차이를 나타내는가 ? 양적 차이 – 그러나 절대영점이 없으므로 수치들간 의 등간격은 동일한 양을 나타내지 않는다. 따라서 50 점을 획득한 제품이 25 점을 획득한 제품보다 2 배 더 질이 높다고 말할 수 없다.
측정척도 (Measurement Scale) 등간척도 (Interval scale): 서열 정보를 포함하여 척도 상의 두 점간의 등거리를 시사하는 측정의 단위 예 : 연령 (23, 24, 25, 26, … ) 0 도 25 도 50 도 75 도 100 도 1. 0 이라는 점수는 측정되는 것이 없다는 의미 ? 아니오. 열이 없는 상태가 아니라 이는 임의의 0 점으로 물이 어는 온도를 나타낸다 ( 열이 없다는 것은 – 273 도 ) 점과 50 점의 차이는 50 점과 75 점의 차이와 정확히 동일 한 양을 나타내는가 ? 네. 두 점 사이의 차이 25 도는 동일한 양을 나타낸다. 그러나 절대영점이 없기에 50 도가 25 도의 2 배라고 말할 수 없다 (IQ 예 ) 3. 수치가 클수록 작은 수치보다 더 많다는 것을 의미 ? 네. 점 수가 클수록 더 열이 많다는 의미 4. 다른 값은 양적 혹은 질적 차이를 나타내는가 ? 양적인 차 이
측정척도 (Measurement Scale) 비율척도 (Ratio scale): 대부분의 물리척도 – 절대영점을 갖 기에 “ 어떤 것이 어떤 것의 두배 혹은 절반이라고 말하는 것 이 자유롭다 ” 0kg 25kg 50kg 75kg 100kg 1. 0 이라는 점수는 측정되는 것이 없다는 의미 ? 네. 체중계 위 에 아무 것도 없다면 0 은 체중이 없다는 것을 나타냄 점과 50 점의 차이는 50 점과 75 점의 차이와 정확히 동일 한 양을 나타내는가 ? 네. 두 점 사이의 차이 25kg 은 동일한 양을 나타낸다. 3. 수치가 클수록 작은 수치보다 더 많다는 것을 의미 ? 네. 점 수가 클수록 더 체중이 많이 나간다는 의미 4. 다른 값은 양적 혹은 질적 차이를 나타내는가 ? 양적인 차 이
측정척도 (Measurement Scale) 4 가지 측정척도의 속성 척도속성명명서열등간비율 진실한 0 점 X X X O 등간격은 동일한 양을 나타낸다 X X O O 상이한 값은 상이한 양을 나타낸다 X O O O 상이한 값은 양적 (**) 혹은 질적 (*) O* O** O** O** 차이를 나타낸다 - 모든 질문에 대합 답변은 비율척도의 경우 - 척도가 절대영점을 가질 때만 “ 무엇이 무엇의 두 배 ” 라고 말할 수 있다 - 평정자에 의해 어떤 과자는 75 점, 그리고 다른 과자는 25 점이 주어지고, 전자가 후자보다 3 배 더 낫다고 말할 수 있을 만큼 우리의 주관적 인상 충분히 정확성을 가지고 있다고 말할 수 없다