자료처리 및 통계분석(2) 통계분석의 이해(2) - 가설검증 - 변수유형에 따른 통계분석방법 통계분석방법

Slides:



Advertisements
Similar presentations
소명의식 기본심리욕구 소명실행 1) 삶의 만족 2) 심리적 안 녕 자아수용 긍정적 대인관계 자율성 환경에 대한 통제 삶의 목적 개인적 성장 자율성 유능성 관계성 일 가치감 일 목적지향 천직의식 기여와 헌신동기 이타행동 가설 1. 소명의식은 삶의 만족에 영향을 미칠 것이다.
Advertisements

식기에 관한 소비자 조사 Ⅰ. 조사 개요 Ⅲ. 조사 결과 분석 Part1. 식기브랜드 관련 소비자 인식 국내 식기브랜드 최초 / 비보조 인지 수입 식기브랜드 최초 / 비보조 인지 식기브랜드 보조인지 보유 식기브랜드 현재.
제13장 로지스틱회귀분석.
재료수치해석 HW # 박재혁.
• 수학 • 6학년 나단계 • 7. 연비>1/9 홈 두 수의 대응 관계를 , 를 사용한 식으로 나타내기 수업활동 수업계획.
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
공차 및 끼워맞춤.
추론통계.
자료분석 및 통계활용.
비모수통계.
통계분석 특강(속성) 서구원 한양사이버대학교 미디어MBA.
제12주 회귀분석 Regression Analysis
제2장 기술통계학Ⅰ: 표와 그래프적 방법.
비모수 분석 및 복습.
· 제 14 장 상관관계분석과 회귀분석 상관관계분석
제1강 변량분석이란 무엇이며 일원변량분석은 어떻게 하는가?
SPSS 이용한 논문 통계 강좌 우송대학교 IT 경영학과 하임숙
Missing Value.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
제1장 통계의 기본개념.
ANOVA.
상관분석 (p , p ).
제 7장 연관성분석 화장품과학과 홍보람.
상관관계 양윤권.
단순회귀분석 단순회귀분석의 개요 개념 : 상관관계분석은 두 변수간의 선형관계를 조사하는 것이지만, 단순선형회귀분석(simple linear regression; 이하 단순회귀분석)은 두 변수간의 인과관계(casual relationship)를 조사하는 방법임. 독립변수(예측변수)
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
마케팅 조사론 Marketing Research.
SPSS 강원대학교 생물학과 석사 과정생 김자경.
(independent variable)
Association between two measurement variables Correlation
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
마케팅 조사론 1학년 A반 차진우( ) 허성원( ) 김혜진( )
Lab #5. Capacitor and inductor
SPSS - Statistics - AMOS
젠트리피케이션에 대한 인식 분석 경영학부 최은지 경영학부 이창현
생산 분석을 위한 확률 및 통계 현대로템 직무능력 향상 교육 - 1주차
생활 습관과 학교 성적의 통계분석 조장: 이태훈 조원: 이진원.
연속변수간의 관계 검증 :상관분석 과 목 명 : 간호연구 및 통계 담당교수: 홍윤경.
두 모집단에 대한 검정.
하이스코 기업문화 실행 프로그램의 실태조사 2조- 노라조.
Multiple regression analysis
제5장 추세분석 추세분석과 차트 제조업 추세분석 재무제표 자료 추세분석 차트 추세도 그리기.
논문작성을 위한 연구모형 설정 양동훈.
Keller: Stats for Mgmt & Econ, 7th Ed 회귀모형의 정형화 Model Building
Sampling Distributions
Intelligent Systems and Control Lab. Dept. of EE, Yeungnam Univ.
3장, 마케팅조사의 일번적 절차 마케팅 조사원론.
바넘효과 [Barnum effect] 사람들이 보편적으로 가지고 있는 성격이나 심리적 특징을 자신만의 특성으로 여기는 심리적 경향. 19세기 말 곡예단에서 사람들의 성격과 특징 등을 알아 내는 일을 하던 바넘(P.T. Barnum)에서 유래하였다. 1940년대 말 심리학자인.
사회복지조사와 조사 연구 방법 제3장.
자녀의 심리적 안정도에 미치는 부모요인 분석.
비열.
Support Vector Machine
교육통계 공분산분석 발표자 : 김 성 순(석사2학기) 발표일 : (수) ANCOVA.
계량경제학 1.관광수요의 결정요인 2.관광수입과 환율의 상관 관계..
척도의 속성 - 목 차- 자료수집과정 척도의 속성 -명목척도 -서열척도 -등간척도 -비율척도 -리커트척도 3.Data(자료)
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
상관계수.
Week 4: 다변수(2변수) 데이터분석 5장_1(산포도: scatter plot) 동영상 1,2,3,4,5
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
추리통계학의 기본개념.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
진리표를 이용한 타당성 증명 진리표(truth table) : 단순 문장들이 진리값을 상이하게 가질 수 있는 가능한 모든 경우를 남김없이 열거한 표 (ex) 오늘은 날씨가 맑거나 비가 올 것이다. 오늘은 날씨가 맑다 비가 온다 오늘은 날씨가 맑거나 비가 올 것이다. T.
(Analysis of Variation, ANOVA)
알렌 인지 수준 판별검사와 한국판 간이 정신상태 판별검사의 상관관계
Survey Sampling Sangji University.
Presentation transcript:

자료처리 및 통계분석(2) 통계분석의 이해(2) - 가설검증 - 변수유형에 따른 통계분석방법 통계분석방법 - 가설검증 - 변수유형에 따른 통계분석방법 통계분석방법 - 빈도분석, 카이스퀘어검증, t-검증, 분산분석, 상관관계분석, 회귀분석

가설검증 가설검증(hypothesis testing) 두 개 이상 변수간의 관계를 검증하는 것: 일반적으로 모집단에서 추출한 표본을 분석하여 모집단의 특성을 나타내는 변수 간의 관계를 검증하는데 사용 가설검증은 추론통계 활용 보통 추론통계에서는 연구가설을 직접 검증하지 않고 영가설의 가능성을 부인해서 연구가설의 타당성 검증. 영가설은 연구가설을 검증할 목적으로 추론분석에서 사용하는 방법. * 가설종류: 연구가설(research hypothesis): 연구자가 지지하는 가설, 즉 검증하고자 하는 가설. 변수들 사이에 차이나 관계가 있다는 진술 영가설(null hypothesis): 연구가설을 부인하는 서술. 연구 가설에 대한 논리적 대안. 변수들 사이에 차이나 관계가 없다는 진술. 가설설정의 예: 영가설 - 두 집단 간 소득수준은 차이가 없다 연구가설- 두집단 간 소득수준은 차이가 없다 보통 가설검증은 영가설을 기각에 초점을 맞추게 되고, 영가설을 기각하게 되면 연구가설 지지하게 됨

가설채택과 유의수준 영가설을 채택할 것인지, 연구가설을 채택할 것인지는 가설검증을 위해 정한 검증통계치(표본통계량이 모집단값과 유사한지 등을 검증하는 값. 예: t값, F값 등 ) 에 의해 결정 조사연구의 궁극적 목적은 표본결과를 가지고 모집단의 특성을 추론하고 예측하는 것임. 그런데, 모집단에 추정은 어디까지나 통계치로 추정한 것이기 때문에 오류를 내포할 가능성 항상 존재. 즉, 조사결과와 실체현상간에는 약간의 차이가 있을 수 있는데 이것을 오차라 함 이러한 오차의 가능성을 가설검증 과정에서도 어느 정도 인정하는데, 이를 유의수준(significant level)이라고 함 -> 유의수준: 가설검증에서 용납될 수 있는 오류의 정도 보편적으로 유의수준(α로 표기)은 0.05(5%), 0.01(1%) 사용 유의수준은 영가설을 기각하는 영역을 결정하는 것(유의수준은 영가설을 기각하는 확률적 기준)으로 가설검증에서 중요한 의미를 가짐 - 가설검증은 항상 영가설이 옳다는 전제하에 자료를 분석하여 검증통계치를 구하고 영가설의 채택여부를 결정함 검증통계치값이 나타날 가능성(* 검증통계치가 나타날 가능성을 측정하는값: 유의확률값(p-value)이 유의수준 이하이면 영가설을 기각하고, 유의수준 이상이면 영가설 채택 * 예 : 유의수준을 0.05(5%)로 정했는데, 검증통계치의 유의확률값(p-value)이 0.02로 나타났으면 유의확률값이 유의수준보다 작기 때문에 영가설 기각되고 연구가설 채택. 반대로 크면 영가설채택, 연구가설은 부인됨 즉, 검증과정에서 유의확률값이 유의수준보다 작으면 영가설 기각되고, 연구가설 채택. 이때 분석결과가 유의미하다고 말함. -> 통계학적으로 의미있는 결과로 인정됨. 즉, 표본에서 나온 분석결과(통계치)를 모집단에 적용해도 큰 무리가 없다고 판단되는 것 연구보고서 표기방법 : * p<.05, **p<.01

① 명목변수: 상호배타적인 몇 개의 범주로 나눌 수 있을 뿐 서열, 크기 등의 속성이 없음 변수유형에 따른 통계분석방법 변수유형: 변수는 그 속성, 즉 측정가능방법과 관련해서 4가지로 분류할 수 있음. 변수가 어떤 속성을 가졌는가에 의해 활용해야 하는 통계기법이 다름 ① 명목변수: 상호배타적인 몇 개의 범주로 나눌 수 있을 뿐 서열, 크기 등의 속성이 없음 (예) 성별, 종교, 국적, 결혼유무, 계절 ② 서열변수: 속성을 상호배타적인 범주로 나눌 수 있고, 범주간 서열 측정 가능 (예) 학점, 생활수준, 찬성강도 등 ③ 등간변수: 어떤 변수의 범주간의 순서뿐만 아니라 범주 간의 거리가 일정(등간성) (예) 온도, 지능지수 등 ④ 비율변수: 변수의 범주 간 간격이 등간격일 뿐 아니라 절대영점을 가지고 있어 비율측정 가능 (예) 소득, 자녀수, 경력, 교육기간, 무게 등 연속적 변수와 비연속적 변수 연속적 변수: 변수가 연속성을 가지고 있는 것(등간변수, 비율변수) 비연속적 변수: 변수가 연속성을 가지고 있지 않은 것(명목변수, 서열변수) 변수유형과 분석방법 독립변수 종속변수 비연속적 변수 연속적 변수 카이제곱검증 로지스틱회귀분석 이분변수: t-검증 다분변수: 분산분석 피어슨 상관관계 회귀분석

통계분석방법 1. 빈도분석 단일 변수에 대한 빈도분포 분석 빈도분포: 수집된 자료를 성질이나 크기가 유사한 형태로 분류한 것으로 자료의 특성을 쉽게 파악하게 함. 기본적으로 빈도, 백분율, 유효백분율, 누적백분율로 표시 빈도(frequency): 각 집단에 속하는 사례수 백분율(percentage): 전체 사례 중에서 각 집단의 빈도가 차지하는 비율 유효백분율(valid percentage): 자료에서 무응답사례를 제외한 합계에서 각 집단의 빈도가 차지하는 비율 누적백분율(cumulative percentage): 각 집단에 속한 백분율과 상위 계급에 속한 백분율을 포함한 백분율 예: 노인가구의 학력 빈도 백분율 유효백분율 누적백분율 무학 210 27.2 27.5 초등졸 216 28.0 28.2 55.7 중졸 128 16.6 16.7 72.4 고졸 147 19.1 19.2 91.6 대학이상 64 8.3 8.4 100.0 합계 765 99.2 100 결측(missing) 6 0.8 전체합계(N) 771

2. 카이스퀘어검증 (chi- square test) 집단들간의 빈도에 차이가 있는 가를 통해 집단 비교 독립변수, 종속변수 모두 비연속적 변수(명목, 서열)일 때 사용 예: 성별에 따른 종교, 성별 취업여부 차이, 가구유형별(노인, 모자, 장애인가정) 직업분포의 차이, 담배피우는 사람과 피우지 않는 사람 간 술소비량 차이(술마시지 않음, 술적게 마심, 술많이 마심) 3. t –검증 두 집단의 평균이 통계적으로 유의미하게 차이 있는지를 검증하는 방법 독립변수는 비연속적 변수, 종속변수는 연속적 변수(등간, 비율)일 때 사용 집단의 평균들 간에 차이가 있는 지를 통해 집단 비교 1) 독립표본 t-검증(두 집단 간의 평균 차이 검증) - 독립된 두 집단 간의 평균이 통계적으로 유의미한 차이가 있는지 검증하는 방법 - 예: 남녀간 평균 임금 차이, 스트레스를 많이 받은 사람과 적게 받은 사람 두 집단 간 직무만족도 2) 대응표본 t-검증(동일집단 간의 사전 사후 t-검증) - 어떤 집단의 사전검사와 사후검사의 차이 등을 알아보고자 할 때 활용 - 예: 부부대화프로그램에 참여한 부부의 사전 대화 시간과 사후 대화 시간 간의 차이 검증

4. 분산분석(Analysis of Variance: ANOVA) t 검증은 평균차이를 이용하여 두 집단의 차이를 검증하는 통계기법인데 반해 분산분석은 분산의 차를 이용하여 2집단 이상의 차이를 검증하는 통계기법 * 분산: 각각의 관찰값들이 평균으로부터 떨어져 있는 거리(편차)를 제곱한 후 그 수를 모두 더해서 총관찰값으로 나눈 값 집단의 분산들 간에 차이가 있는 가를 통해 집단 비교 독립변수는 비연속적 변수, 종속변수는 연속적 변수일 때 사용 예: 초등학생, 중학생, 고등학생, 대학생들 간에 수업시간 외에 하루 평균 공부시간 차이 분석, 연령대별 컴퓨터 이용시간 분석 학력에 따른 소득의 차이 5. 상관관계분석(correlation analysis) 한 변수가 변함에 따라 다른 변수가 어떻게 변하는지를 알아보는 것 상관관계는 변수 사이의 관련성의 방향과 정도를 말함 -> 상관계수(피어슨 상관계수: r 로 표시 상관계수값: r은 -1에서 1. r 의 절대값이 클수록 높은 상관관계 +는 정적관계( 한 변수 ↑ , 다른 변수 ↑), -는 부적관계(한 변수 ↑ , 다른 변수 ↓ ) 독립변수는 연속적 변수, 종속변수는 연속적 변수일 때 사용 예: 교육연수와 소득과의 상관관계, 사회복지사의 소득과 직무만족도 간의 상관관계 검증

6. 회귀분석(regression analysis) 독립변수들의 값을 가지고 종속변수의 값을 설명하고 예측하는 것을 검증 상관관계는 독립변수와 종속변수의 구분 없이 두 변수가 얼마나 상호 관련되어 있는지 분석하는 반면, 회귀분석은 독립변수가 종속변수에 미치는 영향 분석. 독립변수가 한 단위 변함에 따라 종속변수가 얼마나 변화하는가 까지 설명해줌 -> 다른 통계기법보다 정교하게 변수간의 관계를 나타내줌 단순회귀분석: 독립변수가 하나일 경우 - 예: 교육연수가 소득에 미치는 영향 분석 다중회귀분석: 독립변수가 둘 이상일 경우 - 예: 교육연수와 재직기간이 소득에 미치는 영향 독립변수와 종속변수 모두 연속적 변수일 때 사용