Presentation is loading. Please wait.

Presentation is loading. Please wait.

SPSS를 활용한 통계분석 김 덕 기 충북대학교 정보통계학과

Similar presentations


Presentation on theme: "SPSS를 활용한 통계분석 김 덕 기 충북대학교 정보통계학과"— Presentation transcript:

1 SPSS를 활용한 통계분석 김 덕 기 (toby123@cbnu.ac.kr) 충북대학교 정보통계학과
분산분석(ANOVA) SPSS를 활용한 통계분석 김 덕 기 충북대학교 정보통계학과

2 두 집단의 평균비교 (T-검정) 목 차 세 집단 이상의 평균비교 (F-검정) - 독립표본 T-검정 - 대응표본 T-검정
목 차 두 집단의 평균비교 (T-검정) - 독립표본 T-검정 - 대응표본 T-검정 세 집단 이상의 평균비교 (F-검정) - 일원배치 분산분석 - 이원배치 분산분석 - 이원배치(반복) 분산분석 2016년 - SPSS를 활용한 통계특강 -

3 두 집단 평균비교 관심그룹(범주)의 수 t-검정 두 집단 t-검정 일원배치법 요인의 분산분석 수 이원배치법 다원배치법 둘 하나
관심그룹(범주)의 수 두 집단 t-검정 요인의 셋 이상 일원배치법 이원배치법 다원배치법 분산분석 하나 t-검정 2016년 - SPSS를 활용한 통계특강 -

4 두 집단 평균비교 : 자료형태 자료형태 : 독립변수(범주형 (2그룹)), 종속변수(연속형)
명목 척도 (이산형 자료) 명목척도는 관심대상의 특성을 범주로 분류하여 각 범주에 숫자를 부여한 척도. (예) 성별 : 남(1), 여(2) 서열 척도 관심대상의 특성을 크기순으로 나열하고 이에 숫자를 부여한 척도. (예) 건강상태 : 양호(1), 보통(2), 나쁨(3) 등간 척도 (연속형 자료) 관심대상의 특성을 나타내는 측정치 사이의 거리를 일정한 간격으로 표시하는 척도. (예) 만족도 : 매우불만(1), 불만(2), 보통(3), 만족(4), 매우만족(5) 비율 척도 관심대상의 특성을 나타내는 측정치 사이의 거리를 일정한 비율로 표시하는 척도. (예) 판매량, 매출액, 무게, 소득 등  산업체 인턴쉽프로그램에 대한 만족도 및 태도조사의 일부분이다. (파일 : 산업체인턴.sav) [1] 성별 ? 1) 남자 ( ) 2) 여자 ( ) [2] 인턴쉽지원비의 만족도 ? 1) 매우 불만 ( ) 2) 불만 ( ) 3) 보통 ( ) 4) 만족 ( ) 5) 매우 만족 ( )  성별에 따른 만족도(지원비)에 차이가 있는가 ? (독립변수 : 성별, 종속변수 : 만족도) 2016년 - SPSS를 활용한 통계특강 -

5 두 집단 평균비교 : 분석절차 2016년 - SPSS를 활용한 통계특강 -

6 두 집단 평균비교 : 독립표본-대응표본 1 두 표본자료의 차량이 서로 다르며 상관관계가 없다. 이러한 방법으로 만들어진 두 표본을 독립표본 이라 함. 타이어 품질에 따른 순수한 마모율 외에 운전자 체중, 운전습관, 차량무게, 차량품질 등 다른 요인의 영향때문에 타이어 품질의 차이에 의한 영향을 분석해 내기 어렵다. 2016년 - SPSS를 활용한 통계특강 -

7 두 집단 평균비교 : (…계속) 두 표본자료의 차량이 같고 두 회사 타이어를 한쪽씩 각각 장착하는 방법으로 실험한 경우.
2016년 - SPSS를 활용한 통계특강 -

8 두 집단 평균비교 : 독립표본-대응표본 2 (방법1) 16명을 임의로 두 그룹으로 나눈 후, 각각 학습방법 A와 학습방법 B에 의한 교육을 모두 받게 한 후, 각각의 이해도를 측정. 데이터의 형태는 다음과 같다. Y6 ➡ 이 경우 학습방법 A와 학습방법 B 교육을 받은 대상자가 다르다. 즉, 데이터가 서로 독립 ➡ 이러한 방법으로 만들어진 두 표본을 독립표본(independent sample)이라 함 ➡ 개인의 능력차로 인해 실제로 차이가 없음에도 불구하고 차이가 있다고 판단할 가능성이 있음 2016년 - SPSS를 활용한 통계특강 -

9 두 집단 평균비교 : (…계속) (방법2) 8명을 임의로 선정해 학습방법 A와 학습방법 B에 의한 교육을 모두 받게 한 후, 각각의 이해도 를 측정. 데이터의 형태는 다음과 같다. > 한 사람이 학습방법 A 및 학습방법 B 교육을 모두 받았다. 데이터가 쌍의 형태를 띄고 있음 > 이러한 방법으로 만들어진 경우의 두 표본을 쌍체 또는 대응표본(paired sample)이라 함 2016년 - SPSS를 활용한 통계특강 -

10 두 집단 평균비교 : 가설검정 절차 일반적인 가설검정의 절차 가설 설정 유의수준 의 설정 검정통계량선정 및 계산
유의수준 의 설정 검정통계량선정 및 계산 유의확률(p-value) 계산 의사결정 [단계 1] 두 집단 간의 등분산성에 대한 검정을 먼저 수행한다.  [F-검정] [단계 2] [단계1]의 결과에 따라 다음의 두 가지의 검정 방법이 있다. (1) 두 집단 간의 분산이 동일한 경우 : 두 집단 간의 평균차이 검정  [T-검정] (2) 두 집단 간의 분산이 다른 경우 : 두 집단 간의 평균차이 검정  [T-검정] 2016년 - SPSS를 활용한 통계특강 -

11 두 집단 평균비교 : 연구가설설정 [연구가설] 인턴쉽 기관이 취업을 희망하는 분야와의 일치여부에 따라 (근무태도, 친밀-신뢰성)에 차이가 있는가를 알아보려 한다. (독립표본의 경우 : 유의수준 0.05로 검정)  산업체 인턴쉽프로그램에 대한 만족도 및 태도조사의 일부분이다. (파일:산업체인턴.sav) [1] 인턴쉽기관이 졸업 후 취업을 희망하는 분야와 일치하였습니까 ? ( ) 1) 예 ( ) 2) 아니오 ( ) 태도 및 행동 평가 매우 그렇다 그렇다 보통 그렇지않다 전혀그렇지않다 [31] 성실히 근무하였다 5 4 3 2 1 ---중간생략--- [39] 직원과 친밀하고 신뢰 받음 귀무가설 : 취업희망분야와의 일치여부에 따라 근무태도에 차이가 없다. 대립가설 : 취업희망분야와의 일치여부에 따라 근무태도에 차이가 있다. 가설설정  2016년 - SPSS를 활용한 통계특강 -

12 두 집단 평균비교 : 독립표본 검정 1 귀무가설 : 등분산(취업희망분야일치 그룹1 : 취업희망분야불일치 그룹2)
대립가설 : 이분산(취업희망분야일치 그룹1 : 취업희망분야불일치 그룹2) 가설설정  수행절차 : 메뉴  분석  평균비교  독립표본 T검정 (검정변수, 집단변수, 옵션 지정) 2016년 - SPSS를 활용한 통계특강 -

13 두 집단 평균비교 : 독립표본 검정 2 [검정결과1] Levene의 등분산 검정결과는 다음과 같다.
 근무태도 문항 : 유의확률=0.000 < 유의수준=0.05 로 귀무가설을 기각 (즉, 이분산)  직원친밀신뢰 문항 : 유의확률=0.723 > 유의수준=0.05로 귀무가설을 채택 (즉, 등분산). [검정결과2] 평균의 동일성에 대한 t-검정결과는 다음과 같다. 근무태도 문항 : 등분산이 가정되지 않음에 해당하는 유의확률=0.011 < 유의수준=0.05 로 귀무가설을 기각 (즉, 취업희망분야와의 일치여부에 따라 근무태도에 차이가 있다.)  직원친밀신뢰 문항 : 등분산이 가정됨에 해당하는 유의확률=0.025 < 유의수준=0.05로 귀무가설을 기각 (즉, 취업희망분야와의 일치여부에 따라 직원친밀,신뢰에 차이가 있다.) 2016년 - SPSS를 활용한 통계특강 -

14 두 집단 평균비교 : 독립표본 검정(실습) [문제 1] 산업체 인턴쉽 프로그램 보유여부에 따른 만족도(14개 문항)에 대해 유의한 차이를 보이는 문항을 찾고, 결과를 해석하시오. (산업체인턴.sav : 유의수준 0.05로 검정) [문제 2] 대사중후군의 실험-대조 집단(ex_co)에 따른 사후 측정된 대사중후군 10개 지표에 유의한 차이가 있는 지표를 찾고, 결과를 해석하시오. (대사중후군.sav : 유의수준 0.05) 귀무가설 : 대립가설 : 문제 1 :가설설정  만족도에 유의한 차이가 있는 문항 : ( ) 문항 귀무가설 : 대립가설 : 문제 2 :가설설정  지표에 유의한 차이가 있는 문항 : ( ) 문항 2016년 - SPSS를 활용한 통계특강 -

15 두 집단 평균비교 : 대응표본 대응표본의 자료구조 : 모집단으로부터 추출된 동일 표본을 서로 다른 관점에서 2번 관찰(또는 응답)하여 얻은 자료 형태. [예제] 매년 사원들을 대상으로 실시되는 정규컴퓨터교육이 업무효율성을 증진시키는 효과가 있는지를 판단하기 위해 16명의 사원을 임의로 추출하여 정규컴퓨터교육을 받기 전과 후의 업무효율성을 측정하여 얻은 자료가 다음과 같다. 교육 전후의 업무효율성이 차이가 있는가를 유의수준 5%로 검정하시오. (파일 : 대응표본.sav) <컴퓨터 교육효과 조사 자료> 교육 전 업무효율성 교육 후 업무효율성 2016년 - SPSS를 활용한 통계특강 -

16  [대응표본의 경우는 등 분산 검정이 필요하지 않다(하나의 동일 표본이기 때문) ]
두 집단 평균비교 : 대응표본 검정 1 귀무가설 : 컴퓨터교육 전후의 업무효율성에 차이가 없다. 대립가설 : 컴퓨터교육 전후의 업무효율성에 차이가 있다.  [대응표본의 경우는 등 분산 검정이 필요하지 않다(하나의 동일 표본이기 때문) ] 가설설정  수행절차 : 메뉴  분석  평균비교  대응표본 T검정 (대응변수, 옵션 지정) 2016년 - SPSS를 활용한 통계특강 -

17 두 집단 평균비교 : 대응표본 검정 2 [결과해석] 대응표본 상관계수가 로 양의 상관성이 있으며, 유의확률 0.01로 유의수준 0.05 보다 작으므로 교육 전과 교육 후의 상관성이 유의하다 할 수 있다.  가설검정결과 유의확률=0.473 < 유의수준=0.05로 귀무가설을 채택 (즉, 교육전과 교육후의 업무효율성은 차이가 있다고 할 수 없다. 2016년 - SPSS를 활용한 통계특강 -

18 두 집단 평균비교 : 대응표본 검정 (실습) [문제 1] 모 회사의 새로운 작업방법의 교육으로 작업자의 평균생산량을 증가시키고자 10명의 작업자를 임의로 선발하여 교육 전 생산량과 4주간의 교육을 시킨 후 생산량을 측정한 결과의 자료가 다음과 같다. 새로운 작업방법의 교육으로 인해 평균생산량에 차이가 있는지 유의수준 5%로 검정하시오. (대응표본(실습).sav : 유의수준=0.05) [문제 2] 대사중후군의 실험-대조 집단(ex_co)에 따른 사전-사후의 대사중후군 10개 지표에 유의한 차이가 있는 지표를 찾고, 결과를 해석하시오. (대사중후군.sav : 유의수준 0.05) 귀무가설 : 대립가설 : 문제 1 :가설설정  결과해석 : 귀무가설 : 대립가설 : 문제 2 :가설설정  결과해석 : 2016년 - SPSS를 활용한 통계특강 - 지표에 유의한 차이가 있는 문항 : ( ) 문항

19 세 집단 이상의 평균비교 독립변수의 그룹(범주)의 수 t-검정 두 집단 t-검정 일원배치법 요인의 분산분석 수 이원배치법
독립변수의 그룹(범주)의 수 두 집단 t-검정 요인의 셋 이상 일원배치법 이원배치법 다원배치법 분산분석 하나 t-검정 2016년 - SPSS를 활용한 통계특강 -

20 분산분석의 이해 셋 이상의 집단의 평균을 비교하는 통계적 기법 (분산분석 : ANOVA)
(예) 사무직 근로자와 생산직 근로자 그리고 서비스 직 근로자간의 평균임금을 비교하는 경우를 들 수 있다. 근로자의 유형 : 요인, 임금 : 반응값, 분산분석  독립변수(요인), 종속변수(반응값) 2016년 - SPSS를 활용한 통계특강 -

21 (* : 결측  교육 중 전학, 질병 등에 의해 실험에서 제외된 학생)
분산분석의 용어설명 [예제] 컴퓨터 교육성취도를 알아보기 위해 대도시, 중도시, 소도시, 농어촌의 초등학교에서 각각10명을 임의 추출하여 1개월간 교육을 시킨 후 교육성취도를 100점 만점으로 측정하여 다음의 자료를 얻었다. (* : 결측  교육 중 전학, 질병 등에 의해 실험에서 제외된 학생) 대도시 중도시 소도시 농어촌 * * * * * * * * * * * 평균=74.67 평균=80.87 평균=73.29 평균=83.00 (1) 요인(인자) : 반응(관측, 실험, 응답) 값에 영향을 주는 중요한 원인  도시규모 (2) 반응 값 : 조사(실험)목표를 잘 측정할 수 있는 기준  교육성취도 (3) 수준 : 고려된 요인 또는 인자의 범주(집단)의 수  도시규모(대도시~농어촌) 4수준 (4) 처리 : 실제 실험에서 요인들의 수준이나 요인 수준들의 조합  (4*10=40명 : 결측 15) 분산분석의 목적 : 반응변수에 유의한 영향을 미치는 요인의 효과를 검정하고 반응 값의 최적의 조건(요인의 수준조합)을 찾는 것이 목적. 2016년 - SPSS를 활용한 통계특강 -

22 분산분석 : 예 제 [연구가설] 어느 음식점에서 네 곳의 지점별 매출액을 요일별로 조사한 결과가 다음과 같았다. 지점별 평균매출액과 요일별 평균매출액에 차이가 있는지를 알아보려 한다. (단위 : 백만원) (1) 요인(인자)  ( ) (2) 반응 값  ( ) (3) 수준  ( ) (4) 처리  ( ) 2016년 - SPSS를 활용한 통계특강 -

23 분산분석의 종류 및 절차 분산분석의 종류 (by 인자의 수) 분산분석의 절차 일원배치 분산분석 이원배치 분산분석
다원배치 분산분석 분산분석의 절차 가설 설정 유의수준 설정 분산분석표 작성 결과해석 다중비교(사후분석)  최적조건 2016년 - SPSS를 활용한 통계특강 -

24 일원배치 분산분석 : 자료구조-가설설정 일원배치 분산분석 자료구조 :
 반응 값에 대해 한 종류의 요인만의 영향을 조사하고자 할 때에 사용하는 분산분석법 자료구조 : 자료형태 : 독립변수(요인) 1개 (범주형:3그룹 이상), 종속변수(반응변수) 1개 (연속형) 귀무가설 : k-개의 평균들간의 차이가 없다. 대립가설 : k-개의 평균들간의 차이가 있다. 가설설정  귀무가설 : k-개의 처리 효과간의 차이가 없다. (요인의 효과가 없다) 대립가설 : k-개의 처리 효과간의 차이가 있다. (요인의 효과가 있다) 가설설정  2016년 - SPSS를 활용한 통계특강 -

25 일원배치 분산분석 : 분석방법 1 [연구가설] 근무한 인턴쉽기관(기업군)에 따라 만족도(근무환경, 진로결정에 도움) 에 차이가 있다고 할 수 있는가 ? (일원배치 분산분석 : 유의수준 0.05로 검정)  산업체 인턴쉽프로그램에 대한 만족도 및 태도조사의 일부분이다. (파일 : 산업체인턴.sav) [5] 본인의 인턴쉽기관은 어느 기업군에 속합니까 ? 1) 대기업 ( ) 2) 공기업 ( ) 3) 중소기업 ( ) 4) 국가연구소 ( ) 만 족 도 매우 만족 만족 보통 불만 매우 불만 [21] 인턴쉽기관의 근무환경 5 4 3 2 1 ---중간생략--- [24] 부과된 업무 귀무가설 : 기업군에 따라 평균만족도(근무환경, 부과업무)에 차이가 없다. 대립가설 : 기업군에 따라 평균만족도(근무환경, 부과업무)에 차이가 있다. 가설설정  귀무가설 : 만족도에 대한 요인(기업군)의 효과가 없다. 대립가설 : 만족도에 대한 요인(기업군)의 효과가 있다. 가설설정  2016년 - SPSS를 활용한 통계특강 -

26 일원배치 분산분석 : 분석방법 2 수행절차 : 메뉴  분석  평균비교  일원배치 분산분석 (종속변수, 요인, 옵션 선택)
2016년 - SPSS를 활용한 통계특강 -

27 일원배치 분산분석 : 분석방법 3 귀무가설 : 기업별 만족도의 분산이 동일하다
대립가설 : 기업별 만족도의 분산이 동일하지 않다. 가설설정  분산의 동질성에 대한 검정결과 유의확률이 모두 유의수준 0.05보다 작으므로 가설기각  기업별 등 분산을 만족. 2016년 - SPSS를 활용한 통계특강 -

28 일원배치 분산분석 : 분석방법 4 근무환경 평균만족도의 차이에 대한 검정결과 유의확률= > 유의수준=0.05 로 가설채택. (즉, 기업별 근무환경에 대한 평균만족도에 차이가 없다) 부과업무 평균만족도의 차이에 대한 검정결과 유의확률=0.016 < 유의수준=0.05로 가설기각. (즉, 기업별 부과업무에 대한 평균만족도에 차이가 있다) 다중비교(사후분석)이란  요인의 가능한 두 수준간의 평균차이를 검정하여 차이가 있는 group과 없는 group을 나누어 Grouping하는 방법. 다중비교(사후분석) : 분사분석결과 요인의 효과가 있는 경우 다중비교를 수행한다. 위의 경우 부과업무에 대해서만 요인(기업군)의 효과가 있으므로 사후분석을 추가적으로 수행. 2016년 - SPSS를 활용한 통계특강 -

29 일원배치 분산분석 : 분석방법 5 다중비교 : 분석  평균비교  일원배치 분산분석  사후분석 (Duncan 선택)
중소기업-공기업의 경우만 평균차이가 있다. Grouping : (중소기업, 대기업, 국가연구소)-(공기업) (중소기업) –(대기업, 국가연구소, 공기업) 최적조건 : 평균이 가장 큰 공기업의 경우 만족도가 최대가 됨을 알 수 있다. 2016년 - SPSS를 활용한 통계특강 -

30 일원배치 분산분석 : 다중비교 다중비교(multiple comparison) : 보통은 F-검정결과 유의한 경우 다중비교를 통해 수준간 평균들의 차이를 검정하지만, 실제로 F-검정결과와 관계없이 수행 가능하다.  참고 : F-검정결과가 유의하지 않더라도 다중비교에서 모평균간에 차이가 있을 수 있다. (다중비교 방법) Fisher의 최소유의차 LSD : 반복수가 다른 경우나 귀무가설이 기각되는 경우에 사용. Tukey의 정직유의차 HSD : 반복수가 동일하다는 가정에서 고안된 방법으로 Fisher의 LSD보다 더욱 엄격한 검정으로 유의한 차이로 판단되는 경우가 적다. 즉, 검정력이 떨어져서 유의수준을 0.1로 사용할 것을 제안. Scheffe : 반복수가 다른 경우에도 사용 가능하며 Tukey 방법보다 더 일반적이며, 융통성이 있는 경우로, 검정력이 다소 감소한다. (유의수준 0.1을 사용할 것을 제안) Duncan : 등분산성과 반복수가 동일하다는 가정에서 고안되어 다른 방법에 비해 평균차이를 검출하는 확률이 높아서(즉, 검정력이 높다) 자주 이용되지만, 1종 오류가 높을 가능성이 있어 좋은 방법이 되지 못함.  참고 : 다중비교를 할 때는 2~3가지의 다중비교를 동시에 고려하는 것이 좋다. 2016년 - SPSS를 활용한 통계특강 -

31 (결측  학기 중에 전학, 질병 등에 의해 시험을 치루지 못한 학생)
일원배치 분산분석 : 실습 [문제] 4가지 교육방법의 효과를 비교분석하기 위하여 학생 40명을 무작위로 10명씩 4개 집단으로 나누고 한 학기 동안 각 교육방법으로 교육을 시킨 후에 치룬 학기말 시험성적이 다음과 같다. 교육방법에 따른 효과에 차이가 있는가를 유의수준 0.05로 검정하시오. 추가적으로 기술통계량, 평균도표를 작성하고, 요인효과가 있는 경우 사후분석을 통해 의미를 해석하고, 최적조건을 찾으시오. (결측  학기 중에 전학, 질병 등에 의해 시험을 치루지 못한 학생) 교육방법1 교육방법2 교육방법3 교육방법4 65 87 73 79 81 69 75 83 72 90 59 78 67 62 76 94 89 80 88 2016년 - SPSS를 활용한 통계특강 -

32 일원배치 분산분석 : 실습 (…계속) 귀무가설 : 대립가설 : 가설설정  수행절차1 : 일원분산분석(실습).sav를 불러온다
수행절차2 : 분석  평균비교  일원배치 분산분석  (종속변수, 요인선택) 수행절차3 : 일원배치 분산분석  옵션 (기술통계, 분산동질성, 평균도표 선택) 수행절차4 : 일원배치 분산분석  사후분석 (등분산가정함 : Duncan 선택) 기술통계량 : 분산의 동질성 : 평균도표 : 분산분석표 : 사후분석 및 최적조건 : 결과해석  2016년 - SPSS를 활용한 통계특강 -

33 이원배치 분산분석 : 자료구조-가설설정 이원배치 분산분석 자료구조 :
 반응 값에 대해 두 종류의 요인의 영향을 조사하고자 할 때에 사용하는 분산분석법 자료구조 : 자료형태 : 독립변수(요인) 2개 (범주형:3그룹 이상), 종속변수(반응변수) 1개 (연속형) 귀무가설 : 요인(A)의 평균들간의 차이가 없다. (요인A의 효과가 없다) 대립가설 : 요인(A)의 평균들간의 차이가 있다. (요인A의 효과가 있다) 가설설정  귀무가설 : 요인(B)의 평균들간의 차이가 없다. (요인B의 효과가 없다) 대립가설 : 요인(B)의 평균들간의 차이가 있다. (요인B의 효과가 있다) 가설설정  2016년 - SPSS를 활용한 통계특강 -

34 이원배치 분산분석 : 분석방법 1 [연구가설] 어느 음식점에서 네 곳의 지점별 매출액을 요일별로 조사한 결과가 다음과 같았다. 지점별 평균매출액과 요일별 평균매출액에 차이가 있는지를 알아보려 한다 (이원배치 분산분석 : 유의수준 0.05로 검정) (파일 : 이원분산분석.sav) (단위 : 백만원) 귀무가설 : 요인(지점)의 평균들간의 차이가 없다. (요인의 효과가 없다) 대립가설 : 요인(지점)의 평균들간의 차이가 있다. (요인의 효과가 있다) 가설설정  귀무가설 : 요인(요일별)의 평균들간의 차이가 없다. (요인의 효과가 없다) 대립가설 : 요인(요일별)의 평균들간의 차이가 있다. (요인의 효과가 있다) 가설설정  2016년 - SPSS를 활용한 통계특강 -

35 이원배치 분산분석 : 분석방법 2 수행절차 : 분석  일반선형모형  일변량 (종속변수, 모수요인, 모형 선택) 통계적 모형 : 모형의 절편 : 전체평균 주효과 : 지점, 요일 2016년 - SPSS를 활용한 통계특강 -

36 이원배치 분산분석 : 분석방법 3 지점과 요일 중 어떤 요인이 매출액에 더 큰 영향인자인가 ?
통계적 모형의 적합성검정 : 귀무가설 (이원배치분산분석 모형이 적합하지 않다) 대립가설 (이원배치분산분석 모형이 적합하다) 모형의 적합성검정: 유의확률=0.004 <유의수준=0.05 로 가설기각. (즉, 이원배치분산분석 모형이 타당한 것으로 판단할 수 있다)  R-제곱 : 모형의 설명력으로 83.6% 로 높다. 2요인(지점, 요일)의 검정: 유의확률=0.047<유의수준=0.05로 가설기각. (즉, 지점별 요일별 평균매출액에 유의한 차이가 있다 ) 2016년 - SPSS를 활용한 통계특강 -

37 (지점 : 지점D), (요일 : 수)  평균매출액이 최고가 됨.
이원배치 분산분석 : 분석방법 4 수행절차 : 사후분석  사후검정변수 (지점, 요일 선택)  등분산가정함 (Duncan 선택) 사후분석결과 : 지점  2개로 Grouping 되며, (지점A~C)-(지점D) 또는 (지점A~B)-(지점C~D)가 됨. 요일  3개로 Grouping 되며, (화, 목)-(목, 월)-(월, 수)가 됨. 최적조건 : 반응 값이 매출액으로, 평균매출을 가장 크게 하는 요인의 최적조건은 다음과 같다. (지점 : 지점D), (요일 : 수)  평균매출액이 최고가 됨. 2016년 - SPSS를 활용한 통계특강 -

38 반복-이원배치 분산분석 : 자료구조 반복-이원배치 분산분석 자료구조 :
 반응 값에 대해 두 종류의 요인의 영향을 조사하고자 할 때에 사용하는 분산분석법 자료구조 : 2016년 - SPSS를 활용한 통계특강 -

39 반복-이원배치 분산분석 : 가설설정 자료형태 : 독립변수(요인) 2개 (범주형:3그룹 이상), 종속변수(반응변수) 1개 (연속형)  반복측정(관찰, 응답)의 장점 : 신뢰성이 높아지고, 교호작용(결합효과)을 분리하여 해석할 수 있다. 귀무가설 : 요인(A)의 평균들간의 차이가 없다. (요인A의 효과가 없다) 대립가설 : 요인(A)의 평균들간의 차이가 있다. (요인A의 효과가 있다) 가설설정  귀무가설 : 요인(B)의 평균들간의 차이가 없다. (요인B의 효과가 없다) 대립가설 : 요인(B)의 평균들간의 차이가 있다. (요인B의 효과가 있다) 가설설정  귀무가설 : 요인(AB)의 평균들간의 차이가 없다. (교호작용효과가 없다) 대립가설 : 요인(AB)의 평균들간의 차이가 있다. (교호작용효과가 있다) 가설설정  2016년 - SPSS를 활용한 통계특강 -

40 반복-이원배치 분산분석 : 분석방법 1 [연구가설] 동일한 광고비를 사용할 때 활용하게 되는 광고매체의 종류와 판매물품의 포장색상이 소비자에게 주는 광고효과(100점)에 대한 조사를 통해 다음의 자료를 얻었다 (반복-이원배치 분산분석을 수행 : 유의수준 0.1로 검정) (파일 : 반복이원분산분석.sav) (단위 : 백만원) 귀무가설 : 주요인의 평균들간의 차이가 없다. (주효과(A, B)가 없다) 대립가설 : 주요인의 평균들간의 차이가 있다. (주효과(A, B)가 있다) 가설설정  귀무가설 : 교호작용(A*B)효과가 없다 대립가설 : 교호작용(A*B)효과가 있다 가설설정  2016년 - SPSS를 활용한 통계특강 -

41 반복-이원배치 분산분석 : 분석방법 2 통계적 모형 :
수행절차1 : 분석  일반선형모형  일변량 (종속변수, 모수요인, 모형 선택) 통계적 모형 : 모형의 절편 : 전체평균 주효과 : 지점, 요일 교호효과 : 지점, 요일 2016년 - SPSS를 활용한 통계특강 -

42 반복-이원배치 분산분석 : 분석방법 3 수행절차2 : 옵션  기술통계량  유의수준 (0.1)
수행절차3 : 사후분석  사후검정변수 (색상, 광고매체) : 등분산가정함 (Duncan 선택) 2016년 - SPSS를 활용한 통계특강 -

43 반복-이원배치 분산분석 : 분석방법 4 주효과 :색상, 매체 교호효과:색상*매체
 어떤 요인이 매출액에 가장 큰 영향을 주는가 ? 통계적 모형의 적합성검정 : 귀무가설 (반복이원배치분산분석 모형이 적합하지 않다) 대립가설 (반복이원배치분산분석 모형이 적합하다) 모형의 적합성검정: 유의확률=0.000 <유의수준=0.1 로 가설기각. (즉, 반복이원분산분석 모형이 타당한 것으로 판단할 수 있다)  R-제곱 : 모형의 설명력으로 83.1% 로 높다. 주효과(색상, 매체)와 교호효과(색상*매체)의 검정: 유의확률=(0.080, 0.000, 0.003)<유의수준=0.1로 가설기각. (즉, 주효과와 교호효과 모두 유의하다 ) 2016년 - SPSS를 활용한 통계특강 -

44  주효과 (색상 : 초록, 광고매체 : 신문)  교호효과 (색상*광고매체 : 초록*신문)
반복-이원배치 분산분석 : 분석방법 5 사후분석결과 : 색상  2개로 Grouping 되며, (빨강,파랑)-(초록) 또는 (빨강)-(파랑,초록)가 됨. 매체  2개로 Grouping 되며, (라디오,TV)-(신문)가 됨. 최적조건 : 반응 값이 광고효과로, 광고효과를 가장 높이는 요인의 최적조건은 다음과 같다.  주효과 (색상 : 초록, 광고매체 : 신문)  교호효과 (색상*광고매체 : 초록*신문) 2016년 - SPSS를 활용한 통계특강 -

45 반복-이원배치 분산분석 : 실습 [문제] 점포의 크기와 지역에 따라 생활필수품의 가격을 조사하였다. 점포의 크기와 지역에 따른 생활필수품의 가격에 차이가 있는지 분석하여 보자. (반복-이원배치 분산분석을 수행 : 유의수준 0.05) (파일 : 반복이원분산분석(실습).sav) 필요한 가설설정 : 통계적모형 : 분산분석표를 이용 결과해석 : 사후분석 및 최적조건 : 결과해석  수행절차1 : 분석  일반선형모형  일변량 (종속변수, 모수요인, 모형 선택)  옵션 (기술통계량. 수행절차2 : 사후분석  사후검정변수 (지역, 점포크기) : 등분산가정함 (Duncan 선택) 2016년 - SPSS를 활용한 통계특강 -


Download ppt "SPSS를 활용한 통계분석 김 덕 기 충북대학교 정보통계학과"

Similar presentations


Ads by Google