단일 모집단 평균검증(t) 모집단의 평균( μ)값을 일반적으로 이해(혹은 지금까지의 이해)와는 다르게 연구자가 생각하는 경우 사용. 단일모집단 평균검증에는 모집다의 구성요소들이 정규분포를 이룬다는 가정하에 t-test를 사용하며 다음의 검증통계량이 사용됨. 기초통계학에서 모집단의 크기가 크면(n1≥30, n2≥30) 중심극한정리에 따라 Z-test를 사용할 수 있다고 설명되고 있으나 t-test를 사용하는 것이 보다 엄격하기 때문에 t-test를 사용하는 것이 바람직.
연구가설 : 학급 학생들의 평균신장은 150㎝와 차이가 있을 것이다. H0 : μ= 150 H1 : μ≠ 150 SPSS 10.0을 이용한 단일모집단 평균검증 방법 일반적으로 중학교 1학년 학생들의 평균신장은 대체로 150㎝정도 되는 것으로 받아들여진다. 이에 따라 어느 중학교 1학년 학생들의 평균신장이 150㎝라고 말할 수 있는지를 조사하기 위하여 1학년 학생들 30명의 키를 측정한 결과 <표 7.1>과 같았다. 이러한 자료로써 이 학교 1학년 학생들의 평균신장이 150㎝라고 말할 수 있는가 ? α = .05. 연구가설 : 학급 학생들의 평균신장은 150㎝와 차이가 있을 것이다. H0 : μ= 150 H1 : μ≠ 150 표 7.1 중학교 1학년 학생들의 신장(㎝) 148 150 149 144 152 155 147 151 153 160 165 140 141
메뉴 바에서 『분석(A) → 평균비교(M) → 일표본 T 검정(S)』을 선택하면…
외쪽 변수상자에서 검정변수와 집단변수로 각각 변수를 이동.
케이스의 수, 평균신장, 표준편차 등이 나타나 있고, 검증값 150㎝에 대한 t-검증 결과가 제시되어 있음. 분석결과 t-value가 –.264이고 p-value(유의확률)는 양측검증에서 .794로서 비유의적으로 나타났음(p-value = .794 >α=.05) 이 학교 1학년들의 평균신장은 150㎝가 아니라고 말할 수 없다. 다시 말하면, 이 학교 1학년 학생들의 평균신장은 150㎝정도 되는 것으로 추측됨.
두 모집단 평균차이 검증(t) 개요 : 두 개의 독립모집단 평균차이 검증에는 두 모집단이 정규분포를 이루며 분산이 같다는 가정 하에(σ12 = σ22) t-test를 사용 → 각각의 모집단 크기가 크면(n1≥30, n2≥30) 중심극한 정리에 따라 Z-test를 사용할 수 있으나, t-test를 사용하는 것이 보다 엄격하다는 측면에서 바람직하다. 두 모집단의 평균차이 검증에는 t-test를 사용하며 다음의 검증통계량이 사용됨. = 표본 1의 평균 표본 2의 평균 귀무가설로 설정된 두 모집단평균의 차이값 두 모집단을 결합했을 때의 = 결합표준편차(σ)의 추정치 표본 1의 크기 표본 2의 크기 의 표준오차
연구가설 : 판매사원들에 대한 두 가지 교육방법에 따른 판매실적에는 차이가 있을 것이다. H0 : μ1 = μ2 SPSS 10.0을 이용한 두 모집단 평균검증 방법 자동차 판매사원들을 교육하는 두 가지 방법 중 어는 방법이 보다 효과가 있을까 ? 이를 조사하기 위하여 신입 판매사원 18명을 무작위로 두 그룹으로 나누어 각각 A방법과 B방법으로 교육하였다. 교육 후 6개월간의 판매실적은 아래 표와 같이 나타났다. 이 자료로부터 두 가지 교육방법은 다른 판매실적을 초래한다고 할 수 있는가 ? 이 경우 각 그룹에 할당된 판매원들의 판매와 관련된 기본 능력은 동일하다고 가정 ? α=.05 연구가설 : 판매사원들에 대한 두 가지 교육방법에 따른 판매실적에는 차이가 있을 것이다. H0 : μ1 = μ2 H1 : μ1 ≠ μ2 교육방법 A B 32 35 37 31 29 28 25 41 34 44 40 27
메뉴 바에서 『분석(A) → 평균비교(M) → 독립표본 T 검정(T)』을 선택하면…
데이터 입력시 교육방법 A, B를 각각 1, 2로 입력하였으므로 집단 1에 1, 집단 2에 2를 입력 → 집단구분 변수가 본 예에서와 같이 각 집단을 의미하는 특정 값을 지정된 경우가 아니라 연속된 값으로 입력된 경우 에는 중앙값이나 평균을 이용하여 두 집단으로 나눌 수 있으며, 이 때는 “지정값 사용(U)” 대신 “분리점(C)”에 중앙값이나 평균값을 입력해 주면 됨.
분석별 결측값 제외(A) : 특정 분석의 대상이 되는 변수값이 결측된 케이스만 그 분석에서 제외(기본설정). 목록별 결측값 제외((L) : 어떤 케이스의 변수값들 중 어떤 변수값이라도 결측되면 그 케이스는 모든 분석에서 제외.
판매사원들에 대한 두 가지 교육방법에 따른 판매실저에는 차이가 있을 것이라는 연구가설은 지지되지 않았음. 두 모집단 평균차이 검증에서 두 모집단의 분산이 같다는 가정하에((σ12 = σ22) t-test를 사용 → Levene의 등분산 검증결과 p-value(유의확률)는 .807로서 α = .05에서 H0 : σ12 = σ22를 기각하지 못하므로 등분산 가정에는 문제가 없음. 등분산 가정이 된 경우 양측검증에서 t-value가 1.649이고 p-value(유의확률)는 .119로 나타나 “H0 :μ1 = μ2”는 α = .05에서 기각되지 않는다. 즉, 두 가지 교육방법에 따른 판매실정의 차이는 있다고 할 수 없음(t-value는 평균차이를 표준오차의 차이로 나눈값임). 판매사원들에 대한 두 가지 교육방법에 따른 판매실저에는 차이가 있을 것이라는 연구가설은 지지되지 않았음. 만약, 대립가설(연구가설)이 μ1>μ2 혹은 μ1<μ2라면 p-value는 .0595(.119/2)가됨 → 이는 단측검증에서의 p-value는 양측검증에서의 p-value의 ½이기 때문임. 따라서, 단측검증으로 가설이 설정되었다면 검증결과는 보다 유의적으로 나타남.
짝을 이룬 값들의 차이검증(A Paired-difference test; t) 개요 : 표본의 값들이 짝을 이루고 있으며, 짝을 이룬 값들을 비교하는 경우 → 짝을 이룬 값들은 서로 독립적이지 않으며, 따라서 모집단은 두 개가 아닌 하나가 됨 → t-test를 사용하지만 검증통계량과 자유도가 앞이 경우와 다른 데 유의해야 함. 짝을 이룬 값들의 차이검증에는 t-test를 사용하며 다음의 검증통계량이 사용됨. = 각 표본요소의 값들의 차이의 평균값 귀무가설로 설정된 차이의 평균값 표본요소들의 차이값들의 표준편차 = 의 표준오차
SPSS 10.0을 이용한 paired-t test 한 소비재 제조회사 마케팅관리자는 비누의 매출이 패키지 디자인에 따라 다를 것이라는 생각을 하고 두 가지 패키지 디자인 A, B를 개발하였다. 그런데 실험을 위하여 선정된 수퍼마켓 지점들을 무작위로 두 집단으로 나누어 각 집단의 수퍼마켓에 패키지 디자인 A 혹은 B의 비누를 진열하고 매출을 비교한다면 수퍼마켓의 크기, 내점고객수, 그 지역의 소득, 경쟁상황 등 여러 가지 요인들이 매출에 영향을 줄 수 있다고 생각하였다(외생변수). 그리하여 8개의 수퍼마켓을 선정하여(외생변수의 통제) 패키지 디자인 A와 B의 비누를 함께 진열하며 매출을 조사하였다. 이러한 결과로부터 패키지 디자인에 따라 비누의 매출이 다르다고 할 수 있는가 ? α=.05. 표 7.5 슈퍼마켓별 각 패키지 디자인의 판매실적과 차이계산 슈퍼마켓 패키지 디자인 di A B 1 37 26 11 49 2 19 8 16 3 17 4 22 6 5 32 35 -3 10 7 14 13 9 12 ∑=144
연구가설 : 패키지 디자인에 따라 비누의 판매실적은 다를 것이다. H0 : d0 = 0 H1 : d0 ≠ 0 메뉴 바에서 『분석(A) → 평균비교(M)→ 대응표본 T 검정(P)』
대응변수 두 개를 선택하여 를 클릭하여 오른쪽의 대응변수(V)상자로 보낸다. 옵션부분의 설정과 나머지 부분은 독립표본 T 검정과 동일하다.
양측검증에서 t-value는 2. 494, p-value는. 041로 나타나 “H0 : d0 = 0”는 α = 양측검증에서 t-value는 2.494, p-value는 .041로 나타나 “H0 : d0 = 0”는 α = .05에서 기각된다. 즉, 비누 패키지 디자인 A와 B에 따른 판매실적에는 차이가 있는 것으로 나타났음. 패키지 디자인 B보다는 A의 경우에 더 높은 판매실적으로 보이는 것으로 나타났으므로 패키지 디자인에 따라 비누의 판매실적은 다를 것이라는 연구가설은 지지되었음.
단일모집단 비율검증(Z) 단일모집단 비율검증을 위해서는 기본적으로 이항분포(binominal distribution)를 사용하나 표본의 크기가 크면 중심극한정리에 따라 비율의 표본분포(sampling distribution of proportion)가 정규분포에 가까워진다. 따라서 표본의 크기가 큰 경우(대체로 n ≥ 30) 일반적으로 Z-test를 사용함. 단일모집단 비율검증시 표본의 크기가 크면 Z-test를 사용하며, 다음의 검증통계량이 사용됨. SPSS 10.0을 이용한 단일모집단 비율검증 치약 제조회사는 전체가구 중 10% 정도가 자사의 브랜드 A를 사용하는 것으로 알고 있었다. 마케팅부서는 시장점유율을 높이기 위해 6개월간 집중적 프로모션 활동을 하였다. 프로모션 활동에 따라 점유율이 높아졌는지를 알기 위해 표본추출에 의한 조사를 실시하였다. 조사결과 전체조사대상 50가구 중 10가구가 브랜드 A를 구매하는 것으로 나타났다. 이러한 결과에 따라 마케터는 시장점유율이 향상되었다고 할 수 있는가 ? α = .05.
연구가설 : 브랜드 A 치약 구매가구는 전체가구 수의 10%보다 많을 것이다. H0 : p = .10 H1 : p > .10 메뉴 바에서 『분석(A) → 비모수검정(N)→ 이항(B)』
데이터로부터 얻기(G) : 입력된 데이터에 따라 케이스들이 이분됨(기본설정). 치약구매를 선택하여 를 클릭 하여 오른쪽의 검정변수(T)상자로 보낸다. [이분형 정의] 데이터로부터 얻기(G) : 입력된 데이터에 따라 케이스들이 이분됨(기본설정). 분리점(C) : : 분리점에서 지정한 값을 기준으로 케이스들을 이분함.
점근적 검정(A) : 유의수준은 검증통계량의 점근적 분포를 토대로 계산되는데, 일반적으로 [결측값] 검정별 결측값 제외(T) : 해당 검증과 관련된 변수에 대해 결측값이 있는 케이스를 분석에서 제외(기본설정). 목록별 결측값 제외(L) : 결측값이 있는 케이스는 모든 분석에서 제외.
p-value = .017로 α = .05에서 유의적이다. 즉, 귀무가설을 기각하고 연구가설을 지지함. 프로모션활동에 따라 점유율이 높아진 것으로 결론 지을 수 있음.
두 모집단 비율차이 검증(Z) 두 모집단의 비율차이 검증을 위해서는 기본적으로 이항분포(binominal distribution)를 사용하다. 그러나 단일모집단 비율검증의 경우와 마찬가지로 표본의 크기가 크면(대체로 n1≥30, n2≥30) 중심극한정리에 따라 비율차이의 표본분포는 정규분포에 가까워진다. 따라서, 표본의 크기가 큰 경우 일반적으로 Z-test를 사용함. 두 모집단 비율차이 검증시 표본의 크기가 크면 Z-test를 사용하며, 다음의 검증통계량이 사용됨. = 비율추정치로서 표본 1의 비율값 비율추정치로서 표본 2의 비율값 모집단 1의 비율값 모집단 2의 비율값 (x1과 x2는 각 표본에서 특정속성을 갖는 구성원의 수) 의 표준오차
SPSS 10.0을 이용한 두 모집단 비율차이 검증 승용차 광고에 매력적인 여성모델을 사용하면 보통모델을 사용하는 것보다 그 광고는 남성소비자들에게 보다 어필(appeal)할까 ? 이를 조사하기 위하여 두 가지의 인쇄광고물을 제작하였는데 광고모델 이외에는 모두 동일하게 하였다(외생변수의 통제). 한 광고에는 매우 매력적인 여성을 모델로 등장시키고 다른 광고에는 평범한 여성을 모델로 등장시켰다. 남성소비자 100명을 무작위로 두 그룹으로 나누어 A 그룹에는 매력적인 여성모델의 광고를 그리고 B 그룹에는 보통 여성 모델의 광고를 노출시켰다. 광고노출 후 승용차 광고에 관심을 갖는다고 응답한 피실험자들의 수는 A 그룹에서 37명, B 그룹에서 23명이었다. 이러한 결과에 따라 매력적인 여성모델을 사용하는 광고가 남성소비자들로부터 보다 관심을 끌 수 있다고 할 수 있는가 ? α=.01. 연구가설 : 남성소비자들에게 있어서 여성모델의 광고가 남성모델의 광고보다 많은 관심을 끌 것이다. H0 : p1 = p2 H1 : p1 > p2
위 분석결과에 의하면 α =. 01에서 귀무가설은 기각된다 위 분석결과에 의하면 α = .01에서 귀무가설은 기각된다. 따라서, 광고에 매력적인 여성모델을 사용하면 그 광고는 남성소비자들의 관심을 보다 많이 끌 수 있다고 할 수 있다. 그러나 SPSS에는 두 모집단 비율차이검증을 직접할 수 있는 분석기증이 있으므로 독립성검증(χ2 ; 제 8장에서 설명)에 의해 분석이 가능함.
두 개의 이항비율의 동질성을 검증하는 문제는 Z-test와 χ2 test를 이용하여 분석할 수 있다 두 개의 이항비율의 동질성을 검증하는 문제는 Z-test와 χ2 test를 이용하여 분석할 수 있다. 대수계산에 의하면 Z2은 2×2 교차분석표에 대한 χ2값과 정확히 일치. Z2 = 2.85772 = 8.167 = χ2이며, α = .05에서 Z2 = (1.96)2 = 3.8416은 자유도가 1일 때 α = .05에서의 2값과 같다. 따라서 본 예의 경우에 χ2값은 8.167, 그리고 p-value = .004이므로 α = .05에서 귀무가설은 기각됨. 좌측의 표는 양측검증 결과를 나타내주는데, 본 예제의 경우 단측검증으로 p-value = .002(.004/2)이며, 유의적임. 광고에 매력적인 여성모델을 사용하면 그 광고는 남성소비자들의 관심을 보다 많이 끌 수 있다고 할 수 있음.