마케팅 조사론 Marketing Research
분석기법의 종류 분석기법의 분류기준 분석기법의 분류
분석기법의 분류기준 - 연구목적을 효과적으로 달성하고 의미 있는 분석결과를 얻기 위해서는 연구의 초기단계인 조사설계와 설문지 작성단계부터 분석에 이용할 분석기법 등에 대한 구상이 필요하며 이는 각 기법들의 용도와 제한점에 대한 이해가 선행조건 - 분석기법들의 분류기준 1) 변수의 수 2) 분석의 성격 3) 척도의 종류 4) 집단의 수 5) 표본의 성격
분석기법의 분류 1. 변수의 수 - 분석의 대상이 되는 변수의 수에 따라 단일변량 분석기법과 다변량 분석 기법으로 나눔 1) 단일변량 분석기법 - 어떤 한 변수의 분포상의 특성을 파악하는 데 사용되는 분석방법 - 빈도 및 백분율, 대표값, 분산의 정도 등 ☞ 기술통계 - 대표값 a. 평균 : 등간척도나 비율척도로 수집된 자료의 대표값 측정 예) 멀티미디어 PC의 구매의도 측정 b. 최빈수 : 명목척도로 측정되어 범주화될 수 있는 자료의 대표값 측정 예) 가장 선호하는 맥주 상표는 무엇입니까?
분석기법의 분류 c. 중위수 : 서열척도, 등간척도, 비율척도로 수집된 자료의 대표값 측정 응답자의 반응을 가장 낮은 값에서부터 높은 값으로 나열한 경우 중간에 위치하는 값 예) 응답자 5명의 지난 2개월 동안 음료수 구매량이 2병, 4병, 6명, 8병, 10병인 경우 중위수는 5병 - 분산(변이에 대한 측정) : 분산은 평균을 중심으로 한 측정값들의 흩어짐 을 의미하며 등간척도, 비율척도로 측정된 자료인 경우에 분석가능하며 명목척도나 서열척도인 경우는 주관적 판단에 의해 측정한다. 마케팅 조사에서 평균이 같더라도 분산이 차이가 나면 서로 다른 결론이 유도 되며 상이한 마케팅 전략이 사용된다. - SPSS 프로그램 사용법 : 통계분석 → 빈도분석 → 통계량
분석기법의 분류 2) 다변량 분석기법 - 2개 또는 그 이상의 변수들의 관계를 분석하는 방법으로 2개인 경우는 이원변량분석, 3개 이상인 경우는 다변량 분석으로 구분 - 변수들의 관계(종속관계, 상호의존관계)에 따라 분석기법들의 적용이 다름 2. 변수의 관계 1) 종속관계에 관한 분석기법 - 독립변수와 종속변수들의 관계를 분석하는 기법이며 변수들의 측정에 사용된 척도에 따라 구분
분석기법의 분류 독립변수 종속변수 분석기법 예 명목척도 (범주형) 범주별 응답자(빈도) X2(Chi-Square) 분석 범주별 응답자(빈도) X2(Chi-Square) 분석 지역별 자사상표 구매자수 차이 명목척도 등간, 비율척도 분산분석 시울시내 거주 구별 백화점 방문빈도 판별분서, 로짓분석 소비자의 소득과 중형승용차의 소유여부 등간, 비율척도 회귀분석 광고비의 변화에 따른 매출액의 변화
분석기법의 분류 2) 상호의존관계 관한 분석기법 - 여러 변수들간의 관련성을 파악하는 데 사용되는 기법 - 요인분석 : 유사한 변수들을 하나의 요인으로 묶음으로써 변수의 수를 줄이는 분석기법 예) 소비자들의 삼푸에 대한 태도를 조사하는 경우, 평가에 사용한 여러 가지 제품속성(샴푸의 색상-시각적 속성, 머릿결의 부드러움, 비듬제거정도, 기름 세척정도-물리적 속성)을 비슷한 제품속성으로 묶어서 분석을 용이하게 함 - 군집분석 : 유사한 특성을 가진 응답자들을 집단으로 묶는 분석기법으로 마케팅 조사에서는 시장세분화를 하는 경우에 사용 3) 구조에 관한 분석기법 - 특정현상을 구성하는 각 이론단위간의 종속 및 상호관계를 포괄적으로 파악하려는 분석기법 - LISREL(선형구조방정식)이 대표적인 기법
분석기법의 분류 3. 척도의 종류 - 명목ㆍ서열척도 : 비모수 통계 - 등간ㆍ비율척도 : 모수 통계 4. 집단의 수 - 실험집단이 하나인 경우 : T검정 - 실험집단이 두개인 경구 : F검정
SPSS 사용법(1) 데이터 입력 1. 직접입력 2. 텍스트 파일을 이용한 외부화일 입력
직접입력
텍스트 화일을 이용한 외부화일 입력 텍스트 화일 작성 - 1-3칸 설문지 번호 - 5칸 설문1) 귀하의 성별은 무엇입니까? ① 남자 ② 여자 ...
데이터의 편집
데이터의 정의
데이터의 정의 - SPSS에서는 등간척도와 비율척도는 ‘Scale’로 묶어서 사용 Name 변수명 V3 Type 변수유형 String Width 변수자리수 1 Decimals 소수점이하 자리수 Lables 변수설명 성별 Value 변수값설명 1. 남자 2. 여자 Missing 결측값 None Column 입력셀의 자리수 Align 정렬 Left Measurement 척도유형 Nominal
데이터의 변환 - 같은 변수 내에서 코딩값을 새로운 값으로 변환하는 경우
데이터의 변환 - 부정형 문항의 코딩값을 새로운 값으로 변환하는 경우 예) 나는 경제적 유용성이 없다고 생각한다.
기술통계 자료기술 SPSS를 통한 기술통계 분석
자료기술 - 마케팅 조사자는 가설검정을 하기 전에 일차적으로 자료에 대한 전반적인 특성을 요약ㆍ정리하여 표현함으로서 이후의 통계분석을 용이하게 할 수 있음 - 자료기술에서 요구되는 기술통계량은 특정변수의 빈도, 평균, 분산 표준편차, 첨도, 편포도 등을 포함 - 기술통계 분석결과는 가설검정이 아니므로 통계적으로 유의하다는 의미가 아니며 단순히 자료의 전반적인 특징만을 나타냄
SPSS를 이용한 기술통계 분석 - 분석(Anaysis) → 기술통계(Discriptive Statistics) → 빈도(Frequencies)
SPSS를 이용한 기술통계 분석 - 왼쪽에서 분석할 변수를 선택한 후 화살표를 클릭하여 오른쪽으로 이동시킴
SPSS를 이용한 기술통계 분석 - 통계량(Statistics)을 클릭하여 분석하고자 하는 통계량을 선택
SPSS를 이용한 기술통계 분석 1) 중심을 나타내는 값 a. 평균(Mean) : 산술평균 b. 중앙값(Median) : 최대치와 최소치의 중간값 c. 최빈값(Mode) : 도수가 가장 많은 값 (분포의 비대칭 정도가 심하여 평균이 의미 없는 경우에 대표값) 2) 산포의 특성을 나타내는 값 분산(Variance), 표준편차(Std. Dev), 최대값(Maximum), 최소값(Minimum), 범위(Range) 3) 비대칭 정도를 나타내는 특성값 a. 왜도(Skewness) : 분포의 비대칭정도를 나타내는 통계량으로 (+)값일 때는 중심에서 우측으로 꼬리가 늘어지는 형태이며, (-)값일 때는 중심에서 좌측으로 꼬리가 늘어지는 경향을 나타내는 지수 b. 첨도(Kurtosis) : 분포의 뽀족한 정도를 나타내는 통계량으로 (+)값일 때는 정상분포곡선의 정상보다 더 위로 분포하고, (-)값일 때는 아래로 분포
SPSS를 이용한 기술통계 분석
SPSS를 이용한 기술통계 분석
집단비교(T-test) T-test의 기본원리 SPSS 프로그램을 이용한 T-test 분석
T-Test의 기본원리 - 마케팅 조사의 경우 집단비교는 여러 형태로 일어남 예) 백화점의 경우 강남지역과 강북지역의 판매량 차이 판촉방법에서 가격인하와 경품제공에 의한 매출신장의 차이 - 집단비교시 이용되는 분석방법 분석방법 Z-Test ㆍ T-Test F-Test 비교집단수 2개 3개 이상 비교원리 표준화된 평균 집단간 분산비율
T-Test의 기본원리 - 두 집단 평균을 비교하는 방법 - 기본원리 1) 가설 H0 : 두 집단의 평균은 동일하다 H1 : 두 집단의 평균은 동일하지 않다 2) 통계량 (집단1의 평균 – 집단2의 평균) / 평균의 표준편차 = T값 분석방법 Z-Test T-Test 모집단 분산 알고 있을 때 모를 때 표본수 30개 이하인 경우엔 T-Test 만 사용
SPSS 프로그램을 이용한 T-Test 분석 - 분석(Analysis) → 평균비교(Compare Means) → 독립표본 T-Test
SPSS 프로그램을 이용한 T-Test 분석
SPSS 프로그램을 이용한 T-Test 분석
SPSS 프로그램을 이용한 T-Test 분석
SPSS 프로그램을 이용한 T-Test 분석
SPSS 프로그램을 이용한 T-Test 분석 - 분석결과의 해석 1) 평균의 동일성 검정 a. t값을 이용하여 검정 {t = 4.313 > t(0.025, 38)} b. 유의확률(p-value) : H0(평균은 동일하다)가 사실인 경우 이런 결과가 나올 확률 (0.000, α = 0.05) c. 자유도(df) : 검정에 사용된 정보의 개수 (n1+n2-2 = 20+20-2=38) 독립표본 검정 8.491 .006 4.313 38 .000 4.80 1.11 2.55 7.05 26.649 2.51 7.09 등분산이 가정됨 등분산이 가정되지 않음 쇼핑횟수 F 유의확률 Levene의 등분산 검정 t 자유도 (양쪽) 평균차 차이의 표 준오차 하한 상한 차이의 95% 신뢰구간 평균의 동일성에 대한 t-검정
집단비교(F-test) F-test의 기본원리 SPSS 프로그램을 이용한 F-test 분석
F-Test의 기본원리 - F-Test는 두 개 이상의 집단을 비교하는 다변량통계의 근간을 이루며 분산분석의 기본 매커니즘 - 특정 집단의 분산은 집단이 동질성 여부를 판단하는 지표로 집단내 이질성의 비율로서 집단간 차이여부를 검정 - F = 집단간 이질성 정도 / 집단내 이질성 정도 = 집단간 분산/ 집단내 분산 = (집단간 분산/ dfB-자유도1) / (집단내 분산 / dfw-자유도2) * 자유도 (dfB) : k-1(k;집단수), 자유도 (dfW) : n-k(n;표본수)
SPSS 프로그램을 이용한 F-Test 분석 - 분석(Analysis) → 평균비교(Compare Means) → 다변량분석(ANOVA)
SPSS 프로그램을 이용한 F-Test 분석
SPSS 프로그램을 이용한 F-Test 분석
SPSS 프로그램을 이용한 F-Test 분석
SPSS 프로그램을 이용한 F-Test 분석 - 분석결과의 해석 1) 등분산의 검정 a. F값을 이용하여 검정 {F = 19.046 > F0.05 (2,27) =3.35} b. 유의확률(p-value) : H0(분산은 동일하다)가 사실인 경우 이런 결과가 나올 확률 (0.000, α = 0.05) ANOVA 선호도 76.467 2 38.233 19.046 .000 54.200 27 2.007 130.667 29 집단-간 집단-내 합계 제곱합 자유도 평균제곱 F 유의확률
상관관계분석 상관관계분석의 의의 상황표(X2분석) 상황계수
상관관계분석의 의의 - 모든 사회현상이 복잡하기 때문에 여러 변수들간의 관련성이 관심의 대상 예) 아이스크림 제조업체 : 날씨와 아이스크림의 구매량 - 상관관계분석은 하나의 변수가 다른 변수와 어느 정도 밀접한 관련성에 대한 변화를 분석하며 인과관계보다는 연관성의 의미 - 상관관계 분석방법 종 류 척 도 등간ㆍ비율 서열 명목 분석방법 Pearson 상관계수 Spearman 서열상관계수 Kendall 일치계수 상황표(X2)
상황표(X2) - X2분석은 명목척도로 측정된 두 변수들의 관련성 분석 예) 판매지역과 선호하는 상표와의 관련성 - 적용과정 1) 조사자는 두 개의 범주형 변수들간의 교차분석표를 작성 2) 가설의 설정 H0 : 판매지역과 구매상표에는 연관가 없다. H1 : 판매지역과 구매상표에는 연관이 있다. 지역 제품 A상표(B1) B상표(B2) C상표(B3) 계 서울지역(A1) 30 55 15 100 경상지역(A2) 40 60 20 120 전라지역(A3) 35 80 150 50 300
상황표(X2) 3) X2 통계량의 계산 : 실제빈도와 차이가 없다는 가정의 기대빈도를 비교 하여 차이가 크면 두 변수간에는 관계가 있음. Eij : ij번째 칸의 기대빈도 Oij : ij번째 칸의 실제빈도 4) 자유도 : (행의 수 – 1) (열의 수 – 1) 5) 검증 : 계산된 X2 통계량 < X2분포에 의해 구해진 임계치(귀무가설 채택) 6) 유의사항 : 기대빈도가 5이하인 칸이 전체 칸 중 25%인 경우 검정 불가능 이런 경우에는 발생빈도가 적은 부분을 합치거나 제외하는 방법
SPSS를 이용한 상황표(X2)분석 - 분석(Analysis) → 기술통계(Discriptive statistics) → 교차분석(Crosstabs)
SPSS를 이용한 상황표(X2)분석
SPSS를 이용한 상황표(X2)분석 - 통계량(Statistics)을 클릭하여 분석하고자 하는 통계량을 선택
SPSS를 이용한 상황표(X2)분석 - 분석결과의 해석 a. 교차분석표 b. X2통계량 검정 - X2 통계량을 이용하여 검정 { X2 통계량 = 3.813 < X2(4. 0.05) = 9.49 } - 유의확률(p-value) : H0(차이가 없다)가 사실인 경우 이런 결과가 나올 확률 (0.432, α = 0.05)
상황계수 - 두 변수간의 관련정도를 알아보기 위한 기법 - 상황계수의 계산 - 분석결과의 해석 * 상황계수값(Value)이 ‘0’이면 상호독립적이다.
상관관계분석(2) 스피어만의 서열상관계수 SPSS를 이용한 스피어만의 서열상관분석 켄달의 일치계수
스피어만의 서열상관계수 - 서열척도로 표시되어 있는 변수들간의 상관관계를 분석 - 두 변수의 순위값이 서로 다를수록 순위차이는 점차 커짐 - 예) 상표번호 가격순위 품질순위 서열차이(di) 서열차이의 제곱 1 2 -1 3 4 5 6 7 8 9 10 합계 18
스피어만의 서열상관계수 - 스피어만의 서열상관계수(rs) 예) - 상관계수의 검정 : 자유도 n-2의 t분포를 이용하여 t값을 계산 예) 5.52 > 2.31{t(8, 0.05)} 이므로 귀무가설(차이가 없다)을 기각
SPSS를 이용한 스피어만의 서열상관분석 - 데이터 입력(1)
SPSS를 이용한 스피어만의 서열상관분석 - 데이터 입력(2)
SPSS를 이용한 스피어만의 서열상관분석 - 분석(Anaysis) → 상관분석(Correlate) → 단순상관(Bivariate)
SPSS를 이용한 스피어만의 서열상관분석 - 왼쪽에서 분석할 변수를 선택한 후 화살표를 클릭하여 오른쪽으로 이동시킴 선택 후 클릭한다
SPSS를 이용한 스피어만의 서열상관분석
SPSS를 이용한 스피어만의 서열상관분석 - 결과화면 스피어만의 서열상관계수 유의수준
켄달의 일치계수 - 서열척도로 이루어진 계수가 3개 이상인 경우 - 서열간의 차이보다는 서열의 합을 이용 - 예) - 3개 변수의 평가가 일치된다면, 서열의 합계는 3.6.9... 3의 배수형태를 보이나 불일치 한다면 서열의 합은 거의 동일한 형태를 보임 타이어 단체1 단체2 단체3 합계(Ri) 1 1(1) 2(1) 5(3) 2 2(2) 1(2) 3(2) 6(6) 3 3(3) 1(3) 7(9) 4 4(4) 5(4) 13(12) 5 6(5) 7(5) 19(15) 6 7(6) 20(18) 7 5(7) 4(7) 14(21)
켄달의 일치계수 - 켄달의 일치계수(W) * K : 평가단체의 수, R : 서열의 합계, n : 평가대상의 수 예)
켄달의 일치계수 - 켄달의 일치계수(W)의 검정 : n이 7개 이상인 경우 자유도 n-1의 X2분포를 이용하여 검정하며 X2값은 K(n-1)W임. 예) > X2(7,0.05) = 12.59 이므로 귀무가설(일치하지 않는다)을 기각.
SPSS를 이용한 켄달의 일치계수분석 - 데이터 입력(1)
SPSS를 이용한 켄달의 일치계수분석 - 데이터 입력(2)
SPSS를 이용한 켄달의 일치계수분석 - 분석(Anaysis) → 상관분석(Correlate) → 단순상관(Bivariate)
SPSS를 이용한 켄달의 일치계수분석 - 왼쪽에서 분석할 변수를 선택한 후 화살표를 클릭하여 오른쪽으로 이동시킴 선택 후 클릭한다
SPSS를 이용한 켄달의 일치계수분석
SPSS를 이용한 켄달의 일치계수분석 - 결과화면 켄달의 일치계수 유의수준
상관관계분석(3) 상관계수 1) 상관계수의 개요 2) 상관계수의 예 SPSS를 이용한 상관분석
상관계수 1. 상관계수의 개요 - 피어슨(Pearson) 상관계수라고도 하며 등간ㆍ비율척도로 측정된 경우에 변수간의 관련성을 분석 - 기본원리 1) 두 변수의 공분산(한 변수에 대한 다른 변수의 증감도)을 이용 COV(X,Y) 2) 두 변수의 공분산을 표준화 시켜준 값이 상관계수 3) 상관계수(r) Sx : 변수 X의 표준편차 Sy : 변수 Y의 표준편차 4) -1 < r < 1 이며 0.6 이상이면 강한 상관관계 (그림 14-1 참조)
상관계수 - 상관계수의 종류 1) 단순상관계수 : X Y 2) 다중상관계수 : X1 X2 Y X3 3) 부분상관계수 : X1 Y X2 X3 통제 Correlation 분석 Regression 분석
상관계수 2. 상관계수의 예 X Y 1 40 84 4 324 36 2 20 120 2,916 -972 3 60 24 484 1,764 -924 50 144 900 -360 5 45 72 49 42 6 30 64 -144 7 25 96 169 390 8 35 48 9 54 10 210 합계 380 660 1,360 8,424 -2,820
상관계수 - 계산식 - 결과의 해석 : r < 0 으므로 역의 상관관계이며 절대값이 0.6 이상 이므로 강한 상관관계
SPSS를 이용한 상관분석 - 데이터 입력(1)
SPSS를 이용한 상관분석 - 데이터 입력(2)
SPSS를 이용한 상관분석 - 분석(Anaysis) → 상관분석(Correlate) → 단순상관(Bivariate)
SPSS를 이용한 상관분석 - 왼쪽에서 분석할 변수를 선택한 후 화살표를 클릭하여 오른쪽으로 이동시킴 선택 후 클릭한다
SPSS를 이용한 상관분석
SPSS를 이용한 상관분석 - 결과화면 상관계수 유의수준 0.01
회귀분석 회귀분석의 의미 1) 회귀분석의 의미 2) 타기법과의 관계 3) 회귀분석의 목적 4) 회귀분석의 기본모형 및 가정
회귀분석 1. 회귀분석의 의미 - 사회현상을 구성하는 여러 변수들간의 상호관계를 이용하여 변화를 예측하므로 모든 통계분석의 기초 - 한 개 또는 그 이상의 독립변수들과 한 개의 종속변수간의 관계를 파악하기 위한 기법 - 변수들은 등간ㆍ비율척도로 측정을 원칙으로 하나 명목척도인 경우 Dummy 변수를 이용하여 분석가능
회귀분석 - 회귀분석적용의 예 사례 독립변수 종속변수 인구통계학적 사회경제적 특성 구매성향 광고액 광고매체유형 매출액 제품가격 기업들은 어떠한 특성을 갖는 소비자들이 자사제품을 구매하는 지를 파악하기 위해 소비자들의 여러 인구통계학적ㆍ사회경제적 특성을 조사하여 이들과 구매성향간의 관계가 어떠한지를 파악 인구통계학적 사회경제적 특성 구매성향 기업의 광고담당자는 광고액에 따른 매출액의 변화와 어떠한 광고매체가 매출액에 더 많은 영향을 미치는가를 정확히 파악해야만 체계적인 광고전략 수립가능 광고액 광고매체유형 매출액 기업의 매출액은 제품가격과 광고의 시간 또는 제품취급 점포의 수 등에 의해 영향을 받게 된다. 이러한 각각의 변수들의 매출액에 어떠한 영향을 미치는지, 또 얼마나 강한 영향을 미치는지를 파악하는 것은 기업전략수입의 기본 제품가격 광고의 시간 점포의 수 판매원관리에 있어 근무년수, 상여금, 교육 등과 같은 업적향상에 영향을 미치는 변수들 중 어떠한 변수가 판매원의 사기와 업적에 가장 큰 영향을 미치는지를 파악할 수 있다면 보다 효율적인 판매원관리 가능 근무년수 상여금 교육 판매원 사기 및 업적
회귀분석 회 귀 분 석 2. 타기법과의 관계 상관관계분석 요인분석 군집분석 판별분석 분산분석 두 변수인 경우 동일한 결과 독립변수가 등간ㆍ비율척도로 같으나 종속변수가 명목척도로 다름 독립변수가 명목척도로 다름 변수들간의 상호관계에 중점
독립변수와 종속변수간의 상관관계인 상호관련성 회귀분석 3. 회귀분석의 목적 독립변수와 종속변수간의 상관관계인 상호관련성 상관관계의 크기와 유의도 독립변수와 종속변수간 관계의 성격
회귀분석 4. 회귀분석의 기본모형 및 가정 - Y : 종속변수 , X : 독립변수 - α : 상수항, β : 회귀계수(변수 X의 Y에 대한 영향력) - εi : 오차항 - 가정 1) 오차항 εi 의 기대값은 ‘0’이다. 즉 E(εi )=0 2) 오차항 εi 는 모든 동일한 분산을 갖는다. 3) 오차항 εi 는 서로 독립적이며 정규분포를 이룬다. Yi = α + βXi + εi
단순회귀분석 단순회귀분석 1) 회귀식의 추정 2) 회귀계수의 검정 3) 회귀계수의 신뢰구간 4) 회귀식을 이용한 예측 5) 결정계수 6) 회귀분석모형의 유의성 검정
단순회귀분석 - 가장 간단한 형태의 회귀분석으로 한 개의 종속변수와 한 개의 독립변수간의 관계를 파악하는 분석기법으로 변수들간의 선형관계식을 얻고자 하는 것 - 선형관계식에서 계수를 구하는 방법으로 실제관측치와 모형에 의한 예측치와의 거리인 잔차(residual)를 극소화하는 것
단순회귀분석 - 잔차의 제곱의 합계를 최소화시키는 최소자승법을 사용
단순회귀분석 1. 회귀식의 추정 (1) (2) (3) (4) (5) (6) (7) (3) ⅹ (2) (3)2 X i Y i 1. 회귀식의 추정 (1) (2) (3) (4) (5) (6) (7) (3) ⅹ (2) (3)2 X i Y i x i x i Y i x i2 45 97 9.6 931.2 92.16 97.29 -0.28 47 95 11.6 1102.0 134.56 99.29 -4.72 40 94 4.6 432.4 21.16 91.12 2.80 36 92 0.6 55.2 0.36 86.33 5.68 35 90 -0.4 -36.0 0.16 85.11 4.89 37 85 1.6 136.0 2.56 87.55 -2.55 32 83 -3.4 -282.2 11.56 81.46 1.45 30 76 -5.4 -410.4 29.16 79.03 -3.02 25 73 -10.4 -759.2 108.16 72.94 -0.061 27 71 -8.4 -596.4 70.56 75.37 -4.38
단순회귀분석 a. b. c. 회귀식 : 매출액 = 42.509 + 1.22 ⅹ 광고시간
단순회귀분석 2. 회귀계수의 검정 a. 각 변수들의 기대값(E)과 분산(Var)을 구한다. b. t분포를 이용하여 각 변수들의 유의도 검정 ‘α’ 에 대한 가설 ( H0 : α = 0, H1 : α ≠ 0 ) ‘β’ 에 대한 가설 ( H0 : β = 0, H1 : β ≠ 0 ) c. 각각의 계수에 대한 표준오차를 구한다. d. 각각의 계수별 검정통계량을 구한다. e. 검정통계량값과 자유도(n-2)인 t분포의 신뢰수준에 따른 임계치를 구하여 비교검증 - 예) α = 6.52, β = 6.75 > t(8, 0.05) = 3.355 (유의함, H0 기각)
단순회귀분석 3. 회귀계수의 신뢰구간 - 모형의 관계식과 같이 실제관측치가 정확히 나타나는 경우는 드물며 회귀선을 중심으로 분포되어 있기 때문에 분포에 대한 신뢰구간이 필요함 - 95%의 신뢰구간 α의 95% 신뢰구간 : β의 95% 신뢰구간 : 예) α = 42.509 2.306(6.522) = 42.509 15.309 β = 1.22 2.306(0.1809) = 1.22 0.4171
단순회귀분석 4. 회귀식을 이용한 예측 - 새로운 값을 추정된 회귀식에 대입하여 추후의 예측이 가능 5. 결정계수(r2) - 전체분산 중에서 추정된 회귀선에 의해 설명되는 부분의 비율을 나타낸 것 - r은 X와 Y의 상관계수 - < 그림 15-4 > 참조
단순회귀분석 6. 회귀분석모형의 유의성 검정 - 추정된 회귀식 전체의 유의성에 대한 F검정을 추가적으로 실시 - 종속변수의 총분산이 모형에서 사용된 독립변수 전체(또는 회귀식 전체)에 의해 충분히 설명되는 지를 검정 - 가설설정 H0 = 독립변수와 종속변수간에 유의적인 관계가 존재하지 않는다 H1 = 독립변수와 종속변수간에 유의적인 관계가 존재한다. - F 검정통계량과 자유도(k-1, n-k)인 F분포의 신뢰구간에 따른 임계치와 비교검증 F =
SPSS를 이용한 단순회귀분석 SPSS를 이용한 단순회귀분석 1) 주어진 사례를 가지고 SPSS를 이용한 단순회귀분석
SPSS를 이용한 단순회귀분석 - 사례) A기업의 매출액에 영향을 주는 주요변수들 매출액(억원) 광고시간(분) 판매원의 수 97 45 130 95 47 128 94 40 135 92 36 119 90 35 124 85 37 120 83 32 117 76 30 112 73 25 115 71 27 108
SPSS를 이용한 단순회귀분석 - 데이터 입력(1)
SPSS를 이용한 단순회귀분석 - 데이터 입력(2)
SPSS를 이용한 단순회귀분석 - 분석(Analysis) → 회귀분석(Regression) → 선형(Linear...)
SPSS를 이용한 단순회귀분석 - 왼쪽에서 분석할 변수를 선택한 후 화살표를 클릭하여 오른쪽으로 이동시킴 선택 후 클릭한다 종속변수 독립변수
SPSS를 이용한 단순회귀분석
SPSS를 이용한 단순회귀분석 - 결과화면 F통계겅정량 결정계수값은 0.85로서 85%의 설명력을 가짐 유의수준 0.00
SPSS를 이용한 단순회귀분석 회귀식 : 매출액 = 42.509 + 1.217 ⅹ 광고시간 - 결과화면 t통계겅정량 유의수준 0.00 회귀식 : 매출액 = 42.509 + 1.217 ⅹ 광고시간