상관관계 양윤권
상관관계 목 적 상관관계는 서열 척도, 등간 척도, 비율 척도로 측정된 변수들간의 관련성 정도를 알아보기 위한 것 하나의 변수가 다른 변수와의 어느 정도 밀접한 관련성을 갖고 변화하는 가를 알아보기 위해 사용 두 변수간의 관련성을 구할 경우 단순상관관계를 실시하며, 부분 또는 편 상관관계는 어떤 변수를 통제한 상태에서 두 변수의 상관관계를 구하는 것 중다 상관관계는 두 개 이상의 독립변수에 가중치를 부여하여 상관관계를 구하는 것 목 적
1. 상관관계(Correlation)의 기본개념 (1) 상관관계의 뜻 변수와 변수간의 관계로 둘 또는 그 이상의 변수들에 있어서 한 변수가 커지거나 작아질 때, 다른 변수가 어떻게 변하는지를 그 변동의 정도와 방향을 예측하여 알려주는 분석방법임. 상관관계는 한 변수의 분산(변량)중에서 다른 변수와 같이 변화하는 분산, 즉 공분산이 어느 정도 되는가에 따라 결정된다고 볼 수 있음. 변화하는 공분산이 클수록 직선에 가깝고, 상관관계는 높아진다
(2) 상관계수의 성격 변수간의 관계의 정도나 방향을 하나의 수치로 요약해 표시해 주는 지수임 상관관계 정도는 수치의 0에서 ±1사이의 절대값으로 나타냄 상관계수는 -1에서 0, 0에서 1사이의 값을 취함. 이때 0에 가까울 수록 상관관계는 낮아지며, 1에 가까울 수록 상관관계는 높아짐 변수 관계의 방향은 +,-로 표현함. 관계의 방향에 따라 한쪽이 증가할 때 다른 쪽도 증가하게 되는 관계, 즉 증감의 방향이 같은 경우 +(양, 정적인)의 상관관계가 있는 것이며, 즉 증감의 방향이 반대인 경우-의(음, 부적인) 상관관계가 있는 것으로 볼 수 있음.
상관계수 값에 의한 결정은 대체로 아래와 같다. 상관관계 계수 상관관계 정도 ± 0.9이상 ± 0.7~0.9미만 ± 0.4~0.7미만 상관관계가 아주 높다 상관관계가 높다 상관관계가 다소 높다 ± 0.2~0.4미만 ± 0.2미만 상관관계가 있으나 낮다 상관관계가 거의 없다
그림12-1 완벽한 상관관계
그림 12-2 상관관계의 형태
(3) 상관관계의 성격 관계의 정도(상관계수)는 어디까지나 상관관계는 인과관계가 특별 한 경우를 제외하면 상관관계는 아닐 수 있음을 주의 독립변수(X)와 종속변수(Y)의 관계 일 수도 있고 아닐 수도 있음 특별 한 경우를 제외하면 상관관계는 대체로 음의 방향인지 양의 방향인지 관계의 방향이 포함 관계의 정도(상관계수)는 어디까지나 확률적 표현. 상관관계 계수는 두 변수 관계의 상관성에 대한 예측의 정확도를 나타낸 것 측정치가 아닌 하나의 지수이기 때문에 변수간의 관계의 비율이나 백분율과는 다름 상관관계 계수끼리의 가감승제가 불가능 상관관계의 결정계수(R2-설명력)는 상관관계 계수를 제곱하여 나오는 값
(4) 상관계수 해석할 때 주의할 점 상관계수는 모집단의 이론적 관계 뿐 아니라 각 변수의 분산의 크기까지 반영 상관계수의 크기보다는 부호의 방향성을 고려, 또한, 변수간의 관계가 부적인 관계인지에 따라 의미하는 내용을 해석한 다음 관계의 정도를 해석 두 변수의 상관계수 r은 한 변수의 크기에 따라 증가하거나 감소하기도 함 다른 조건이 같을 경우 한 변수의 분산이 클수록 상관계수의 값은 커짐 상관계수의 크기는 측정문항의 응답 척도의 개수가 많을수록 상대적으로 커지고 적을수록 상대적으로 작아짐
(5) 변수에 따른 상관관계 분석 종속변수 독립변수 비연속적 명목변수 연속적 명목변수 서열변수 등간 * 비율 변수 서열 변수 Phi 계수, 유관계수, Lambda Yule’sQ 사분 상관관계 서열 변수 등위 양분 상관관계 Spearrman’s rho Kendall’s tau&w 기타 순위상관관계 Cramer’s V 양류 상관관계 양분 상관관계 다류 상관관계 Pearson(적률)
등간·비율변수의 상관관계 (5) 변수에 따른 상관관계 분석 피어슨(Pearson)의 상관관계(적률 상관관계, r로 표현)는 두 변수가 등간 또는 비율 척도로 측정된 변수인 경우에 가장 많이 사용하는 상관관계 분석 방법임 피어슨의 상관관계의 경우 두 변수간 직선적 관계가 있어야 함 각 행과 열의 분산도(변산도)가 비슷해야 함 적어도 한 변수가 정상분포를 이루고 있어야 함 단, 적은 사례의 경우 신뢰할 수 없는 단점이 있음
의미가 서열적인 경우 Pearson의 r대신 (5) 변수에 따른 상관관계 분석 스피어만의 순위 상관관계는 독립, 종속변수가 서열 변수인 경우 단순 상관관계를 산출함 주어진 자료의 등간성이 의문시 되거나, 변수들 점수가 극단적 분포를 나타내거나, 척도나 점수의 의미가 서열적인 경우 Pearson의 r대신 사용하는 것이 유리함 스피어만의 R계수도 있는데, 이는 순위 상관관계도 사례수가 많거나 두 변수간의 순위의 차이가 커서 계산이 길 때 사용하면 편리하나 정확도가 떨어짐 캔달의 타우b는 독립변수와 종속변수가 서열변수인 경우에 사용함 서열 변수의 상관관계
(5) 변수에 따른 상관관계 분석 회귀분석과 상관관계 회귀분석의 경우 인과관계성이 조건이 되어야 함 또한 등간성, 정규분포성, 선형성 등의 조건이 필요하며 잔차 등 검정 해야하는 복잡한 과정이 필요. 상관관계에서는 다소 자유롭다 서열변수인 경우에도 상관관계를 구할 수 있음 상관관계는 두 변수의 관계를 예측할 수 있는 정도일 뿐 회귀분석처럼 변수간의 관계를 정확한 예측치, 즉 회귀방정식으로 제시할 수는 없음
단순상관관계는 두 변수간의 관계를 알고자 할 때 사용 3. 단순상관관계 탑메뉴 분석 상관관계 이변량 상관계수(B) 단순상관관계는 두 변수간의 관계를 알고자 할 때 사용 (1) 단순상관관계의 경로
(2) 두 변수간의 상관관계 변수 중에서 체중과 배근력의 상관관계가 있는지 분석하고자 함 상관관계를 구할 변수는 오른 쪽으로 이동한 후 OK를 선택 변수가 등간척도 이상인 경우 그대로 OK를 선택하면 됨 옵션을 선택하면 평균과 표준편차를 구할 수 있으며, 여러 개의 변수를 동시에 이동시켜도 됨
좌측의 변수와 우측의 변수가 만나는 셀을 보면 된다!!! 단순상관관계 결과의 해설 (3)단순상관관계 결과 해설 피어슨의 적률 상관관계를 살펴보면 결과는 좌측의 변수와 우측의 변수가 만나는 셀을 보면 된다!!! 피어슨의 적률 상관관계 계수를 나타냄 Pearson 상관계수 상관관계의 유의성을 나타냄 유의확률(양쪽) 분석에 사용된 사례수를 나타냄 N 배근력과 배근력은 동일한 변수이기 때문에 상관관계 계수가 1로 나타남. 배근력과 체중과의 상관계스는 0.828**로 체중이 높을수록 배근력이 높게 나타난 정적 상관관계로 높은 상관관계가 나타났다. 그리고 유의성 sig(p)는 0.000으로 0.01보다 작기 때문에 적률 상관관계에서 별 두개(**)로 표시된다. ⊙ 결론적으로 측정자의 체중이 높을수록 배근력은 높은 경향을 나타내며 체중이 배근력 요인에 영향을 준다고 볼 수 있음
탑메뉴 분석 상관관계 이변량상관계수(B) (2) 서열변수 또는 등간성이 의심되는 변수의 상관관계 4. 서열변수의 상관관계 (1)서열변수의 상관관계 경로 (2) 서열변수 또는 등간성이 의심되는 변수의 상관관계 탑메뉴 분석 상관관계 이변량상관계수(B) 상관계수 선택 서열변수이거나 등간성이 의심되는 변수들의 상관관계를 구하는 방법과 해설은 위와 동일함. 하지만 단순상관관계 명령어 창으로 이동한 후 상관계수에서 Kendall’s Tau-b 또는 Spearman 을 선택하여야 함
스피어만의 서열 상관관계는 피어슨의 적률 상관관계와 비교해보면 거의 차이가 없다
스피어만의 서열상관관계를 살펴보면 결과는 좌측의 변수와 상단의 변수가 만나는 셀을 보면 된다 서열변수의 상관관계 해설 스피어만의 서열상관관계를 살펴보면 결과는 좌측의 변수와 상단의 변수가 만나는 셀을 보면 된다 연령과 학력의 경우 상관관계 계수가 0.541**으로 연령이 증가할수록 학력이 높아지고, 연령이 낮을수록 학력이 낮아지는 경향이 다소 높지만 유의함을 알 수 있다. 학력과 만족도 분석해보면 상관관계 계수가 0.484**으로 학력이 증가할수록 만족도가 높아지고, 학력이 낮을수록 만족도 낮아지는 경향이 다소 높지만 유의함을 알 수 있다 학력과 참여의식, 연령과 참여의식 , 만족도와 참여의식 모두 상관관계 계수가 상당히 낮게 나타나 두 변수간의 상관관계는 거의 없는 것으로 나타났다. ⊙ 상관관계의 유의도는 사례수와 밀접한 관련이 있다. 사례 수가 많을 수록 유의도가 높아지지만, 상관관계 자체가 높아지는 것은 아니다
5. 부분 상관관계 (1) 부분 상관관계 경로 탑메뉴 분석 상관관계 편 상관계수 (부분 상관관계, R)
Partial Correlation)는 제3의 부분상관관계(편 상관관계, Partial Correlation)는 제3의 변수를 통제하였을 때, 두 변수가 가지는 상관관계를 구하는 것으로 이 제3의 변수를 통제변수라고 함. 통제란 제3의 변수의 영향을 제거시킴으로써 두 변수에 미치는 영향을 고정시켜 보다 정확한 상관관계를 구할 수 있게 함 부분 상관관계를 구할 경우 통제변수에 연령을 이동하고, 변수에 체중과 배근력을 이동시키면 된다. 옵션(o)을 선택하여 평균과 표준편차(M) 또는 0차 상관(Z)표시하면 된다.
부분상관관계의 경우 통계결과가 자동으로 표로 만들어지지 않는다. 해석하는 방법은 적률 상관관계와 동일하다. 다만 결과 상단에 통제되는 변수를 나타내는 안내가 나타난다.
부분상관관계의 해설 ⊙체중과 배근력 사이의 상관관계는 유의미한 수준(P= .001)이고 0.682로 정적인 상관관계를 나타내고 다소 높은 상관관계를 나타냄. 즉, 체중이 증감에 따라 배근력이 증감이 매우 높다는 것을 의미 체중과 배근력 사이의 단순상관관계 결과(r=0.828)와 비교해보면 약간 다르다는 것을 알 수 있음. 연령이 체중과 배근력에 미치는 영향이 있다는 것을 알 수 있으며, 연령이 미치는 영향을 제외시킴으로써 체중과 배근력의 상관관계가 다소 낮아지는 것을 알 수 있음
질문하세요~ 수고하셨습니다~