제 7장 연관성분석 화장품과학과 20080141 홍보람
목 차 연관성분석 1.상관분석 1)상관분석의 정의 -상관계수의 종류 2)공분산을 이용한 상관관계 -피어슨 상관계수의 사용 목 차 연관성분석 1.상관분석 1)상관분석의 정의 -상관계수의 종류 2)공분산을 이용한 상관관계 -피어슨 상관계수의 사용 3)서열척도에 의한 상관관계 -스피어만 서열상관계수 -켄달의 타우기법
연관성분석 연관성분석은 2개의 변수가 독립적인가 아니면 이들 간에 어떤 연관성이 있는가를 분석하는 방법이다. 연관성분석은 척도의 변수에 따라서 상관분석과 교차분석으로 구분한다. 상관분석을 통해서 등간이나 비율척도로 측정된 변수의 연관성 정도를 파악한다. 변수가 명목척도나 서열척도로 측정된 변수일 경우에는 교차분석으로 변수 간의 독립성 여부를 파악한다.
1) 상관 분석의 정의 상관 분석이란? 두 변수 간에 상관관계가 존재하는지를 파악하고, 상관관계의 정도를 측정하는 것이다. 이것은 변수간의 선형관계 정도를 분석하는 통계기법이다.
상관계수의 종류 피어슨 상관계수 스피어만 상관계수 크론바흐 알파 계수 신뢰도
피어슨 상관계수 피어슨 상관계수 (Pearson correlation coefficient) 피어슨 상관계수는 두 변수간의 관련성을 구하기 위해 보편적으로 이용된다.
스피어만 상관계수 스피어만 상관계수 (Spearman correlation coefficient) 스피어만 상관계수는 데이터가 서열척도인 경우 즉 자료의 값 대신 순위를 이용하는 경우의 상관계수로서, 데이터를 작은 것부터 차례로 순위를 매겨 서열 순서로 바꾼 뒤 순위를 이용해 상관계수를 구한다. 두 변수 간의 연관 관계가 있는지 없는지를 밝혀주며 자료에 이상점이 있거나 표본크기가 작을 때 유용하다. 스피어만 상관계수는 -1과 1 사이의 값을 가지는데 두 변수안의 순위가 완전히 일치하면 +1이고, 두 변수의 순위가 완전히 반대이면 -1이 된다. 예를 들어 수학 잘하는 학생이 영어를 잘하는 것과 상관있는지 없는지를 알아보는데 쓰여질 수 있다.
크론바흐 알파 계수 신뢰도 크론바흐 알파 계수(Cronbach Alpha) 신뢰도 크론바흐 알파 계수(Cronbach's alpha)의 신뢰도 계수 α는 검사의 내적 일관성을 나타내는 값으로서 한 검사 내에서의 변수들 간의 평균상관관계에 근거해 검사문항들이 동질적인 요소로 구성되어 있는지를 분석하는 것이다. 동일한 개념이라면 서로 다른 독립된 측정 방법으로 측정했을 때 결과가 비슷하게 나타날 것이라는 가정을 바탕으로 한다.예를 들어 설문지 조사의 경우 잘 만들어 같은 내용의 질문을 다른 형태로 반복하여 질문한 다음 같게 대답했는지를 검사하여 신뢰도를 알아 볼 수 있다. 일반적으로는 요인분석을 하여 요인들을 추출하고 이들 요인들이 동질 변수들로 구성되어 있는지를 확인할 때 이용한다. 사전조사나 같은 속성의 질문을 반복하여 신뢰도를 높일 수 있다.
2) 공분산을 이용한 상관관계 두 변수 간의 공통된 분포를 나타내는 분산을 공분산(covariance)라 하며, 이러한 공분산은 관측치들이 평균으로부터 산포되어 있는 정도를 나타내는 값으로 두 변수 간의 선형적 연관성을 나타내는 대표적인 지표가 된다. 공분산이란 기본적으로 하나의 변수의 편차에 다른 변수의 편차를 곱해서 산출하는 결과이다.
피어슨 상관계수의 사용 피어슨 상관계수는 두 변수의 표준화된 편차곱의 평균으로 구한 상관계수를 뜻한다. 측정단위에 따라 변하지 않는 두 변수 간의 선형관계를 파악할 수 있는 표준화된 공분산을 도출할 수 있는데, 이를 상관계수라고 한다. 공분산이 클수록 표준화된 공분산인 상관계수도 커지고, 반대로 공분산이 작을수록 상관계수도 작아진다.
피어슨 상관계수의 사용 상관계수는 -1에서 +1 사이의 값을 가지며,부호에 관계없이 상관계수의 절대값 크기가 변수들 간의 연관성 정도를 판단하는 기준이 된다. 상관계수의 절대값이 클수록 상관관계가 강하다고 해석된다. 일반적으로 사회과학분야에서 설문으로 수집된 자료의 경우에는 상관계수 값이 0.3이상이 되어야만 변수들 간에 상관관계가 존재한다고 평가한다. 등간 혹은 비율척도로 측정된 현상들간의 상관관계분석에는 피어슨이 개발한 Pearson 상관계수가 사용되고 있는데, 일반적으로 상관계수라고 할 때는 피어슨 상관계수를 지칭한다. 즉, 표본의 크기가 30 이상인 경우에는 등간 척도 이상으로 측정된 두 변수가 정규분포를 따르게 되므로 피어슨 상관계수를 구해서 두 변수간의 상관관계를 판단할 수 있게 된다.
3) 서열척도에 의한 상관관계 서열척도로 측정된 변수 간의 상관관계는 스피어만(Spearman)의 서열상관계수나 켄달의 타우(Kendall’s tau)기법으로 산출하는 서열상관계수를 이용하여 분석할 수 있다. 서열척도로 측정된 결과인 순위를 표시하는 수는 가감승제의 의미가 없는 수이다.
스피어만 서열상관계수 스피어만의 서열상관계수는 관심대상이 되는 개별 구성원이나 개체들을 두 개의 서로 다른 특성이나 관점에 대해 평가하여 순위를 매긴 순위변수들간의 선형관계를 나타내는 계수이며, 서열척도로 측정된 두 개의 변수들간의 상관관계를 구하는 방법이다.
켄달의 타우 기법 켄달의 일치계수는 서열변수로 측정된 3개 이상의 변수들, 즉 n개의 변수들 간의 존재하는 상관관계를 파악하는데 사용된다. 그런데 켄달의 일치계수를 계산하는 경우에는 스피어만 서열상관계수의 계산원리와 같이 변수간 서열의 차이를 이용하는 것이 아니라, 변수간의 서열의 합을 이용한다. 켄달의 일치계수는 부(-)의 값을 갖지 않는다. 물론 켄달은 두 개의 서열변수간의 상관관계를 계산해 내는 방법도 개발했는데 이를 켄달의 서열상관계수 혹은 켄달 타우라고한다.
지금까지 들어 주셔서 감사합니다!!~^^