상관분석 (p.158-162, p.196-199)
강의 준비 확인 R과 R commander 시작 작업 디렉토리 바꾸기 메뉴를 이용하여 본인 의 데이터가 있는 폴더 지정 데이터 셋(psych.RData)탑재
자료에 따른 통계분석 방법 알고 싶은 내용 모수적 방법 (정규성) 비모수적 방법 (정규성아님) 두 변수간의 상관관계 Pearson’s correlation Spearman’s correlation Kendall’s tau
모수적 Vs. 비모수적 방법 모수적 방법 비모수적 방법 표본 수가 30 이상일 경우 평균을 중심으로 좌우 대칭 분포 (정규분포) 예: 키, 몸무게, 성적 비모수적 방법 표본 수가 30 미만일 경우 한쪽으로 치우친 분포 (예: 혈중 납농도)
강의 진행 상관분석이란? 산점도 그리기 상관분석 모수적 방법: Pearson’s correlation test 비모수적 방법: Spearman’s correlation test, Kendall’s tau
1. 상관분석이란?
상관관계, 상관분석 변수들간 관련성(관계)을 알아보고자 할 때 사용 연속형 변수간의 관련성: 모수적 방법 (Pearson’s correlation) 순위척도간 관련성: 비모수적 방법 (Spearman’s correlation) 독립변수(x)와 종속변수(y)가 바뀌어도 무방한 경 우 사용 변수간의 선형적인 연관성을 보여주는 통계기법 연관성을 측정하는데 이용되는 측도: 상관계수(correlation coefficient)라고 함
상관분석을 실시하기 전… 산점도 (scatter plot)를 그려보기 ->선형 적인 패턴이 나오지 않을 수 있으므로 정규성 검정 해보기 정규성 만족: 정규성 만족 못할 경우: Pearson’s correlation analysis Spearman’s correlation analysis
Plot을 보고 상관관계가 있는지 없는지, 양의 상관관계인지 음의 상관관계인지 먼저 파악 -1 ≤상관계수 (r) ≤ 1 상관관계 (상관성)가 높다는 것은 절대값의 크기임. 양수가 음수보다 크다고 할 수 없음
상관계수 값: 관계의 정도
불안 표준화점수(T_ANX), 우울 표준화점수(T_DEP), 강박 표준화점수(T_OBS), 신체화증상 표준화점수(T_SOMATI)간 상관계수 알아보기
모수적 방법: Pearson’s correlation test (p.160-162)
불안 표준화점수(T_ANX)와 우울 표준화점수(T_DEP) 간에는 관련성이 있을까?
2. 산점도 그리기 (음의 상관과 양의 상관을 알아보기 위해)
Plot을 보고 무엇을 알 수 있나요?
p-value가 유의수준 0.05보다 작으므로 귀무가설을 기각할 수 있다. (p<0.0001) 즉, 유의수준 0.05하에서 불안 표준화점수와 우울 표준화점수는 서로 양의 상관관계가 있다고 할 수 있다. (r=0.91)
3.2 비모수적 방법: Spearman rank correlation test (p.196-199)
수입(sel)과 학력(sch)간 상관관계가 있을까? 아니나 순위척도이다. 따라서 모수적 방법(Pearson’s correlation test)은 쓸 수 없고 비모수적 방법인 Spearman’s rank correlation test를 이용하여 분석하였다.
p-value가 유의수준 0.05보다 작으므로 귀무가설을 기각할 수 있다. (p<0.0001) 즉, 유의수준 0.05하에서 수입과 학력은 서로 양의 상관관계가 있다고 할 수 있다. (r=0.57)
과 제 데이터 health.Rdata에서 나이와 현재 몸무게는 상관관계가 있는가? 가설(귀무,대립)을 세우고 산점도 그리기 결과 해석 하기 (해석 마지막에 상관계수와 p-value를 적습니다.) -한글 또는 엑셀파일 제출하시면 됩니다.
감사합니다.