상관계수
공분산 공분산은 두 변수간의 직선관계에 대한 척도이다. 양수는 양의 관계를 의미한다. 음수는 음의 관계를 의미한다. 모집단 표본
상관계수 상관계수는 -1 과 +1 사이의 값을 가진다. 상관계수가 -1이면 강한 음의 상관관계를 나타낸다. 상관계수가 +1이면 강한 양의 상관관계를 나타낸다. 모집단 표본
상관계수 상관계수는 두변수의 직선에 대한에 대한 척도이지 인과관계를 나타내는 척도는 아니다. 두 변수가 매우 높은 상관관계에 있다고 해서 한 변수가 다른 변수 발생의 원인이라는 의미는 아니다.
공분산과 상관계수 어느 한 골퍼가 드라이버 거리와 18홀 점수간의 관계가 있다면 어떤 관계에 있는지에 대해 관심이 있다. (야드) 18홀 평균 점수 277.6 259.5 269.1 267.0 255.6 272.9 69 71 70
공분산과 상관계수 x y 277.6 259.5 269.1 267.0 255.6 272.9 69 71 70 10.65 -7.45 2.15 0.05 -11.35 5.95 -1.0 1.0 -10.65 -7.45 -11.35 -5.95 평균 267.0 70.0 계 -35.40 표준편차 8.2192 .8944
공분산과 상관계수 표본 공분산 표본 상관계수
엑셀을 이용하여 공분산과 상관계수 계산하기 수식 워크시트
엑셀을 이용하여 공분산과 상관계수 계산하기 값 워크시트 표본 공분산 = sxy = n/(n – 1)sxy = 6/(6 – 1)(-5.9) = -7.08
가중평균과 그룹작업 가중평균 그룹자료의 평균 그룹자료의 분산 그룹자료의 표준편차
가중평균 각 자료의 중요성을 반영하는 가중치를 부여하여 평균을 계산하는 경우가 있다. 이러한 평균을 가중평균이라 한다. 대학에서 평점(GPA)을 계산하는데 받은 성적에 학점을 곱해서 구한다. 이 때 학점이 가중치이다. 자료가 매우 중요하다면, 분석자들은 자료의 중요성을 가장 잘 반영하는 가중치를 부여 하여야 한다.
가중평균 여기서, xi = i번쨰 관측치 wi = i번째 관측치에 대한 가중치
그룹 자료 그룹 자료에서 가중치를 이용한 평균 계산법은 평균, 분산, 표준편차의 근사값을 구하는 데 이용된다. 그룹 자료의 평균을 계산하기 위해 각 계급의 대표값으로 각 계급의 중간값을 선택한다. 각 계급의 도수를 가중치로 하여 가중평균을 계산한다. 비슷한 방법으로 분산, 표준편차를 계산할 때에도 도수를 가중치로 하여 계산할 수 있다.
그룹자료에 대한 평균 표본 자료 모집단 여기서, fi = 계급 i의 도수 Mi = 계급 i의 중앙값
그룹자료에 대한 평균 70개의 아파트 임대자료가 아래와 같이 주어져 있다면, 여기서, 자료는 각 계급에 대한 도수 형태인 그룹자료로 주어져 있다.
그룹자료에 대한 평균 이러한 그룹평균은 실제 표본평균인 $490.80 과 $2.41 차이가 나는 근사값임을 알 수 있다.
그룹자료에 대한 분산 표본자료에 대해 모집단에 대해
그룹자료에 대한 표본분산
그룹자료에 대한 표본분산 표본분산 s2 = 208,234.29/(70 – 1) = 3,017.89 표본 표준편차 이러한 근사값은 실제 표본 표준편차 $54.74와 오직 $0.2 차이가 난다.