Presentation is loading. Please wait.

Presentation is loading. Please wait.

Keller: Stats for Mgmt & Econ, 7th Ed

Similar presentations


Presentation on theme: "Keller: Stats for Mgmt & Econ, 7th Ed"— Presentation transcript:

1 Keller: Stats for Mgmt & Econ, 7th Ed
August 9, 2018 켈러의 경영경제통계학 제3장 수치를 이용한 기술통계학 기법 Numerical Descriptive Techniques Copyright © 2006 Brooks/Cole, a division of Thomson Learning, Inc.

2 수치를 이용한 기술통계학 기법… 3.1 중심위치의 척도 - 평균(Mean), 중앙값(Median), 최빈값(Mode) 3.2 변동성의 척도 -범위(Range), 표준편차(Standard Deviation), 분산(Variance), 변동계수(Coefficient of Variation) 3.3 상대위치의 척도 -백분위수(Percentiles), (사분위수)Quartiles 3.4 선형관계의 척도 -공분산(Covariance), 상관계수(Correlation Coefficient), 결정계수 (Coefficient of Determination), 최소자승선(Least Squares Line)

3 대표값: 자료의 중심을 나타내는 중심화 경향치 산포값: 자료의 흩어진 정도를 나타내는 특성치
통계에서 사용되는 특성치 대표값: 자료의 중심을 나타내는 중심화 경향치 최빈치 중앙치 산술평균 산포값: 자료의 흩어진 정도를 나타내는 특성치 사분편차 범위 분산

4 중심위치의 측도 (measure of central tendency)
평균(산술평균) 모평균(population mean) 표본평균(sample mean)

5 중심위치의 측도 (measure of central tendency)
중앙값 (median) 자료를 크기 순으로 나열할 때 가운데 놓이는 값 [자료의 수 n] 홀수 (n+1)/2 (5+1)/2=3번째 자료값 9 짝수 n/2, n/2+1번째 자료값의 평균 6/2=3, 6/2+1=4  (9+10)/2=9.5 장점: 이상점이 존재할 때 평균보다 의미있는 중심위치의 측도 이상점에 민감하지 않음 단점: 표본의 중앙값으로 모집단의 중앙값을 추측하고자 할 때 추측의 정확성을 측정하기 어려움 일반적으로 평균을 사용

6 . 표본중앙값(Sample Median)과 모중앙값(Population Median)은 동일한 방법으로 계산된다
데이터를 작은 값으로부터 큰 값으로 정렬하고 중심에 있는 값을 선택한다. 데이터: {0, 7, 12, 5, 14, 8, 0, 9, 22, 33}N=10(짝수) 데이터를 작은 값으로부터 큰 값으로 정렬하고 중심에 있는 8과 9의 산술평균 값을 선택한다. 중앙값(median) = (8+9)÷2 = 8.5 . 표본중앙값(Sample Median)과 모중앙값(Population Median)은 동일한 방법으로 계산된다

7 중심위치의 척도 모든 관측치의 합 평균 = 관측치의 수
-산술평균(arithmetic mean ) 또는 평균(mean) 은 가 장 널리 사용되는 유용한 중심위치의 척도이다. -산술평균은 모든 관측치들을 합하고 관측치의 수로 나누어서 계산된다. 모든 관측치의 합 관측치의 수 평균 =

8 기호 N = 모집단에 속한 관측치의 수 n = 표본에 속한 관측치의 수 = 모평균(모집단의 산술평균) “mu” = 표본평균(표본의 산술평균) “x-bar”

9 산술평균(Arithmetic Mean)
모평균(population mean) 표본평균(Sample Mean)

10 산술평균 -산술평균은 측정데이터 (예: 키, 점수, 등)의 중심위치 를 나타내는데 적정한 척도이다. -산술평균은 “이상치(outliers)”라고 부르는 극단값들 에 의해 크게 영향을 받는다. 예: 억만장자가 이웃으로 이사오면 평균가계소득이 크게 증가한다…

11 표본최빈값(Sample Mode)과 모최빈값(Population Mode)은 동일한 방법으로 계산된다.
-관측치들의 최빈값(mode )은 발생되는 빈도수가 가장 많은 관측치이다. -한 세트의 데이터에는 최빈값이 하나 또는 둘 이상이 존재할 수 있다. -최빈값은 주로 명목데이터의 경우에 사용되지만 모든 데이터 유형에 대하여 유용한 중심위치의 척도이다. -대규모 데이터 세트의 경우 최빈계급구간( modal class)가 단일 값을 가지는 최빈값보다 더 유용하다. 표본최빈값(Sample Mode)과 모최빈값(Population Mode)은 동일한 방법으로 계산된다.

12 최빈값 예: 데이터: {0, 7, 12, 5, 14, 8, 0, 9, 22, 33} N=10 -어느 관측치가 가장 많이 나타나는가? -이 데이터 세트의 최빈값은 0 이다. -이와 같은 최빈값은 어떻게 중심위치의 척도가 되는가? 최빈계급구간 Frequency Variable

13 유의사항 -만일 당신이 Excel을 사용하면서 데이터 분석을 하고 데이터 세트에 1개 이상의 최빈값들이 존재하는 경우, Excel은 가장 작은 최빈값만을 계산한다. -따라서 데이터 세트가 두 개의 봉우리, 또는 3개의 봉 우리 등을 가지는지를 알기 위해서는 히스토그램과 같 은 기법을 사용해야 한다.

14 평균(Mean),중앙값(Median),최빈값(Mode)
-만일 변수의 분포가 대칭이면, 평균, 중앙값, 최빈값은 모두 동일할 수 있다… median mode mean

15 평균(Mean),중앙값(Median),최빈값(Mode)
-만일 변수의 분포가 비대칭이면, 즉 왼쪽으로 기울져 있거나 또는 오른쪽으로 기울어져 있으면, 평균, 중앙값, 최빈값은 서로 다를 수 있다. median mode mean

16 분포의 모양에 따라 평균, 중앙치, 최빈치의 위치가 다르다
분포의 모양과 중심화경향치의 관계 분포의 모양에 따라 평균, 중앙치, 최빈치의 위치가 다르다

17 분포의 모양과 중심화경향치의 관계

18 분포의 모양과 중심화경향치의 관계

19 분포의 모양과 중심화경향치의 관계

20 평균, 중앙값, 최빈값 중에서 어느 것이 가장 좋은 중심위치의 척도인가?
평균, 중앙값, 최빈값 중에서 어느 것이 가장 좋은 중심위치의 척도인가? -평균은 일반적으로 가장 널리 사용되는 유용한 중심위 치의 척도이다. 그러나 중앙값이 더 좋은 중심위치의 척 도인 상황들이 존재한다. -최빈값은 결코 가장 좋은 중심위치의 척도는 아닌다. -중앙값이 가지고 있는 한가지 장점은 평균과는 달리 극단값들에 대하여 민감하지 않다는 점이다.

21 평균, 중앙값, 최빈값 중에서 어느 것이 가장 좋은 중심위치의 척도인가?
평균, 중앙값, 최빈값 중에서 어느 것이 가장 좋은 중심위치의 척도인가? -예제 3.1 인터넷의 평균사용시간을 살펴보자. -평균은 11.0이고 중앙값은 8.5이다. -이제 33시간을 보고한 응답자가 실제로 133시간을 보 고하였다고 하자. 이 경우 평균은

22 평균, 중앙값, 최빈값 중에서 어느 것이 가장 좋은 중심위치의 척도인가?
평균, 중앙값, 최빈값 중에서 어느 것이 가장 좋은 중심위치의 척도인가? -표본에는 평균(21)보다 큰 관측치들은 두개 존재한다. 이와 같이 극단값의 존재는 평균이 중심위치의 척도가 되지 못하게 만든다. -그러나 중앙값은 극단값에 관계없이 동일하다. 상대적 으로 적은 수의 극단값들이 존재할 때 중앙값은 일반적 으로 데이터의 중심을 나타내는 더 양호한 척도가 된다.

23 서열데이터와 범주데이터의 평균,중앙값,최빈값
-서열데이터와 범주데이터의 경우 평균의 계산은 의미 가 없다. -서열데이터의 경우 중앙값은 중심위치의 척도가 된다. -범주데이터의 경우 최빈값은 유용한 빈도 척도이나 “중심위치”의 척도는 아니다.

24 3.2 변동성의 척도 -관측치들이 평균 주위에서 얼마나 흩어져 있는가를 측 정하는 척도가 변동성의 척도이다.
예를 들면, 두 과목의 점수들이 주어져 있다고 하자. 평균은 두 과목 모두 50으로 같다… 그러나 붉은색으로 나타낸 과목의 점수가 파란색으로 나타낸 과목의 점수보다 변동성이 더 크다 (평균 주위에서 더 많이 흩어져 있다).

25 범위(Range) -범위(range )는 가장 간단한 변동성의 척도로서 다음 과 같이 계산된다: 범위(Range) = 최대 관측치 – 최소 관측치 예: 데이터: {4, 4, 4, 4, 50} Range = 46 데이터: {4, 8, 15, 24, 39, 50} Range = 46 -두 경우 범위는 같으나 두 데이터 세트는 서로 다른 분 포를 가진다.

26 범위(Range) - 범위(range)가 가지는 주요 장점은 쉽게 계산될 수 있 다는 점이다. -범위(range)가 가지는 주요 단점은 양쪽 끝에 있는 관 측치 사이에 존재하는 관측치들이 흩어져 있는 정도에 관한 정보를 제공하지 못한다는 점이다. -따라서 모든 관측치들을 포함하는 변동성의 척도가 필 요하다.

27 편차와 분산 모집단 분산 표본 분산 - 관찰치와 평균의 차이
  편차(deviation)         - 관찰치와 평균의 차이       예) 갑순이 점수가 80점이고 반평균점수가 75점이면 갑순이 점수의 편차 = 80­75 = +5점 분산(Variance)         - 편차 제곱합(변동)을 평균 분산을 계산할 때 편차를 제곱하는 이유는 단순히 편차의 합계를 할 경우 항상 0이 되므로 이를 피하기 위한 것이다. 모집단 분산 표본 분산

28 분산(Variance) -분산(variance)과 표준편차(standard deviation)는 가 장 중요한 변동성의 척도이며 거의 모든 통계적 추론에 서 중요한 역할을 수행한다. 기호: = 모분산(population variance) “sigma” squared = 표본분산(sampel variance) “s” squared

29 모집단 크기(population size) 주:/표본분산의 분포는 표본크기 (n) – 1 이다 !
분산(Variance) 모분산: 표본분산: 모평균(population mean) 모집단 크기(population size) 표본평균(sample mean) 주:/표본분산의 분포는 표본크기 (n) – 1 이다 !

30 분산(Variance) -표본분산을 계산하기 위해서는 먼저 표본평균을 계산 해야 한다. -표본평균을 계산하는 중간단계없이 데이터로부터 표 본분산을 계산하는 간편공식은 다음과 같다:

31 표본분산의 계산 -예제 3.7 (여름방학 아르바이트). 6명의 학생이 지원한 아르바이트의 수로 구성된 표본은 다음과 같다: 17, 15, 23, 7, 9, 13. -표본평균과 표본분산을 구하라.

32 Sample Variance (간편공식)
표본평균과 표본분산(예제3.7) Sample Mean Sample Variance Sample Variance (간편공식)

33 표준편차(Standard Deviation)
-표준편차는 분산의 제곱근이다. 모표준편차(Population standard deviation): 표본표준편차(Sample standard deviation):

34 표준편차(Standard Deviation)
-예제 3.8 [Xm04-08] 두종류 골프클럽의 일관성 비교 골프채 제조업자는 새로 개발된 골프 클럽이 기존의 골프 클 럽보다 더 일관성을 가지는지(비거리의 변동성이 적은지)를 결정하기 원한다. (Excel을 사용하면서 다음과 같은 결과가 구해졌다)…결과의 해석은? 새로운 골프 클럽의 비거리가 더 일관성을 가진다.

35 표준편차(Standard Deviation)의 해석
-히스토그램이 종모양(bell shaped)이면 다음과 같은 경험법칙( Empirical Rule)이 적용될 수 있다. 모든 관측치의 약 68%는 평균으로부터 1 표준편차 이내 에 속한다. 모든 관측치의 약95%는 평균으로부터 2 표준편차 이내 에 속한다. 모든 관측치의 약 99.7%는 평균으로부터 3 표준편차 이 내에 속한다.

36 경험법칙(Empirical Rule) 데이터의 히스토그램(분포)이 종모양이면 (1)모든 관측치의 약 68%는 평균으로부터 1 표준편차이내에 속한다.. (2) 모든 관측치의 약 95%는 평균으로부터 2 표준편차이내에 속한다. (3) 모든 관측치의 약 99.7%는 평균으로부터 3 표준편차 이내에 속한다.

37 체비세프의정리(Chebysheffs Theorem)
-표준편차에 대한 보다 일반적인 해석은 종모양을 포함 하여 모든 형태의 히스토그램(분포)에 적용되는 체비세 프의 정리(Chebysheff’s Theorem)로 부터 이루어진다. -체비세프의 정리: 평균으로부터 k 표준편차(k>1) 이내 에 속하는 관측치들의 비율은 적어도 다음과 같다. k=2 인 경우, 체비세프의 정리에 의하면 모든 관측치의 적어도 ¾는 평균으로부터 2 표준편차이내에 속한다. 이것은 경험법칙의 근사 (95%)의 “하한”이다.

38 표준편차(Standard Deviation)의 해석
-작년 경영경제통계학 중간시험 점수의 평균과 표준편 차가 각각 70점과 5점이라고 하자. 만일 점수의 히스토 그램이 종모양이면, 점수들의 약 68%는 65점과 75점 사이에 속하고, 점수들의 약 95%는 60점과 80점 사이 에 속하며 점수들의 약 99.7%는 55점과 85점 사이에 속한다. -점수의 히스토그램이 종모양이 아니면, 점수들의 적어 도 75%는 60점과 80점 사이에 속하고 점수들의 적어도 88.9%는 55점과 85점 사이에 속한다.

39 변동계수(Coefficient of Variation)
-변동계수(coefficient of variation )는 표준편차를 평 균으로 나눈 척도이다. 모변동계수(Population coefficient of variation) = CV = 표본변동계수(Sample coefficient of variation) = cv =

40 3.3. 상대위치의 척도와 박스그림 -상대위치의 척도는 전체 데이터 세트와 비교한 특정한 수치의 상대위치에 관한 정보를 제공한다. -백분위수(Percentile): P번째 백분위수(Pth Percentile) 은 이 값보다 적은 값들이 관측치들의 P%이고 이 값보 다 큰 값들이 관측치들의 (100-P)%인 값이다. 예: 당신의 점수가 GMAT에서 60 퍼센타일이라는 것은 당 신의 점수보다 낮은 점수들이 60%이고 당신의 점수보다 높 은 점수들이 40%라는 것을 의미한다.

41 사분위수(quartiles) -25번째, 50번째, 75번째 퍼센타일을 사분위수 (quartiles)라고 부른다. -첫번째 사분위수 또는 하위 사분위수는 Q1 = 25th percentile , 두번째 사분위수는 Q2 = 50th percentile (두번째 사분위수는 중앙값이다), 세번째 사분위수 또는 상위 사분위수는 Q3 = 75th percentile로 나타낸다. -백분위수는 오분위수(quintiles)와 십분위수 (deciles) 로 전환될 수 있다.

42 일반적으로 사용되는 백분위수 첫번째 (하위) 십분위수 = 10th percentile 첫번째 (하위) 사분위수 Q1= 25th percentile 두번째 (중간) 사분위수 Q2= 50th percentile 세번째 (상위) 사분위수 Q3= 75th percentile 아홉번째 (상위)십분위수 = 90th percentile 주: 만일 당신의 점수가 80 퍼센타일이면, 이것은 시험 에서 80%의 점수을 얻었다는 것을 의미하지 않는 것이 다. 이것은 다른 학생들의 80%가 당신보다 낮은 점수를 얻었다는 것을 의미한다.

43 퍼센타일의 위치

44 퍼센타일의 위치 상위 사분위수는 얼마인가? L75 = (10+1)(75/100) = 8.25 -상위 사분위수는 8번째 관측치(14)와 9번째 관측치(22) 간 거리의 ¼에 위치한다. 8번째 관측치와 9번째 관측치 간 거리의 ¼은 (0.25)(22- 14) = 2이다. 따라서 상위 사분위수는 = 16 이다.

45 퍼센타일의 위치 position 2.75 16 0 0 | | 22 33 position 8.25 3.75 Lp 는 퍼센타일 값이 존재하는 데이터 세트상의 위치를 결정한다.

46 사분위수간 범위(interquartile Range)
-사분위수는 변동성의 척도인 사분위수간 범위 (interquartile range )를 구하기 위해 사용될 수 있다. 사분위수간 범위(Interquartile Range) = Q3 – Q1 -사분위수간 범위는 관측치들의 중간 50%가 흩어져 있는 정도를 측정한다. -사분위수간 범위가 큰 값을 가진다는 것은 첫번째 사분위 수와 세번째 사분위수가 멀리 떨어져 있다는 것, 즉 변동성 이 크다는 것을 의미한다.

47 박스그림(Box Plots) -박스그림(box plot )은 5가지의 통계량을 그래프에 나 타내는 기법이다. • 최소값 최대값 • 첫 번째 사분위수, 두 번째 사분위수, 세 번째 사분위수 수염(Whisker) 수염Whisker (1.5*(Q3–Q1)) 박스의 왼쪽과 오른쪽에 그려져 있는 선은 수염(whisker)라고 부른다. 이와 같은 수염 밖에 존재하는 관측치는 이상치라고 부른다. 수염은 사분위수간 범위의 1.5배 또는 이상치가 아닌 가장 극단치 중에서 적은 점까지 그려진다.

48 3.4 선형관계의 척도 Measures of Linear Relationship
-두 변수 간 선형관계의 강도와 방향에 관한 정보를 제 공하는 3개의 수치적 척도, 즉 공분산(covariance), 상관계수(coefficient of correlation) 결정계수(coefficient of determination ) 에 대하여 논의하자.

49 공분산(Covariance) 변수 X의 모평균 변수 Y의 모평균 변수 X의 표본평균 변수 Y의 표본평균
분모는 n이 아니라 n-1이다

50 공분산(Covariance) -표본평균을 계산하지 않고 표본공분산을 계산하기 위한 간편공식은 다음과 같다.

51 공분산(Covariance)의 계산 3개 데이터 세트의 표본공분산계산…
-각 데이터 세트에서 X의 값들은 같고 Y의 값들은 같으나 순서가 다르다. set #1에서 X가 증가함에 따라 Y도 증가한다; Sxy 는 크고 양이다. set #2에서 X가 증가함에 따라 Y는 감소한다; Sxy 는 크고 음이다. set #3에서 X가 증가함에 따라 Y는 특정한 방식으로 변화하지 않는다; Sxy 는 “작다”.

52 공분산(Covariance) 두 변수가 동일한 방향으로 움직일 때 (두 변수 모두 증가하 거나 또는 감소할 때), 공분산은 크고 양의 값을 가진다. -두 변수가 반대방향으로 움직일 때, 공분산은 크고 음의 값 을 가진다. -두 변수의 움직임에 특정한 패턴이 존재하지 않을 때, 공분 산의 값은 작다. -그러나 특정한 공분산 값이 크거나 또는 작은지를 결정하 는 일이 어렵다. ->공분산은 선형의 강도에 대하여 정보를 제공하지 못한다.

53 상관계수(Coefficient of Correlation)
-상관계수는 공분산을 변수들의 표준편차 곱으로 나눈 것으로 정의된다: Greek letter “rho” 상관계수는 X와 Y간의 선형관계가 얼마나 강한가에 대한 정보를 제공한다.

54 상관계수(Coefficient of Correlation)
-상관계수는 -1과 +1 사이의 값을 가진다. 두 변수가 매우 강한 양의 선형관계를 가지면, 상관계수는 +1에 가까운 값을 가진다.(강한 양의 선형관계) 두 변수가 매우 강한 음의 선형관계를 가지면, 상관계수는 1에 가까운 값을 가진다. (강한 음의 선형관계) -두 변수간에 선형관계가 존재하지 않으면 상관계수는 0에 가까운 값을 가진다.

55 상관계수(Coefficient of Correlation)
+1 -1 강한 양의 선형관계 r 또는 r = 선형관계가 존재하지 않음 강한 음의 선형관계

56 상관계수의 계산(예제3.16) -표본공분산과 X와 Y의 표준편차를 이용하여 표본상관계수 를 계산한다.

57 상관계수의 계산(예제3.16) -따라서 X와 Y의 표본표준편차는 각각 다음과 같다.

58 상관계수의 계산(예제3.16) Set 1: Set 2: Set 3:

59 최소자승법(Least Squares Method)

60 최소자승법(Least Squares Method)
- 직선식은 다음과 같이 표현된다. y = b0x + b1 여기서 b0 = 직선의 기울기 , b1 = y-절편. -공분산과 상관계수를 구해보고 두 변수간에 선형관계 가 존재한다고 결정했다면, 두 변수 간 관계를 나타내는 선형식을 어떻게 구할 수 있는가?

61 최소자승법(Least Squares Method)
-최소자승법은 점들과 직선간의 편차제곱합이 최소가 되도록 데이터를 통과하는 직선식을 구하는 방법이다. -이와 같은 방법으로 구해진 직선식은 다음과 같이 표 현된다. b0 = y-절편, b1 = 기울기 (“y” hat) = 직선에 의해 결정되는 y 의 값.

62 최소자승법(Least Squares Method)
-계수 b0 와 b1 은 다음과 같이 구해진다:

63 고정비용과 변동비용의 추정(예,3.17) -고정비용은 생산여부와 관계없이 지불되어야 하는 비 용이다. 고정비용은 주어진 생산기간동안 “고정”되어있 다. -변동비용은 생산되는 제품의 양에 따라서 변동하는 비 용이다.

64 고정비용과 변동비용의 추정(예,3.17) -일부의 혼합된 비용도 존재한다. 이와 같은 혼합된 비 용을 고정비용과 변동비용으로 분해하는 몇가지 방법들 이 있다. 이와 같은 방법중 하나가 최소자승선을 구하는 것이다. 즉, 총비용을 다음과 같이 나타낸다. y = b0 + b1x y = 총혼합비용 (총비용), b0 = 고정비용, b1 = 변동비용, x = 생산단위의 수.

65 고정비용과 변동비용의 추정(예,3.17) -한 공구 제조업자는 특수공구를 만드는 작은 공장을 운영한다. 그는 그의 사업규모를 증가시키는 것을 고려 하고 있고 비용에 관한 정보을 더 많이 알아야 할 필요 가 있다. -한 가지 비용은 기계와 전등을 작동시키기 위해 필요 한 전기비용이다. 어떤 작업의 경우 작업하는 것에 밝게 비추기 위해 추가적으로 전등을 켜야 한다. -그는 일일 전기비용과 제작한 공구 수를 기록하였다 (Xm03-17). 전기비용을 고정비용과 변동비용으로 분 해하라.

66 고정비용과 변동비용의 추정(예,3.17)

67 고정비용과 변동비용의 추정(예,3.17) -최소자승선의 기울기는 x가 1단위 증가할 때 y의 변화를 나타낸다. 이러한 의미에서 기울기는 종속변수의 한계변화율 (marginal rate of change)을 측정한다. 한계변화율은 독립변수가 추가적으로 한 단위가 증가하는 것의 효과를 나타낸다. -예제3.17에서 기울기는 2.25이다. 이것은 생산되는 공구 수가 1단위 증가하는 경우에 전기비용의 한계증가는 $2.25라는 것을 의미한다. 즉 추정 변동전기비용은 공구 당 $2.25이다.

68 고정비용과 변동비용의 추정(예,3.17) - y-절편은 9.57이다. 최소자승선은 9.57에서 y-축과 만난다. 즉 x=0일 때 y=9.57이다. -x=0일 때, 즉 공구를 전혀 생산하지 않을 때 y=9.57이라는 것은 추정 고정전기비용은 일일 $9.57이라는 것을 의미한다.

69 결정계수(Coefficient of Determination)
-상관계수는 -1, 0, +1인 경우를 제외하고 그 의미를 정확하게 해석할 수 없다. 단지 상관계수가 -1, 0, +1에 얼마나 가까운가에 의해서만 그 의미를 판단할 수 있다. -다행스럽게도 정확하게 해석할 수 있는 다른 하나의 척도가 존재한다. 상관계수를 제곱한 척도를 결정계수 (coefficient of determination)라고 하며 R2 로 나타낸 다. -. 결정계수는 종속변수의 변동 중에서 독립변수의 변동에 의해서 설명되는 비율을 측정한다

70 선형관계의 강도측정(예,3.18) -예제 3.17의 결정계수를 계산하라.

71 선형관계의 강도측정(예,3.18) - 결정계수는 R2 = .758 이다. - 이것은 전기비용 변동의 75.8%가 공구 수의 변동에 의 해 설명된다는 것을 의미한다. 나머지 전기비용 변동의 24.2%는 설명되지 않는다.

72 상관관계의 해석 -두 구간변수 간 관계를 분석하는데 있어서 상 관계수와 결정계수를 정확히 해석할 필요가 있다. 두 변수가 선형관계를 가진다는 것이 X가 원인이고 Y가 결과라는 것을 의미하지 않는다. “상관관계는 인과관계가 아니다”

73 모수(parameters)와 통계량(statistics)


Download ppt "Keller: Stats for Mgmt & Econ, 7th Ed"

Similar presentations


Ads by Google