논문을 위한 통계 이변량 단순 관계 분석 하성욱 한성대학교 대학원.

Slides:



Advertisements
Similar presentations
Marketing Research 1  두 모집단 평균차이 검증 (t) : 두 개의 독립모집단 평균차이 검증에는 두 모집단이 정규분포를 이루며 분산이 같다는 가정 하에 (σ 1 2 =σ 2 2 ) t-test 를 사용하나 각각의 모 집단 크기가 크면 (n 1 ≥30,
Advertisements

사회적기업 프로잭트 사회적기업 프로잭트 ( 일하는 기쁨과 함께 나누는 행복한 기업 ) 2008 년 10 월 ( 사단법인 ) 사회적기업 청람 Co. social enterprise cheong ram 영광종합병원 · 공립영광노인전문요양병원 의료법인 호연재단.
20... ㅇㅇ동 ㅇㅇㅇ시설 신축공사 - 안산시 단원구 ㅇㅇ동 번지 - 부 서 명부 서 명 2012 년도 제 회 안산시경관위원회 2012 년도 제 회 안산시경관위원회 심의일자 (HY 중고딕 20) 사업명 (HY 중고딕 20) 사업위치 (HY 중고딕 20) 민간건축물 미작성.
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
Proc freq data = "c:/test/hsb2"; /* c 디렉토리의 test 폴더에 hsb2 데이터를 이용하여 freq 라는 sas 의 procedure 를 실행한다 tables female / binomial(p=.5); /* tables 는 freq 의 대상.
융합형 전문가, 기술경영자 한성대학교 경영학부 하성욱 교수 2014 년 10 월 29 일 2014 년 한성여고 방과후 특강.
회계학과 김영록 회계학과 곽웅섭 회계학과 정찬규 경영학부 황 현.
1월 월간업무보고 경 리 부.
PASW 17.0 활용하기 일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
3일차 - 가설검정.
기술 통계학 (Descriptive Statistics)
비모수 통계분석 목 적 비모수 통계분석은 t검정이나 분산분석을 사용할 수 있는 등간척도 이상으로 구성된 종속변수가 아닌 서열척도로 종속변수가 구성되어 있을 경우, 또는 등간성이 의심되거나 정규분포성을 얻지 못할 경우에 순위(Rank)를 통하여 변수간의 차이를 비교할 때.
의료의 질 평가 분석 기법 김 민 경.
상관분석(Correlation Analysis)
자료분석 및 통계활용.
비모수통계.
논문을 위한 통계 집단간 평균 차이: t-test, ANOVA 하성욱 한성대학교 대학원.
일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
통계분석 특강(속성) 서구원 한양사이버대학교 미디어MBA.
제12주 회귀분석 Regression Analysis
논문을 위한 통계 회귀분석 (regression) 하성욱 한성대학교 대학원.
선형회귀분석.
비모수 분석 및 복습.
CHAPTER 21 UNIVARIATE STATISTICS
Cluster Analysis (군집 분석)
지역맞춤형 일자리창출 사업 기관 평가
SPSS를 활용한 통계분석 김 덕 기 충북대학교 정보통계학과
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
기초통계학 제 7장 연관성 분석 1. 상관분석 2. 교차분석
ANOVA.
상관분석 (p , p ).
제 7장 연관성분석 화장품과학과 홍보람.
상관관계 양윤권.
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
4-1 Gaussian Distribution
서울아산병원 의학통계학과 울산의대 예방의학교실 이무송
SPSS - Statistics - AMOS
Keller: Stats for Mgmt & Econ, 7th Ed
SPSS 강원대학교 생물학과 석사 과정생 김자경.
Other ANOVA designs Two-way ANOVA
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
(independent variable)
Association between two measurement variables Correlation
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
Inferences concerning two populations and paired comparisons
Association between two measurement variables Correlation
‘응급의료서비스 이해도 및 만족도’ 전국민 여론조사 보고서
: Two Sample Test - paired t-test - t-test - modified t-test
Statistical inference I (통계적 추론)
연속변수간의 관계 검증 :상관분석 과 목 명 : 간호연구 및 통계 담당교수: 홍윤경.
독립성금증(χ2)-교차표 분석 수집된 자료가 명목척도로 측정된 경우 두 변수의 관계를 조사하는 통계기법으로 χ2독립성 검증(chi-square independence test)이 있다. 예를 들어, 특정 속성에 대하여 집단별로 어떤 차이가 있는지를 알아보기 위해서 사용하는.
-여러나라의 숫자와 수에 대해- 제주북초등학교 영재반 5학년 안희주
Multiple regression analysis
The normal distribution (정규분포)
사용자 경험 측정 (Measuring User Experience)
논문작성을 위한 연구모형 설정 양동훈.
■ 척도의 종류 : 변도(variance)를 나타내는 수치들이 가지는 특성에 따라 측정수준에 따른 분류 → 척도분류
Eliminating noise and other sources of error
Sampling Distributions
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
MATERIAL SAFETY DATA SHEET
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
비교분석 보고서 Template 2015.
의학자료분석론 교재: 강의록 Rosner B, Fundamentals of Biostatistics, 7th ed. Brooks/Cole Cengage Learning, Canada, 강의 평가: 출석 20% 숙제 30% 기말고사 50%
상관계수.
Week 4: 다변수(2변수) 데이터분석 5장_1(산포도: scatter plot) 동영상 1,2,3,4,5
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
9장. spss statistics 20의 데이터 변수계산
CH4. 반복이 없는 이원배치법 ( Two-way ANOVA)
Presentation transcript:

논문을 위한 통계 이변량 단순 관계 분석 하성욱 한성대학교 대학원

상관관계 I 상관관계 (correlation) 변동의 연관성 (association between changes of two variables) 한 변수가 변동함에 따라 다른 변수가 변동하는 정도 (degree)와 방향 (direction) The strength and direction of a linear relationship between two random variables 상관관계의 범위 (range) - 1.0 ≤ Correlation ≤ + 1.0 상관관계의 부호 (sign) 변동의 방향성이 같으면 양수 (+) 변동의 방향성이 다르면 음수 (-)

상관관계 II 상관관계 (correlation)의 도식화 I 상관관계 없음 (no correlation) y x y x y x

상관관계 III 상관관계 (correlation)의 도식화 II 상관관계 없음 낮은 정의 상관관계 높은 정의 상관관계 (no correlation) 낮은 정의 상관관계 (low positive correlation) 높은 정의 상관관계 (high positive correlation) y x y x y x

상관관계 IV 상관관계 (correlation)의 도식화 III <SP-3 Corr_예제_기울기.sav> 참고 (perfect positive correlation) 완벽한 부의 상관관계 r = -1 (perfect negative correlation) y y x x

상관관계 V 상관관계 (correlation)의 도식화 IV 상관관계 없음 (no correlation) y x

상관관계 VI 상관관계 (correlation)의 수식 √ √ Pearson correlation Cov(x, y) STD(x) * STD(y) Sxy Sy Sx rxy = = ∑i=1n (xi - )(yi - ) x y n-1 = ∑i=1n (xi - )2 x n-1 √ ∑i=1n (yi - )2 y n-1 √ ∑i=1n (xi - )(yi - ) x y = √ ∑i=1n (xi - )2 x √ ∑i=1n (yi - )2 y t = rxy n - 2 1 - rxy2 degree of freedom = n - 2

상관관계 VII r = 182 / ( √230 * √150 ) = 0.980 편차(deviation) 응답자 친절 만족 (xi - ) x (yi - ) y (xi - )2 x (yi - )2 y (xi - )(yi - ) x y 1 7 6 -3 -3 9 9 9 2 18 16 8 7 64 49 56 3 15 12 5 3 25 9 15 4 9 8 -1 -1 1 1 1 5 10 10 -0 1 1 6 5 6 -5 -3 25 9 15 7 4 3 -6 -6 36 36 36 8 4 5 -6 -4 36 16 24 9 13 11 3 2 9 4 6 10 15 13 5 4 25 16 20 합계 100 90 230 150 182 평균 10.0 9.0 25.556 16.667 20.222 x의 분산 (variance of x) y의 분산 (variance of y) 공분산 (covariance) <SP-3 Corr_예제_자유도.sav> 참고

상관관계 VIII 상관관계 (correlation)의 특성 인과관계 (causal relationship)가 아닌 관련성 (association) 을 의미함 특정한 조건이 추가되면 인과관계일 수는 있음 관계의 정도 (degree)는 확률적 표현임 두 변수 관계의 상관성에 대한 예측 (prediction)의 정확도 기울기 (degree of slope)를 의미하지 않음 상관관계들 간의 가감승제 (+ - * ÷)는 불가능함 Corr(X, aY+b) = Corr(X, Y) ≠ a * Corr(X, Y) + b Corr(X, aY1+bY2) ≠ Corr(X, aY1) + Corr(X, bY2) <SP-3 Corr_예제_기울기>로 실습 설명력 (R2) = r * r

상관관계 IX 상관관계 (correlation)의 종류 변수의 측정수준 (level of measurement)에 따른 분류 Pearson correlation r 등간측정 (interval) 또는 비율측정 (ratio measurement) does not require the data to be either marginally or jointly normally distributed Exception: Cauchy distribution, Heavy-tailed distribution Outliers => not robust r Large sample size => asymptotic distribution SPSS, 기술통계량-데이터 탐색: 정규성 및 Outlier 검토 SPSS, 상관분석-이변량상관계수: Pearson Spearman’s rank order correlation, rho (ρ) 서열측정 (ordinal measurement) 등 Pearson r 부적절한 경우 SPSS, 상관분석-이변량상관계수: Spearman, Kendall’s tau b SPSS, 기술통계량-교차분석(cross-tabulation): Kendall’s tau b, tau c, Gamma, Somer’s d, etc.

상관관계 X 상관관계 (correlation)의 수식 Spearman rank order correlation Special case with no tied rank where Ri = rank of xi = mean rank of x Si = rank of yi = mean rank of y If Ri or Si has tied ranks, use mean of ranks R S ∑i=1n (Ri - )(Si - ) R S δxy = √ ∑i=1n (Ri - )2 R √ ∑i=1n (Si - )2 S 6 ∑i=1n di2 δxy = 1 - Where di = rank difference of ith pair n ( n2 - 1 ) t = δxy n - 2 1 - δxy2 degree of freedom = n - 2

상관관계 XI Kendall’s tau τxy = τxy = Kendall’s tau a: no adjustment for ties Kendall’s tau c adjustment for ties, most suitable for rectangular table Kendall’s tau b adjustment for ties, most suitable for square table nc – n d nc = the number of concordant pairs nd = the number of disconcordant pairs τxy = where n (n – 1) 2 ∑i<j sgn(xi – xj) sgn(yi – yj) τxy = n (n – 1) 2 - ∑i=1n ti(ti-1) n (n – 1) 2 - ∑i=1n ui(ui-1) sgn(k) : +1 (positive k), 0, -1 (negative k) ti , ui : 각각 x와 y의 i번째 쌍에 대해 동등한 값을 갖는 경우의 개수 (?) where

상관관계 XII c.f. Kendall’s W W = Kendall의 일치계수 (coefficient of concordance) For n < 7, Kendall 일치계수 표 (채서일, p. 514) For n ≥ 7, K(n-1)W ~ χ2 (d.f. n-1) SPSS, 비모수통계-대응 K-표본 S W = K2 (n3 – n) 12 S = Ri : sum of ranks of K raters for ith person n : the number of rated person ∑i=1n (Ri - )2 R where

상관관계 XIII 상관관계 분석의 순서 No Nominal Metric ? Yes (Interval or Ratio) Ordinal 교차분석 (cross- tabulation) Yes Outlier ? SPSS, 기술통계량-데이터 탐색 Normality & Outlier Check No Pearson Correlation Spearman’s rho Kendall’s Tau b or Tau c SPSS, 상관분석-이변량상관계수 SPSS, 상관분석-이변량상관계수 기술통계량-교차분석

상관관계 XIV 변수의 수에 따른 분류 단순 상관관계 (simple correlation) 부분 상관관계 (partial correlation) 통제변수 (control variable) 포함 e.g. 인테리어 시설 우수성 독립변수 X, 종속변수 Y를 통제변수 C가 같은 수준일 때의 값으로 변환한 값인 Xc와 Yc간의 상관계수 SPSS, 상관분석-편상관계수 <지역조사 데이터.sav>로 실습 다중 상관관계 (multiple correlation) ‘두 개 이상의 여러 변수들’과 다른 변수와의 상관관계

교차분석 I Chi-square (χ2) independence test (독립성 검정) H0 : 성별과 학력은 관련이 없다. Ha : 성별과 학력은 관련이 없지 않다. 남자 여자 합계 중학교 20 20% 100 50% 120 40% 고등학교 40 40% 50 25% 90 30% 대학교 40 40% 50 25% 90 30% 합계 100 33.3% 200 66.7% 300 100 %

교차분석 II Chi-square (χ2) independence test (독립성 검정) χ2 = ∑i=1r∑j=1c [ (Oij – Eij)2/Eij ] 남자 여자 합계 Oij Eij Dij Dij2/Eij Oij Eij Dij Dij2/Eij 중학교 20 40 (= 100*120 /300) -20 400 /40 10 100 80 (= 200*120 /300) 20 400 /80 5 120 고등학교 40 30 (= 100*90 /300) 10 100 /30 3.33 50 60 (= 200*90 /300) -10 100 /60 1.66 90 대학교 40 30 (= 100*90 /300) 10 100 /30 3.33 50 60 (= 200*90 /300) -10 100 /60 1.66 90 합계 100 16.66 200 8.32 300 24.98

교차분석 III 자유도 (degree of freedom; d.f.) χ2 table (우수명, 2013: p. 522 ) (r-1) * (c-1) e.g. (3-1) * (2-1) = 2 χ2 table (우수명, 2013: p. 522 ) χ2 (d.f.=2, α=0.001) = 13.8 χ2 (d.f.=2, α=0.001) = 13.8 < 24.98 = Calculated χ2 Reject H0 i.e. ‘성별과 학력은 관련이 없지 않다.’ not ‘성별과 학력은 관련이 있다.’

교차분석 IV 교차분석 (cross-tabulation) <지역조사 데이터.sav>로 실습, <SP-3 교차분석.xls> 참고 Chi-square (χ2) independence test (독립성 검정) n ≥ 30 ‘자유도 (degree of freedom) = 1’ & ‘각 셀 빈도 ≥ 5’ ‘자유도 > 1’ ‘기대빈도 (expected count) < 5’ 인 셀이 20% 이하 이고 ‘기대빈도 < 1’ 인 셀이 없어야 함 n < 30 ( 2 x 2 유관표로 코딩변경 후 ), Fisher’s Exact Test 명목 (nominal) 또는 서열 (ordinal)에 있는 독립성 검정 각 셀이 ‘기대빈도 < 5’ Binomial Test SPSS, 기술통계량-교차분석

교차분석 V Fisher’s Exact Test e.g. 2 x 2 contingency table (general case of m x n) ∑i Pi Pi = = e.g. Problem case More extreme cases

교차분석 VI Binomial test Binomial probability difference test 주사위 235회 시행 중 ‘면6’이 51회 H0 : Prob. (면6) = 1/6 X ~ B (235, 1/6) [i.e. B (n, p) ] Prob. (X ≥ 51) = 0.02654425 Binomial probability difference test <SP-3 교차분석> 참고 n1 = a + c p1 = a / (a + c) n2 = b + d p2 = b / (b + d) Z =

교차분석 VII 교차분석의 순서 Chi-Square No Assumptions Yes Recoding OK! 독립성 검정 SPSS, 기술통계량-교차분석 No Assumptions Yes Recoding OK! 독립성 검정 (명목, 서열) Chi-Square Fisher’s Exact Test Binomial Test SPSS, 기술통계량-교차분석

교차분석 VIII c.f. Chi-square (χ2) 단일표본분석 Chi-square 적합성 검정 (goodness-of-fit test) H0 : 예상치와 관찰치는 차이가 없다 r (i.e. cell의 수) = 2, 모든 셀이 ‘기대빈도 ≥ 5’ r ≥ 3 ‘기대빈도 (expected count) < 5’ 인 셀이 20% 이하 이고 ‘기대빈도 < 1’ 인 셀이 없어야 함 SPSS, 비모수검정-카이제곱검정 c.f. Kolmogorov-Smirnov 단일표본분석 H0 : 관찰된 빈도수와 이론적 빈도수는 동일하다 e.g. 분포의 정규성 (normal distribution) 검정 SPSS, 비모수검정-일표본K-S검정

Summary 상관계수 측정수준에 따른 상관계수의 종류 변수 수에 따른 상관계수의 종류 교차분석 변동의 연관성, 관계의 강도 기울기가 아님 측정수준에 따른 상관계수의 종류 Pearson correlation r Spearman’s rank order correlation, rho (ρ) Kendall’s tau b 변수 수에 따른 상관계수의 종류 단순 상관계수, 부분 상관계수, 다중 상관계수 교차분석 Chi-square (χ2) independence test Fisher’s Exact Test 명목 (nominal) 또는 서열 (ordinal)에 있는 독립성 검정 Binomial probability difference test