Association between two measurement variables Correlation

Slides:



Advertisements
Similar presentations
2. 속력이 일정하게 증가하는 운동 Ⅲ.힘과 운동 2.여러 가지 운동. 도입 Ⅲ.힘과 운동 2. 여러 가지 운동 2. 속력이 일정하게 증가하는 운동.
Advertisements

신진영 현지 조사 방법 및 보고서 작성법 제 10 강 - 측정 및 척도 - - 통계적 추론 원리 -
1 통계를 왜 공부해야 하나 ? Dept. of Public Administration Chungnam National University.
목 차 ❖ 1 장. 서 론 ❖ 2 장. 표와 그림을 통한 자료의 요약 ❖ 3 장. 수치를 통한 연속형 자료의 요약
표 및 그래프 작성.
R commander an introduction user-friendly and absolutely free
5.1 모수 (parameter) vs 통계량 (statistics)
구간추정 (Interval Estimation)
3일차 - 가설검정.
의료의 질 평가 분석 기법 김 민 경.
논문을 위한 통계 집단간 평균 차이: t-test, ANOVA 하성욱 한성대학교 대학원.
일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
실습 (using SPSS) Department of Biostatistics, Samsung Biomedical Research Institute Samsung Medical Center.
제1장 과학과 사회조사방법 과학적 지식(scientific knowledge): 과학적 방법에 의해 얻어진 지식, 즉 논리적, 체계적, 경험적, 객관적 절차를 통해 얻어진 지식 과학적 지식의 특성 1) 재생가능성(reproducibility) 2) 경험가능성(empiricism)
모수 통계학과 비모수 통계학 Parametric Statistics, NonParametric Statistics
아파트관리비 청구서 이용 프로세스 안내 ㈜한국전산기술.
Medical Instrumentation
비모수 분석 및 복습.
CHAPTER 21 UNIVARIATE STATISTICS
Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다.
논문을 위한 통계 이변량 단순 관계 분석 하성욱 한성대학교 대학원.
Cluster Analysis (군집 분석)
Marketing Research 제 8 장 측정의 기초
기초통계학 제 7장 연관성 분석 1. 상관분석 2. 교차분석
ANOVA.
상관분석 (p , p ).
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
제7장 추정과 가설 검정.
Inferences concerning multiple populations ANOVA
Medical Instrumentation
4-1 Gaussian Distribution
서울아산병원 의학통계학과 울산의대 예방의학교실 이무송
Statistical inference II
Hypothesis Testing 가설 검정
Other ANOVA designs Two-way ANOVA
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
(independent variable)
Descriptive statistics
경제통계학 개요 사공 용 서강대학교 경제학과.
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
Data measurement and management of numbers
Inferences concerning two populations and paired comparisons
Association between two measurement variables Correlation
Analysis of frequencies
: Two Sample Test - paired t-test - t-test - modified t-test
Statistical inference I (통계적 추론)
두 모집단에 대한 검정.
Frequency distributions and Graphic presentation of data
Multiple regression analysis
The normal distribution (정규분포)
측정과 척도 경영학과 최동훈 소프트웨어학부 유제민 경영학과 정지송
사용자 경험 측정 (Measuring User Experience)
논문작성을 위한 연구모형 설정 양동훈.
Chapter Ⅱ. 연구 설계.
통계방법의 이해.
5장 사진 바꾸기, 2011년 제작 및 운영제안서 측정 및 척도구성.
01 로그의 정의 ⑴ 일 때, 양수 에 대하여 을 만족시키는 실수 는 오직 하나 존재한다. 이때 를
Chapter 4: 통계적 추정과 검정 Pilsung Kang
제2장 통계학의 기초 1절 확률 기본정의 확률의 기본 공리와 법칙 2절 확률변수와 확률분포 3절 정규분포와 관련 분포 정규분포
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
제 5장 제어 시스템의 성능 피드백 제어 시스템 과도 성능 (Transient Performance)
Week 13:가설검정(Hypothesis Testing)
쉽게 배우는 알고리즘 2장. 점화식과 점근적 복잡도 분석
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
제3장 사회조사방법의 기본개념 변수(variable): 사람, 물건, 사건 등의 특성이나 속성이 두 가지 이상의 가치(value)를 가질 때 변수라고 함. 즉 상호배타적인 속성들의 집합 1) 속성에 따른 분류 -. 명목변수(Nominal Variable): 분류에 기초를.
비교분석 보고서 Template 2015.
Week 4: 다변수(2변수) 데이터분석 5장_1(산포도: scatter plot) 동영상 1,2,3,4,5
가설검정의 기본원리 Introduction to Hypothesis Testing
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
표본분포 개요 랜덤추출법 표본분포 모양과 CLT.
Presentation transcript:

Association between two measurement variables Correlation Chapter 13

Correlation analysis (상관분석) Two variables이 서로 상관되어 있는지를 알고자 할때 Ex. 1. 혈압을 측정하는 두 방법이 유사한 결과를 보이는가? 2. 회색곰의 두 형태적 특성이 얼마나 강하게 상관되어 있는가? 3. 오염된 하천에서 두 toxic metals의 농도가 서로 상관되어 있는가? Correlation analysis에서 알고자 하는 two questions 1. 두 measurement variables가 서로 관련되어 있는가? 있다면 어떤 방향으로? (정상관 or 역상관?) 2. Relationship의 strength는?

The Pearson correlation coefficient 두 variables 사이의 relationship strength의 측정 Correlation coefficient (상관계수) Formally Pearson correlation coefficient Population (모집단)의 correlation coefficient: ρ (rho) True value of this parameter는 일반적으로 알 수 없다 따라서 population의 random sample로부터 추정 Sample correlation coefficient: r Correlation coefficient의 range +1: perfect positive correlation 0: no correlation -1: perfect negative correlation

Figure 13.1 두 variables 사이의 다른 수준의 association을 보여줌 First row: relationship의 strength Second row: relationship의 방향

The Pearson correlation coefficient Ex. Iguana의 체중과 알의 수와의 관계

The Pearson correlation coefficient Pearson correlation coefficient (r) 0.952는 1.00에 매우 가까우므로 두 variables 사이에 strong relationship을 의미한다

Testing the significance of r Null hypothesis of correlation analysis H0: ρ = 0 귀무가설이 reject 되면 두 variables 사이에 correlation이 존재 Assumption of the test 1. random sample 2. interval or ratio scale 3. normal distribution 4. 두 variables 사이에 relationship이 존재한다면 linear relationship 가정 2, 3, 4를 만족하지 못할 경우 nonparametric correlation test를 사용

Testing the significance of r Sample correlation coefficient는 t-distribution (df = n – 2)을 한다 (r 검정을 위한 자유도) Sample value로부터 r을 먼저계산, 따라서 (df = n – 2) t는 다음 식으로 계산 t = 0.952√9/(1 – 0.906) = 9.315 Critical t value (df=9, 0.05) in table A.2 2.262 Calculated t value가 critical t value보다 크므로 귀무가설을 reject 결론: 두 variables이 서로 상관되어 있다

Testing the significance of r Table A.8 Null hypothesis를 reject할 수 있는 minimum value 계산된 r 값이 table의 critical value와 같거나 클 경우 null hypothesis를 reject df = n -2 Table A.8 (df = 9): critical value = 0.602 Calculated r value (0.952) > critical value (0.602) 따라서 상관이 없다는 귀무가설을 reject 결론: 두 variables은 서로 상관되어 있다

Nonparametric correlation analysis Spearman’s r Ordinal scale로 측정되었거나 가정을 만족하지 못할 경우 nonparametric test를 사용 Spearman rank correlation test Ex. Male 도마뱀 13마리의 size와 territory를 측정 Size와 territory의 크기가 관련이 있는가? 도마뱀의 크기는 normal distribution을 하지만 territory는 normal distribution을 하지 않음 따라서 nonparametric test를 사용

Table 13.3

Nonparametric correlation analysis 임의로 도마뱀 size를 x variable로, territory를 y variable로 놓음 1. x variable을 from smallest to largest로 rank 2. y variable을 from smallest to largest로 rank 3. d = rank x – rank y, 그리고 d2을 계산 4. Σd2을 계산 (in this case 60) 5. 다음 식으로 rs를 계산

Nonparametric correlation analysis rs= 1 – {6×60/13×(169 – 1)} = 0.835 rs 값의 test는 parametric test와 같다 t = 0.835√13 – 2/1 – (0.835)2 = 4.89 Critical t value (df=11, 0.05): 2.201 Calculated t value 가 critical t value 보다 크다 따라서 귀무가설을 reject 결론: size가 큰 도마뱀이 더 큰 territory를 가진다

Testing the significance of rs Table A.9 Null hypothesis를 reject할 수 있는 minimum value 계산된 r 값이 table의 critical value와 같거나 클 경우 null hypothesis를 reject df = n - 2 Table A.9 (df = 11): critical value = 0.564 (df=10) Calculated rs value (0.835) > critical value (0.564) 따라서 상관이 없다는 귀무가설을 reject 결론: 두 variables은 서로 상관되어 있다