Association between two measurement variables Correlation

Slides:



Advertisements
Similar presentations
Marketing Research 1  두 모집단 평균차이 검증 (t) : 두 개의 독립모집단 평균차이 검증에는 두 모집단이 정규분포를 이루며 분산이 같다는 가정 하에 (σ 1 2 =σ 2 2 ) t-test 를 사용하나 각각의 모 집단 크기가 크면 (n 1 ≥30,
Advertisements

신진영 현지 조사 방법 및 보고서 작성법 제 10 강 - 측정 및 척도 - - 통계적 추론 원리 -
1 통계를 왜 공부해야 하나 ? Dept. of Public Administration Chungnam National University.
목 차 ❖ 1 장. 서 론 ❖ 2 장. 표와 그림을 통한 자료의 요약 ❖ 3 장. 수치를 통한 연속형 자료의 요약
표 및 그래프 작성.
Keller: Stats for Mgmt & Econ, 7th Ed
13장 t검정(t - test) 양윤권.
5.1 모수 (parameter) vs 통계량 (statistics)
안전한 먹을 거리 문화를 위한 청소년 의식조사 빈도수 & 백분율 분석 – 아침 식사 횟수와 매점 이용횟수 교차분석 –
비모수 통계분석 목 적 비모수 통계분석은 t검정이나 분산분석을 사용할 수 있는 등간척도 이상으로 구성된 종속변수가 아닌 서열척도로 종속변수가 구성되어 있을 경우, 또는 등간성이 의심되거나 정규분포성을 얻지 못할 경우에 순위(Rank)를 통하여 변수간의 차이를 비교할 때.
의료의 질 평가 분석 기법 김 민 경.
상관분석(Correlation Analysis)
논문을 위한 통계 집단간 평균 차이: t-test, ANOVA 하성욱 한성대학교 대학원.
일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
실습 (using SPSS) Department of Biostatistics, Samsung Biomedical Research Institute Samsung Medical Center.
제1장 과학과 사회조사방법 과학적 지식(scientific knowledge): 과학적 방법에 의해 얻어진 지식, 즉 논리적, 체계적, 경험적, 객관적 절차를 통해 얻어진 지식 과학적 지식의 특성 1) 재생가능성(reproducibility) 2) 경험가능성(empiricism)
선형회귀분석.
제4장 측정과 척도 (Measurement and scale)
아파트관리비 청구서 이용 프로세스 안내 ㈜한국전산기술.
9.확률 분포 정규 분포 형태 : 평균을 중심으로 좌우대칭의 종 모양을 가진 분포이다.
Medical Instrumentation
CHAPTER 21 UNIVARIATE STATISTICS
Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다.
Chap 3. 표본조사 3.1 표본추출(Sampling)의 기초 3.2 단순임의표본추출 3.3 표본으로부터 모집단 추정
논문을 위한 통계 이변량 단순 관계 분석 하성욱 한성대학교 대학원.
Cluster Analysis (군집 분석)
6장 Functions of r.v..
Marketing Research 제 8 장 측정의 기초
기초통계학 제 7장 연관성 분석 1. 상관분석 2. 교차분석
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
제7장 추정과 가설 검정.
Medical Instrumentation
4-1 Gaussian Distribution
서울아산병원 의학통계학과 울산의대 예방의학교실 이무송
Keller: Stats for Mgmt & Econ, 7th Ed 그래프와 표를 이용한 기술통계학 기법
Hypothesis Testing 가설 검정
Week 10:확률변수(Random Variable)
Other ANOVA designs Two-way ANOVA
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
(independent variable)
경제통계학 개요 사공 용 서강대학교 경제학과.
Association between two measurement variables Correlation
Inferences concerning two populations and paired comparisons
Keller: Stats for Mgmt & Econ, 7th Ed
: Two Sample Test - paired t-test - t-test - modified t-test
Statistical inference I (통계적 추론)
독립성금증(χ2)-교차표 분석 수집된 자료가 명목척도로 측정된 경우 두 변수의 관계를 조사하는 통계기법으로 χ2독립성 검증(chi-square independence test)이 있다. 예를 들어, 특정 속성에 대하여 집단별로 어떤 차이가 있는지를 알아보기 위해서 사용하는.
The normal distribution (정규분포)
측정과 척도 경영학과 최동훈 소프트웨어학부 유제민 경영학과 정지송
사용자 경험 측정 (Measuring User Experience)
Chapter Ⅱ. 연구 설계.
통계방법의 이해.
5장 사진 바꾸기, 2011년 제작 및 운영제안서 측정 및 척도구성.
■ 척도의 종류 : 변도(variance)를 나타내는 수치들이 가지는 특성에 따라 측정수준에 따른 분류 → 척도분류
2015년도 2학기 제 5 장 자료의 수집 : 실험 마케팅조사.
Chapter 4: 통계적 추정과 검정 Pilsung Kang
제2장 통계학의 기초 1절 확률 기본정의 확률의 기본 공리와 법칙 2절 확률변수와 확률분포 3절 정규분포와 관련 분포 정규분포
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
Week 13:가설검정(Hypothesis Testing)
Definitions (정의) Statistics란?
천국 가는 길 천국 가는 길 ♧ 천국 가는 길 ♧ 1. 죄와 사망(지옥) 1) 사람의 3가지 공통점 - 죄인, 죽음, 심판
한양인 주차정기권 신청 안내 2018년 2학기 관리처 관재팀.
제3장 사회조사방법의 기본개념 변수(variable): 사람, 물건, 사건 등의 특성이나 속성이 두 가지 이상의 가치(value)를 가질 때 변수라고 함. 즉 상호배타적인 속성들의 집합 1) 속성에 따른 분류 -. 명목변수(Nominal Variable): 분류에 기초를.
성전기공식(안) 식 순 1. 기공미사 2. 기 공 식 3. 축 하 연 천주교 수원교구 퇴촌성당.
의학자료분석론 교재: 강의록 Rosner B, Fundamentals of Biostatistics, 7th ed. Brooks/Cole Cengage Learning, Canada, 강의 평가: 출석 20% 숙제 30% 기말고사 50%
가설검정의 기본원리 Introduction to Hypothesis Testing
표본분포 개요 랜덤추출법 표본분포 모양과 CLT.
표 본 분 포 7 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포.
Progress Seminar 이준녕.
Chapter 2. Coulomb’s Law & Electric Field Intensity
Presentation transcript:

Association between two measurement variables Correlation Chapter 13

Correlation analysis (상관분석) Two variables이 서로 상관되어 있는지를 알고자 할때 Ex. 1. 혈압을 측정하는 두 방법이 유사한 결과를 보이는가? 2. 회색곰의 두 형태적 특성이 얼마나 강하게 상관되어 있는가? 3. 오염된 하천에서 두 toxic metals의 농도가 서로 상관되어 있는가? Correlation analysis에서 알고자 하는 two questions 1. 두 measurement variables가 서로 관련되어 있는가? 있다면 어떤 방향으로? (정상관 or 역상관?) 2. Relationship의 strength는?

The Pearson correlation coefficient 두 variables 사이의 relationship strength의 측정 Correlation coefficient (상관계수) Formally Pearson correlation coefficient Population의 correlation coefficient: ρ (rho) True value of this parameter는 일반적으로 알 수 없다 따라서 population의 random sample로부터 추정 Sample correlation coefficient: r Correlation coefficient의 range +1: perfect positive correlation 0: no correlation -1: perfect negative correlation

Figure 13.1 두 variables 사이의 다른 수준의 association을 보여줌 First row: relationship의 strength Second row: relationship의 방향

The Pearson correlation coefficient Ex. Iguana의 체중과 알의 수와의 관계

The Pearson correlation coefficient Pearson correlation coefficient (r) 0.952는 1.00에 매우 가까우므로 두 variables 사이에 strong relationship을 의미한다

Testing the significance of r Null hypothesis of correlation analysis H0: ρ = 0 귀무가설이 reject 되면 두 variables 사이에 correlation이 존재 Assumption of the test 1. random sample 2. interval or ratio scale 3. normal distribution 4. 두 variables 사이에 relationship이 존재한다면 linear relationship 가정 2, 3, 4를 만족하지 못할 경우 nonparametric correlation test를 사용

Testing the significance of r Sample correlation coefficient는 t-distribution (df = n – 2)을 한다 (r 검정을 위한 자유도) Sample value로부터 r을 먼저계산, 따라서 (df = n – 2) t는 다음 식으로 계산 t = 0.952√9/(1 – 0.906) = 9.315 Critical t value (df=9, 0.05) in table A.2 2.262 Calculated t value가 critical t value보다 크므로 귀무가설을 reject 결론: 두 variables이 서로 상관되어 있다

Testing the significance of r Table A.8 Null hypothesis를 reject할 수 있는 minimum value 계산된 r 값이 table의 critical value와 같거나 클 경우 null hypothesis를 reject df = n -2 Table A.8 (df = 9): critical value = 0.602 Calculated r value (0.952) > critical value (0.602) 따라서 상관이 없다는 귀무가설을 reject 결론: 두 variables은 서로 상관되어 있다

Nonparametric correlation analysis Spearman’s r Ordinal scale로 측정되었거나 가정을 만족하지 못할 경우 nonparametric test를 사용 Spearman rank correlation test Ex. Male 도마뱀 13마리의 size와 territory를 측정 Size와 territory의 크기가 관련이 있는가? 도마뱀의 크기는 normal distribution을 하지만 territory는 normal distribution을 하지 않음 따라서 nonparametric test를 사용

Table 13.3

Nonparametric correlation analysis 임의로 도마뱀 size를 x variable로, territory를 y variable로 놓음 1. x variable을 from smallest to largest로 rank 2. y variable을 from smallest to largest로 rank 3. d = rank x – rank y, 그리고 d2을 계산 4. Σd2을 계산 (in this case 60) 5. 다음 식으로 rs를 계산

Nonparametric correlation analysis rs= 1 – {6×60/13×(169 – 1)} = 0.835 rs 값의 test는 parametric test와 같다 t = 0.835√13 – 2/1 – (0.835)2 = 4.89 Critical t value (df=11, 0.05): 2.201 Calculated t value 가 critical t value 보다 크다 따라서 귀무가설을 reject 결론: size가 큰 도마뱀이 더 큰 territory를 가진다

Testing the significance of rs Table A.9 Null hypothesis를 reject할 수 있는 minimum value 계산된 r 값이 table의 critical value와 같거나 클 경우 null hypothesis를 reject df = n - 2 Table A.9 (df = 11): critical value = 0.564 (df=10) Calculated rs value (0.835) > critical value (0.564) 따라서 상관이 없다는 귀무가설을 reject 결론: 두 variables은 서로 상관되어 있다