R commander an introduction user-friendly and absolutely free

Slides:



Advertisements
Similar presentations
19 장. 보건통계 (Public Health Statistics). 제 1 절. 보건통계의 정의 ▶ 보건통계의 의미 1. 지역사회나 국가의 보건 수준및 보건 상태 2. 보건사업의 필요성 결정 3. 보건입법을 촉구하며, 보건사업에 대한 공공지원을 촉진하게 할수 있음 4.
Advertisements

“ PPT WORLD PowerPoint template, you can become an expert. Your wishes for the successful presentation. Our company wishes to own a successful presentation.
실험 8. Cyclic Voltammetry - 7 조 : 한지영, 이호연, 최은진, 최효린 -
1 통계를 왜 공부해야 하나 ? Dept. of Public Administration Chungnam National University.
Regularization 과적합(overfitting) 문제 Machine Learning.
Multiple features Linear Regression with multiple variables (다변량 선형회귀)
Chapter 7 ARP and RARP.
Journals & Conferences
PASW 17.0 활용하기 일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
SAP QUERY SAP R/3 4.6C.
판별분석의 개념과 적용(→ 추계통계적 성격)
4. Matlab-Simulink를 이용한 메카니즘 해석
비모수 통계분석 목 적 비모수 통계분석은 t검정이나 분산분석을 사용할 수 있는 등간척도 이상으로 구성된 종속변수가 아닌 서열척도로 종속변수가 구성되어 있을 경우, 또는 등간성이 의심되거나 정규분포성을 얻지 못할 경우에 순위(Rank)를 통하여 변수간의 차이를 비교할 때.
의료의 질 평가 분석 기법 김 민 경.
상관분석(Correlation Analysis)
제 6장 분산분석(ANOVA) 분산분석 이란? 여러 개의 모집단의 모평균을 비교하는 분석방법
사회복지조사론 Research Method for Social Welfare
논문을 위한 통계 집단간 평균 차이: t-test, ANOVA 하성욱 한성대학교 대학원.
일시 : , (PM) 6:30-10:30 장소 : 삼성암센터 (지하1층 세미나실2)
실습 (using SPSS) Department of Biostatistics, Samsung Biomedical Research Institute Samsung Medical Center.
제12주 회귀분석 Regression Analysis
선형회귀분석.
모수 통계학과 비모수 통계학 Parametric Statistics, NonParametric Statistics
9.확률 분포 정규 분포 형태 : 평균을 중심으로 좌우대칭의 종 모양을 가진 분포이다.
비모수 분석 및 복습.
CHAPTER 21 UNIVARIATE STATISTICS
Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다.
6장 히스토그램 처리 차 례 히스토그램의 개요 히스토그램의 용도 영상 이치화 히스토그램 평활화 히스토그램 스트레칭
1 도시차원의 쇠퇴실태와 경향 Trends and Features of Urban Decline in Korea
Cluster Analysis (군집 분석)
숭실대학교 마이닝연구실 김완섭 2009년 2월 8일 아이디어  - 상관분석에 대한 연구
2007 겨울 통계강좌 중급과정 제6강 다변량 분석에 대한 이해.
ANOVA.
로지스틱 회귀분석.
상관분석 (p , p ).
MINITAB for Six Sigma.
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
Medical Instrumentation
4-1 Gaussian Distribution
서울아산병원 의학통계학과 울산의대 예방의학교실 이무송
PCA Lecture 9 주성분 분석 (PCA)
1. Log in WCMS에서 사용하는 ID와 PW를 동일하게 사용.
합리적‧동태적 정원모형 설계 Wisdom21 Management Consulting.
Data Mining Final Project
국립공원 추가·확대 지정 설문조사 유기준 (상지대학교)
Hypothesis Testing 가설 검정
Linear Mixed Model을 이용한 분석 결과
Other ANOVA designs Two-way ANOVA
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
(independent variable)
Association between two measurement variables Correlation
회귀분석.
세종학당(King Sejong Institute) – Free Korean Language Class
Introduction to Programming Language
Inferences concerning two populations and paired comparisons
Association between two measurement variables Correlation
: Two Sample Test - paired t-test - t-test - modified t-test
Statistical inference I (통계적 추론)
영어 원어민 한국어 학습자의 초분절음 특징 연구 이 문서는 나눔글꼴로 작성되었습니다. 설치하기.
Multiple regression analysis
The normal distribution (정규분포)
사용자 경험 측정 (Measuring User Experience)
Optimal placement of MR dampers
이산수학(Discrete Mathematics)
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
Definitions (정의) Statistics란?
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
Statistics (First Term/2009)
Chapter 4. Energy and Potential
Progress Seminar 이준녕.
Presentation transcript:

R commander an introduction user-friendly and absolutely free Ho Kim SCHOOL OF PUBLIC HEALTH, SNU

Installing R commander ① You need to first install R and then R commander.

Installing R commander ② Write on R console window like install.packages(“Rcmdr”)

Starting the R commander library(Rcmdr)

R commander windows Script window Output window Messages window

Importing datasets

Select the data set by clicking on this box

Checking continuous variables Statistics->Means options Single-sample t-test Independent samples t-test Paired t-test One-way ANOVA Multi-way ANOVA

문제 1. 1.1 Pepers.xls 자료를 읽고 angle 변수의 평균이 0인지를 검정하시오. 귀무가설과 대립가설이 무엇인지를 식으로 정확히 표현하시오.

single-sample t-test (Pepers.xls) Statistics > Means > Single-sample t-test (Enter the proposed mean (Null hypothesis: mu=))

1.2 angle 변수의 평균이 2라고 이미 알려져있다고 가정하고 이 자료를 가지고 기존의 지식이 사실이 아니라는 것을 주장하고 싶다면 어떠한 분석을 실시할 수 있는지 귀무가설과 대립가설을 써 보시오. * 위 검정을 R commander를 이용해서 분석하고 결론을 내리시오.

single-sample t-test (Pepers.xls) Statistics > Summaries > Shapiro-Wilk test of normality This is a hypothesis tests with the null hypothesis that the data comes from a normal distribution.

문제 2. 2.1 Pulse.xls 자료를 읽고 pre와 post 변수를 볼 때 어떠한 분석을 실시해야 하는지 설명하시오. * 귀무가설과 대립가설이 무엇인지를 식으로 정확히 표현하시오. 2.2 위의 가설을 모수적인 방법, 비모수적인 방법으로 증명하고자 할 때 R commander를 이용해서 분석하시오. 그리고 통계적 결론을 내리시오.

paired t-test(parametric) - Pulse data paired t-test(parametric) Import the data

paired t-test(parametric) - Pulse data paired t-test(parametric) Statistics > Means > Paired t-test

paired t-test(parametric) - Pulse data paired t-test(parametric)

paired t-test(non-parametric) - Pulse data paired t-test(non-parametric) Statistics > nonparametric tests > Paired-samples Wilcoxon test

paired t-test(non-parametric) - Pulse data paired t-test(non-parametric)

문제 3. 3. 1 insul. xls 자료를 읽고 이 자료의 분석 목적에 대해서 설명하시오. 3 문제 3. 3.1 insul.xls 자료를 읽고 이 자료의 분석 목적에 대해서 설명하시오. 3.2 자료의 탐색 (Statistics>Summaries)을 R commander를 이용해서 실시하고 결과를 해석하시오. 3.3 5군의 glucose값을 비교한다면 귀무가설과 대립가설이 무엇인지를 식으로 정확히 표현하시오. 3.4 R commander를 이용한 ANOVA를 실시하고 그 결과를 해석하시오. 3.5 사후분석을 실시해서 군간의 차이를 설명하시오 3.6 conc=1,2 를 한 그룹으로 conc=4,5 를 다른 그룹으로 (2 군간의 비교) 해서 비교를 한다면 어떠한 방법이 가능할 지 설명하고 R commander를 이용해서 분석을 실시하시오.

ANOVA Effect of glucose concentration on Insulin - insul data ANOVA Effect of glucose concentration on Insulin Measured the amount of insulin secretion after administration of five different concentrations of glucose into pancreatic tissue (animal experiments) Characteristics for each group Statistics > Summaries (according to the study objective) Graphs (according to the study objective) variable “conc” must be declared as a factor variable!

- insul data ANOVA Graphs->Boxplot Conc 1,2 < 3 < conc 4,5

ANOVA One-Way ANOVA Pairwise comparisons of means - insul data ANOVA One-Way ANOVA Statistics > Means > One-way ANOVA Pairwise comparisons of means Tukey post-hoc comparison procedure (default)

Multiple comparison t-test for (1,2) vs (4,5) comparison - insul data Multiple comparison t-test for (1,2) vs (4,5) comparison Re-define variables Data > Manage variable in active data set > Recode variables > select conc variable New variable name or prefix for multiple recodes : new Enter recode directives 1:2=1; 3=NA; 4:5=2 conc=3 as a missing Equality of variance test should be carried out before the t-test Statistics > Variances > Two variances F-test the variances are equal Statistics > Means > Independent samples t-test Mean concentration difference between two new groups (variances are assumed to be equal) Significant

Statistics > Variances > Two variances F-test - insul data Variance ratio test of the two groups Statistics > Variances > Two variances F-test

Independent samples t-test (equal variances) - insul data Independent samples t-test (equal variances)

Multiple comparison(non-parametric) - insul data Multiple comparison(non-parametric) Nonparametric way of comparing (1,2) vs (4,5) Statistics > Nonparametric tests > Two sample Wilcoxon test

Characteristic of data - taillite2 data Characteristic of data resptime(continounous) difference by Vehtype(dichotomous) variable=> Analysis of variance? Looking at only Group=1 variables features vehtype Vehicle type group Light On=1 Light Off=2 position Light Position speedzn Speed Zone resptime Response Time follotme Following Time in Video Frames folltmec Following Time in Categories

문제 4. 4. 1 taillite2. sav 자료를 읽고 이 자료의 분석 목적에 대해서 설명하시오. 4 문제 4. 4.1 taillite2.sav 자료를 읽고 이 자료의 분석 목적에 대해서 설명하시오. 4.2 vehtype에 따른 resptime의 차이가 있는지를 ANOVA를 이용해서 검정하시오. 4.3 원자료의 정규성 검정을 실시하고 결론을 이야기하시오. 4.4 비모수적인 방법으로 vehtype에 따른 resptime의 차이가 있는지를 검정하시오. 4.5 로그변환을 실시하고 정규성 검정을 실시하시오. 4.6 로그변환 변수를 이용해서 ANOVA를 실시하시오 4.7 로그변환 후 비모수 검정을 실시하시오. 4.8 4.2와 4.6 4.4와 4.7의 결과들을 비교 설명하시오

ANOVA Trying ANOVA Statistics > Means > One-way ANOVA - taillite2 data ANOVA Trying ANOVA Statistics > Means > One-way ANOVA Response variable : resptime, Groups : vehtype Grouping variables should be converted as factor variables (Data > Manage variable in active data set > Convert numeric variables to factors) A significant difference between Vehtypes on resptime?

Normality test Normality test - taillite2 data Normality test Normality test Statistics > Summaries > Shapiro-Wilk test of normality For normality test for Vehtype, by(taillite2$resptime, taillite2$vehtype, shapiro.test) Reject the null!! ANOVA can not be conducted.

Kruskal-Wallis test Trying nonparametric way (Kruskal-Wallis test) - taillite2 data Kruskal-Wallis test Trying nonparametric way (Kruskal-Wallis test) Statistics > Nonparametric tests > Kruskal-Wallis test p=0.259 No difference between groups!

- taillite2 data Make new variable Data > Manage variable in active data set > Compute new variable New variable name : lresp Expression to compute : log(resptime)

Normality test for lresp - taillite2 data Normality test for lresp Edit command line as by(taillite2$lresp, taillite2$vehtype, shapiro.test)

ANOVA Trying ANOVA with lresp p=0.063 What do you conclude? - taillite2 data ANOVA Trying ANOVA with lresp p=0.063 What do you conclude?

Characteristic of data - elctric data Characteristic of data Aim: Selecting variables that affect the variable “peak” (Maximum amount of electricity) and finding the regression equation Statistics > Fit models > Linear regression Create command line first if you want to use the stepwise method for model selection (use step(model) function) variables features housize House Size income Family Income aircapac Air Conditioning Capacity applindx Appliance Index family Number of Family Members peak Peak Hour Electric Load

문제 5. 5. 1 eletric. xls 자료를 읽고 이 자료의 분석 목적에 대해서 설명하시오. 5 문제 5. 5.1 eletric.xls 자료를 읽고 이 자료의 분석 목적에 대해서 설명하시오. 5.2 peak 를 종속변수로 해서 단계적 선택에 의한 회귀분석을 실시하고 해석을 하시오. (family 변수는 제외) Statistics -> Fit models -> Linear Regression

3D graphics

Rcmdr R commander was developed as an easy to use graphical user interface (GUI) for R Rcmdr is not perfect yet, but has been updated Expecting menu screen in Korean and Korean fonts variability