Proc freq data = "c:/test/hsb2"; /* c 디렉토리의 test 폴더에 hsb2 데이터를 이용하여 freq 라는 sas 의 procedure 를 실행한다 tables female / binomial(p=.5); /* tables 는 freq 의 대상.

Slides:



Advertisements
Similar presentations
파이썬 (Python). 1 일 : 파이썬 프로그래밍 기초 2 일 : 객체, 문자열 3 일 : 문자인코딩, 정규표현식, 옛한글 4 일 : 파일 입출력 5 일 : 함수와 모듈 6 일 : 원시 말뭉치 다루기 실습 7 일 : 주석 말뭉치 다루기 실습 8 일 : 웹 데이터로.
Advertisements

6 장. printf 와 scanf 함수에 대한 고찰 printf 함수 이야기 printf 는 문자열을 출력하는 함수이다. – 예제 printf1.c 참조 printf 는 특수 문자 출력이 가능하다. 특수 문자의 미 \a 경고음 소리 발생 \b 백스페이스 (backspace)
1. 2 차원 배열  배열은 동일한 데이터 유형으로 여러 개의 변수를 사용할 경우 같은 이 름으로 지정하여 간편하게 사용할 수 있도록 하는 것으로서 앞에서 1 차원 배열을 공부하였습니다.  2 차원 배열은 바둑판을 생각하면 되며, 1 차원 배열에서 사용하는 첨자를 2.
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
제13장 로지스틱회귀분석.
proc freq data = "c:/test/hsb2";
재료수치해석 HW # 박재혁.
제 7 장 함수 사용을 통해 엑셀 정복하기.
표본분포 Sampling Distribution
구간추정 (Interval Estimation)
4.3.3 초기하분포 (Hypergeometric distribution)
3일차 - 가설검정.
㈜디아이씨 SSLVPN 협력사 접속방법 2017년 4월.
각 행 (row) 에서 같은 첨자가 있는 곳은 비워두고, 그 밖에 cell에 수준수 (level) 또는 반복수를 기입
Excel 일차 강사 : 박영민.
Ⅱ. 측정(Measure) (2) Gage R&R (Crossed) – ANOVA 방법 [1] Data 입력
Report #2 - Solution 문제 #1: 다음과 같이 프로그램을 작성하라.
자료분석 및 통계활용.
비모수통계.
통계분석 특강(속성) 서구원 한양사이버대학교 미디어MBA.
제12주 회귀분석 Regression Analysis
윤성우의 열혈 C 프로그래밍 윤성우 저 열혈강의 C 프로그래밍 개정판 Chapter 12. 포인터의 이해.
Keller: Stats for Mgmt & Econ, 7th Ed 표본분포 Sampling Distributions
테이블 : 데이터베이스를 구성하는 요소로 같은 성격에 정보의 집합체. 레코드 : 하나의 정보를 가지고 있는 컬럼의 집합체
비모수 분석 및 복습.
07 그룹 함수 그룹 함수의 개념 그룹 함수의 종류 데이터 그룹 생성 HAVING 절.
SqlParameter 클래스 선문 비트 18기 발표자 : 박성한.
SPSS 이용한 논문 통계 강좌 우송대학교 IT 경영학과 하임숙
Tail-recursive Function, High-order Function
Chapter 07. 기본 함수 익히기.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
ANOVA.
상관분석 (p , p ).
C 프로그래밍 C언어 (CSE2035) (Chap11. Derived types-enumerated, structure, and union) (1-1) Sungwook Kim Sogang University Seoul, Korea Tel:
제 4장 독립표본 t검증 대응표본 t검증 강 사 : 김 효 창.
프로그래밍 개요
인터넷응용프로그래밍 JavaScript(Intro).
13장 카이제곱(χ2)분석 2019년 2월 24일 오전 3시 39분2019년 2월 24일 오전 3시 39분
SPSS 강원대학교 생물학과 석사 과정생 김자경.
(independent variable)
10장 두 개의 모집단에 대한 추론 2019년 4월 5일 오후 4시 22분2019년 4월 5일 오후 4시 22분
1. 비모수 검정 모수 통계학과 비모수 통계학 모수통계학 (Parametric Statistics) 에서는 표본이 추출된 모집단의 분포에 대한 가정이 꼭 필요 하지만 질적자료나 모집단의 분포에 대한 가정이 필요 없는 양적 자료의 경우에는 모수통계학을 적용할 수 없음 이때는.
8장. spss statistics 20의 데이터 변환
두 모집단에 대한 검정.
논문작성을 위한 연구모형 설정 양동훈.
제3장 함수와 배열수식 전진환
디버깅 관련 옵션 실습해보기 발표 : 2008년 5월 19일 2분반 정 훈 승
Chapter 4: 통계적 추정과 검정 Pilsung Kang
Sampling Distributions
Intelligent Systems and Control Lab. Dept. of EE, Yeungnam Univ.
에어 PHP 입문.
Excel 일차 강사 : 박영민.
Tensorboard in Windows
Chapter 10 데이터 검색1.
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
11장 배열 1. 배열이란? 1.1 배열의 개요 1.2 배열의 선언과 사용.
비교분석 보고서 Template 2015.
상관계수.
Numerical Analysis Programming using NRs
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
제 8장 일반화 선형모형 회귀분석, 분산분석, 다변량분산분석 및 부분 상관분석이 가능 GLM 절차
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
제 29 강 스트링(string) 다루기 s a i s . s T i h t g r i n.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
9장. spss statistics 20의 데이터 변수계산
문제의 답안 잘 생각해 보시기 바랍니다..
Report #2 (기한: 3/16) 데이터 구조 과목의 수강생이 50명이라고 가정한다. 이 학생(학번은 2016????으로 표현됨)들의 중간 시험(0~100), 기말 시험(0~100) 성적을 성적 파일에 작성하라(프로그램을 통해서 또는 수작업으로). 성적 파일을 읽어들여서.
6 객체.
Presentation transcript:

proc freq data = "c:/test/hsb2"; /* c 디렉토리의 test 폴더에 hsb2 데이터를 이용하여 freq 라는 sas 의 procedure 를 실행한다 tables female / binomial(p=.5); /* tables 는 freq 의 대상 변수를 지정하는 것으로 여기에서는 tables female 이기에 female 이 대상변수가 된다. /* / 는 옵션을 지정할 때 사용하는 것 binomial 은 sas 의 함수로 이항분포함수를 의 미하는 것으로 p=0.5 는 그 확률이 0.5 인지를 검정하도록 지정한다. 0.5 는 female 변수의 0 또는 먼저 코딩된 값의 비율을 의미한다 exact binomial; /* 이항함수분포의 정확검정도 시도해봐라 run; 정확검정의 양측검정 p 값을 보아야

npar tests Spss 에서 비모수 검정을 시작할 때 사용, NPTESTS 도 사용됨 /binomial (.5) = female. 0.5 는 female 변수의 0 또는 먼저 코딩된 값의 비율을 의미한다 이항분포함수의 p=0.5 인지 검정하는 것으로 변수는 = 다음에 나오므로 해당 변수 는 female 이다 주의할 점은 끝에 점이 있다 분석 - 비모수 검정 - 일표본 필드에서 female 을 선택하고, 설정에서 관측확률과 가설값 비교 ( 카이제곱검정을 선택하고 옵션은 50:50 이므로 변경하지 않는다. 만일 60: 40 이면 별도로 입력하여 야 함다.

setwd("c:/test") hsb2=read.csv("c:/test/hsb2.csv") attach(hsb2) table(female) chisq.test(table(female)) library(Rcmdr) 후에 데이터 - 활성 데이터셋에 있는 변수 관리하기 선택후에 수치변수를 요인으로 변환하기 female 선택 후에 숫자사용하기 newfemale 새로운 변수로 저장하고 통계 - 요약 - 빈도분포 female 선택후에 카이제곱 적합성 검정 ( 오직하나의 변수 ) 클릭 후 예 비율을 입력할 수 있음

setwd("c:/test") hsb2=read.csv("c:/test/hsb2.csv") attach(hsb2) table(female) probs<-c(0.6,0.4) 0.6 과 0.4 라는 ( 행벡터 ) 값을 probs 라는 변수로 저장하라 chisq.test(table(female),p=probs) Female 이라는 빈도를 계산 후에 chisquare 검정을 하는데, 확률 p 는 probs 변수에 있는 ( 행벡터 ) 값을 사용한다. R 의 경우는 sas 와 spss 와 달리, 두개의 기대 확률을 모두 써야 계산이 된다

proc freq data = "c:/test/hsb2"; /* c 디렉토리의 test 폴더에 hsb2 데이터를 이용하여 freq 라는 sas 의 procedure 를 실행한다 tables race / chisq testp=( ); /* tables 는 freq 의 대상 변수를 지정하는 것으로 여기에서는 tables race 이기에 race 가 대상변수가 된다. / 는 옵션을 지정할 때 사용하는 것 Chisq 는 카이스퀘어 통계량을 계산하라는 명령 testp=( ) 는 4 개 범주의 상대빈도 가정이 맞는지 검정을 하 라는 명령 run;

npar test Spss 에서 비모수 검정을 시작할 때 사용, NPTESTS 도 사용됨 /chisquare = race Chisquare 검정을 하되 변수는 = 다음에 나옴. 이경우는 race 가 chisquare 검정을 하는 변수임 /expected = 기대빈도는 순서대로 다음과 같다 주의할 점은 끝에 점이 있다 분석 - 비모수 검정 race 만 남겨둠 설정에서 카이제곱검정에서 옵션을 누르 을 순서대로 입 력

proc freq data = "c:/test/hsb2"; /* c 디렉토리의 test 폴더에 hsb2 데이터를 이용하여 freq 라는 sas 의 procedure 를 실행한다 tables schtyp*female / expected chisq; /* tables schtyp*female 는 schtyp 을 행에 female 을 열에 놓고 빈도수를 세는 것 / expected chisq; /* expected 는 기대빈도를 출력 chisq 는 카이스퀘어 통계량을 계 산하는 것 ; run;

Crosstabs /* sas 의 proc freq 와 유사한 것 /tables = schtyp by female /*tables 는 표를 만들라는 명령어, 앞에 나오는 것이 행, 뒤에 나오는 것이 열이고 sas 는 * 를 사용했지만 spss 는 by 를 사용 /statistic = chisq. /* 카이스퀘어 통계량을 프린트 하는 것 분석 - 기술통계 - 교차분석 통계량 카이제곱 셀 기대빈도

setwd("c:/test") hsb2=read.csv("c:/test/hsb2.csv") attach(hsb2) /* 이는 sas 의 data= 과 유사한 기능 table(schtyp, female) /* 빈도수를 세는 것으로 행렬을 지정 chisq.test(schtyp, female) /*chisq.test 는 카이스퀘어 검정을 하라는 함수 fisher.test(schtyp, female)

library(Rcmdr) 후에 데이터 - 활성 데이터셋에 있는 변수 관리하기 선택후에 수치변수를 요인으로 변환하기 female 선택후에 숫자사용하기 새로운 변수 newfemale 로 저장 하고 schtyp 선택후에 숫자사용하기 새로운 변수 newschtyp 로 저장하 고 통계 - 분할표 - 이원표 변수 선택 통계를 눌러 fisher exact 검정을 할 수 있음

단일 표본에서 평균 차이가 있는가 write 라는 변수의 평균이 50 과 통계적으로 다른가 하는 테스트 proc ttest data = "c:/test/hsb2" h0 = 50; /* proc ttest 는 ttest 프로시져를 하라는 것 ttest 프로시져는 t 검정을 하는 프로시져 /* h0 = 50 는 귀무가설의 평균이 50 임을 지정 var write; /* 변수를 지정하는 것으로 변수를 지정할 때 ttest 프로시져는 var 를 사용한다 var 를 쓴 다음에 변수명을 쓰면 된다 run;

t-test /* sas 의 proc ttest 와 동일 /testval = 50 /*sas 의 h0=50 과 동일, test value 의 줄임말 /variable = write. /*sas 의 var write; 와 동일

setwd("c:/test") hsb2=read.csv("c:/test/hsb2.csv") t.test(hsb2$write, alternative='two.sided', mu=50,conf.level=0.95) /* hsb2$write 는 hsb2 데이터에 있는 write 변수를 t 검정을 하는 것, alternative='two.sided', 는 양측검정을 하는 것, mu=50 는 평균 이 50 을 검정하라는 것, conf.level=0.95 는 신뢰수준이 95% 라는 것 t.test(hsb2$write, mu=50)

후에 데이터셋 활성화하고, 통계 - 평균 - 일표본 T 검정 write 선택하고 mu 에 50 쓰기

proc univariate data = "c:\test\hsb2"; /* 기술 통계량을 얻으려고 할 경우 proc univariate 를 사용한다 /*var write; var 를 쓰고 변수명을 쓰면 된다 proc univariate data = "c:\test\hsb2" loccount mu0 = 50; /* loccount mu0 = 50 는 중위수 즉 미디언이 50 인지를 검정하라 는 것 location count run;

NPTESTS /* 비모수 검정을 시작한다 /ONESAMPLE TEST (write) WILCOXON(TESTVALUE=50) /* 일표본 샘플 검정을 하되 변수는 write 이고 Wilcoxon 부호검정 을 하되, 테스트 값은 50 으로 write 의 미디언이 50 인지를 검정하 라는 것 /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE /CRITERIA ALPHA=0.05 CILEVEL=95.

setwd("c:/test") hsb2=read.csv("c:/test/hsb2.csv") wilcox.test(hsb2$write,alternative='two.sided',mu=50,conf.level= 0.95) /* 미디언 검정을 할 때에는 wilcox.test 함수를 이용한다. 그리고 변수명을 쓰고 mu=50 은 미디언이 50 인지를 검정하라는 것이다. wilcox.test(hsb2$write,mu=50)

proc ttest data = "c:/test/hsb2"; /* 두개의 독립 표본의 평균 차이를 할 때에도 proc ttest 사용, 두개의 독립표본이란 남자와 여자 표본을 의미 class female; /* 표본이 female 이라는 것으로 구분, class female 이란 female 변수 값 별로 평균 비교를 한다는 뜻 var write; /* 평균차이를 볼 변수는 write run; 결과에서 Equality of Variances 의 p 값이 0.05 보다 크면 Pooled, 0.05 보다 작으면 Satterthwaite 로 보아야 한다

t-test groups = female(0 1) /* 평균 차이 검정을 하는데 집단은 female 변수에 있고 현재 female 변수의 값은 0 과 1 로 되어 있다 /variables = write. /* 평균을 비교하는 변수는 write 이다

setwd("c:/test") hsb2=read.csv("c:/test/hsb2.csv") attach(hsb2) hsb2 <- within(hsb2, { newfemale <- as.factor(female)}) leveneTest(write ~ newfemale, data=hsb2, center="mean") 분산의 동질성을 검정하는데 집단은 newfemale 이고, 변수는 write 이 다. 데이터는 female 을 newfemale 로 변환한 hsb2 이다. 결과에서 p 가 0.05 보다 작기 때문에 아래의 var.equal=FALSE 이 사용되었다. P 가 0.05 보다 크면 var.equal=TRUE 를 써야 한다 t.test(write~newfemale, alternative='two.sided', conf.level=.95, var.equal=FALSE,data=hsb2) 두집단의 평균 비교를 하는데 집단은 newfemale 이고 평균을 비교하 는 변수는 write 이고, 데이터는 hsb2 이다

대응표본 proc ttest data = "c:/test/hsb2" ; /* 대응 표본 평균 차이를 할 때에도 proc ttest 사용, paired write*read; run; /* 다만 대응 표본인 경우는 class 변수명을 하지 않고 paired 를 사용한 후 변수명 * 변수명을 하면 됨

T-TEST PAIRS=read WITH write. /* t 검정을 하되 pairs 는 대응표본임을 명시하고 변수 사이에 with 를 씀

setwd("c:/test") hsb2=read.csv("c:/test/hsb2.csv") t.test(hsb2$write,hsb2$read,paired=TRUE) /* t.test 함수를 이용하되 paired=TRUE 를 써서 대응표본 임을 명 시 library(Rcmdr) 통계 평균 paired t 검정 변수선택

Wilcoxon-Mann-Whitney test (1 독립변 수 2 독립적 그룹 종속변수는 순위변수 ) 종속변수가 순서변수, 1 등급, 2 등급 등 proc npar1way data = "c:/test/hsb2" wilcoxon; /* 비모수 검정 프로시저 npar1way 사용, wilcoxon 두 샘플 테스 트 사용 class female; var write; run; 정규분포 접근 z 검정을 사용하여야 함

npar test /m-w = write by female(0 1). *Nonparametric Tests: Independent 분석 - 비모수검정 - 독립표본 검정필드에 writing 집단에 female 설정 누르고 Mann-Whitney

setwd("c:/test") hsb2=read.csv("c:/test/hsb2.csv") attach(hsb2) hsb2 <- within(hsb2, { newfemale <- as.factor(female)}) with(hsb2, tapply(write, newfemale, mean, na.rm=TRUE)) wilcox.test(write ~ newfemale, alternative="two.sided", data=hsb2) library(Rcmdr) 후에 데이터 - 활성 데이터셋에 있는 변수 관리하기 선택후에 수치변수를 요인으로 변환하기 female 선택후에 숫자사용하기 새로운 변수 newfemale 로 저장하고 통계 - 비모수검정 - 이표본 wilcoxon 선택기능에서 정규 근사 사용할 수 있음

proc glm data = "c:/test/hsb2"; class prog; model write = prog; means prog/scheffe; run;