SAS 기초 1. SAS 프로그램 형식 2. SAS 자료 입력 저장 3. 데이터세트 명령어 4. 기초적인 프로시저.

Slides:



Advertisements
Similar presentations
10-7 부동소수점 (Floating-Point) 계산  컴퓨터에서 숫자를 표기하는 방법  가수 (Fraction) : 부호화된 고정소수점 숫자 지수 (Exponent) : 소수점의 위치를 표시 ( 예 )10 진수 를 표기하면 Fraction Exponent.
Advertisements

Ⅰ. 연산자 Ⅱ. 제어 구조. 연산자 : 할당 연산자 - 사용자가 정의한 변수에 임의의 값을 저장하는 기능 strvar = strVar1+ “ Hello ”
파이썬 (Python). 1 일 : 파이썬 프로그래밍 기초 2 일 : 객체, 문자열 3 일 : 문자인코딩, 정규표현식, 옛한글 4 일 : 파일 입출력 5 일 : 함수와 모듈 6 일 : 원시 말뭉치 다루기 실습 7 일 : 주석 말뭉치 다루기 실습 8 일 : 웹 데이터로.
Python Ch.06 RaspberryPi Sejin Oh. Raspberry Pi Python  IDLE(Integrated Development Environment)  라즈베리 파이 배포본들은 일반적으로 파이썬과 파이썬 3 의 IDLE 파 이썬 개발 도구를.
변수와 조건문 빛나리 36 호 박승운. 파이썬 쉽게 사용하기 Python IDLE 사용 FILE - New File 로 파일 만들기 Run – Run Module 로 실행하기.
6 장. printf 와 scanf 함수에 대한 고찰 printf 함수 이야기 printf 는 문자열을 출력하는 함수이다. – 예제 printf1.c 참조 printf 는 특수 문자 출력이 가능하다. 특수 문자의 미 \a 경고음 소리 발생 \b 백스페이스 (backspace)
1 08 배열. 한국대학교 객체지향연구소 2 C 로 배우는 프로그래밍 기초 2 nd Edition 배열  동일한 자료유형의 여러 변수를 일괄 선언  연속적인 항목들이 동일한 크기로 메모리에 저장되는 구조  동일한 자료 유형이 여러 개 필요한 경우에 이용할 수 있는.
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
Part 03 상수, 변수, 자료형 ©우균, 창병모 © 우균, 창병모.
데이터형, 변수, 연산자 컴퓨터 응용 및 실습 I.
제 7 장 함수 사용을 통해 엑셀 정복하기.
2장. 프로그램의 기본 구성. 2장. 프로그램의 기본 구성 2-1"Hello, World!" 들여다 보기 /* Hello.c */ #include int main(void) { printf("Hello, World! \n"); return 0;
Image & Video processing
Excel 일차 강사 : 박영민.
데이터 파일 C 데이터 파일과 스트림(Stream) 텍스트 파일 처리
3장. 변수와 연산자. 3장. 변수와 연산자 3-1 연산자, 덧셈 연산자 연산자란 무엇인가? 연산을 요구할 때 사용되는 기호 ex : +, -, *, / 3-1 연산자, 덧셈 연산자 연산자란 무엇인가? 연산을 요구할 때 사용되는 기호 ex : +, -, *, /
롯데마트 CRM 데이터 분석 교육 2014년 12월 > RE::VISION 전용준 리비젼컨설팅 대표
롯데마트 CRM 데이터 분석 교육 2014년 12월 > RE::VISION 전용준 리비젼컨설팅 대표
제 3장. 수치를 통한 연속형 자료의 요약.
07 그룹 함수 그룹 함수의 개념 그룹 함수의 종류 데이터 그룹 생성 HAVING 절.
학습목표 변수 비주얼 베이직 자료형 변수 선언하기. 학습목표 변수 비주얼 베이직 자료형 변수 선언하기.
Heesang kim PL/SQL 3 Heesang kim.
8장 함수 함수의 필요성 라이브러리 함수와 사용자 정의 함수 함수의 정의, 원형, 호출 배열을 함수 인자로 전달 재귀호출.
SqlParameter 클래스 선문 비트 18기 발표자 : 박성한.
컴퓨터 프로그래밍 기초 #02 : printf(), scanf()
2주차: 변수, 수식, Control Flow.
6장. printf와 scanf 함수에 대한 고찰
제 10장 주성분 분석(PCA) 주성분 분석(PCA)이란? 여러 개의 양적변수들 사이의 분산-공분산 관계를
KIM HEESANG PL/SQL 2 KIM HEESANG
11장. 1차원 배열.
제 2장 SAS 프로그램의 구성 DATA 단계와 PROC(EDURE) 단계
C 2장. C 프로그램 시작하기 #include <stdio.h> int main(void) { int num;
MATLAB
사용자 함수 사용하기 함수 함수 정의 프로그램에서 특정한 기능을 수행하도록 만든 하나의 단위 작업
어서와 C언어는 처음이지 제14장.
UNIT 07 Memory Map 로봇 SW 교육원 조용수.
이름 : 황 상 두 전화번호 : 이메일 : PinTool 이름 : 황 상 두 전화번호 : 이메일 :
3장 상수 변수 기본 자료형 키워드와 식별자 상수와 변수 기본 자료형 형변환 자료형의 재정의.
Device Driver 임베디드 시스템 I.
3장. 변수와 연산자 교안 : 전자정보통신 홈페이지 / 커뮤니티/ 학술세미나
Lesson 2. 기본 데이터형.
Chapter6 : JVM과 메모리 6.1 JVM의 구조와 메모리 모델 6.2 프로그램 실행과 메모리 6.3 객체생성과 메모리
ITQ 정보기술자격 국가공인 Excel 2007 Ⅱ 함수- 11회차 강사 : 박영민.
프로그래밍 원리 Chapter 05 자바스크립트 기초 신한대학교 IT융합공학부 박 호 균.
컴퓨터 프로그래밍 기초 - 10th : 포인터 및 구조체 -
2장. 변수와 타입.
Chapter 2: 데이터의 요약 및 표현 Pilsung Kang
5장 선택제어문 if 선택문 switch-case 선택문 다양한 프로그램 작성 조건 연산자.
제 11장 인자분석(Factor Analysis)
^^ Computer Programming 2 dmpr.cnu.ac.kr/~daygax.
함수(Function) ◈ 함수의 개념 및 사용 이유 ◈ 함수 정의, 호출 및 선언 ◈ 지역변수와 전역변수 ◈ return 문
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
Excel 일차 강사 : 박영민.
제3장 함수와 배열수식 전진환
디버깅 관련 옵션 실습해보기 발표 : 2008년 5월 19일 2분반 정 훈 승
Chapter 4: 통계적 추정과 검정 Pilsung Kang
Excel 일차 강사 : 박영민.
4장. 데이터 표현 방식의 이해. 4장. 데이터 표현 방식의 이해 4-1 컴퓨터의 데이터 표현 진법에 대한 이해 n 진수 표현 방식 : n개의 문자를 이용해서 데이터를 표현 그림 4-1.
2장 PHP 기초 PHP의 시작과 끝을 이해한다. 주석문에 대하여 이해한다. echo 문을 이용하여 화면에 출력하
Homework #12 (1/2) 프로그램을 작성하고, 프로그램과 실행 결과를 프린트하여 제출한다.
Chapter 10 데이터 검색1.
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
16장. 변수, 연산자, 사용자 정의 함수 변수 배열과 객체 연산자 함수.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
8장 선택 논리 II 1. 논리연산자 1.1 논리연산자 : AND (&&) 1.2 논리연산자 : OR (||)
실습과제 (변수와 자료형, ) 1. 다음 작업 (가), (나), (다)를 수행하는 프로그램 작성
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
RPTree 코드분석 (월) Dblab 김태훈.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
Docker Study 6~7.
Presentation transcript:

SAS 기초 1. SAS 프로그램 형식 2. SAS 자료 입력 저장 3. 데이터세트 명령어 4. 기초적인 프로시저

 SAS 프로그램의 두 단계  DATA 단계  DATA 단계 · 새로운 SAS data set 생성 · 새로운 SAS data set 생성 · 기존 data 를 가공 · 처리하여 새로운 data set 생성 · 기존 data 를 가공 · 처리하여 새로운 data set 생성  PROC(PROCEDURE) 단계  PROC(PROCEDURE) 단계 · SAS data set 자료를 분석하는 단계 · SAS data set 자료를 분석하는 단계 1. SAS 프로그램 형식 (1/3)

 SAS 프로그램 시 유의사항 ▪ 한 명령문은 중심어로 시작하고 반드시 세미콜론 (;) 으로 끝낸다. ▪ 한 명령문은 중심어로 시작하고 반드시 세미콜론 (;) 으로 끝낸다. ▪ 대문자, 소문자 구별이 없다. ▪ 대문자, 소문자 구별이 없다. ▪ 한 문장을 여러 줄에 사용 가능하다. ▪ 한 문장을 여러 줄에 사용 가능하다. ▪ 여러 문장을 한 줄에 작성 가능하다. 이 때 문장과 문 장 사이는 반드시 세미콜론 (;) 사용한다. ▪ 여러 문장을 한 줄에 작성 가능하다. 이 때 문장과 문 장 사이는 반드시 세미콜론 (;) 사용한다. 1. SAS 프로그램 형식 (2/3) 중심어 (keyword) 인자 (parameter) …. 선택사항 (option) ;

 중심어  변수 ( 인자 ) 이름 ▪ 첫 문자는 알파벳 (A ∼ Z) 이나 밑줄 (_) 로 시작하고, 두 번째 문자는 알파벳, 숫자, 밑줄 모두 사용 가능. 두 번째 문자는 알파벳, 숫자, 밑줄 모두 사용 가능. ▪ SAS 내부에서 정한 예약어를 쓸 수 없다. 1. SAS 프로그램 형식 (3/3) DATA, INPUT, INFILE, FILE, CARDS, PROC, RUN …

1 SAS library 만들기  메뉴 방식  메뉴 방식 2. SAS 자료 입력 저장 (1/12)

 프로그램 방식 ( 라이브러리 생성 ) LIBNAME 라이브러리이름 ‘ 디렉토리경로명 ’; [ 예제 4.1] LIBNAME STAT 'c:\SAMPLE'; data STAT.a; input gender $ age score cards; m f f ; run; 2. SAS 자료 입력 저장 (2/12)

2 EXCEL 파일 읽기와 저장  EXCEL 파일 읽기 - 메뉴 방식  EXCEL 파일 읽기 - 메뉴 방식 파일 → 데이터 가져오기 2. SAS 자료 입력 저장 (3/12)

 EXCEL 파일로 저장 - 메뉴 방식  EXCEL 파일로 저장 - 메뉴 방식 파일 → 데이터 내보내기 2. SAS 자료 입력 저장 (4/12)

 EXCEL 파일 읽기 – 프로그램 방식  EXCEL 파일 읽기 – 프로그램 방식 PROC IMPORT OUT = msyun.aa DATAFILE = "C:\sample\sample1.xls" DBMS = EXCEL2000 REPLACE; RANGE = “SHEET1$”; GETNAMES = YES ; RUN; 2. SAS 자료 입력 저장 (5/12)

 EXCEL 파일로 저장 – 프로그램 방식  EXCEL 파일로 저장 – 프로그램 방식 PROC EXPORT OUT = msyun.bb OUTFILE = "C:\sample\sample2.xls" DBMS = EXCEL2000 REPLACE; RUN; 2. SAS 자료 입력 저장 (6/12)

3 텍스트 파일 읽기  텍스트 파일 읽기 - 메뉴 방식  텍스트 파일 읽기 - 메뉴 방식 파일 → 데이터 가져오기 2. SAS 자료 입력 저장 (7/12)

 텍스트 파일 읽기 - 프로그램 방식  텍스트 파일 읽기 - 프로그램 방식 DATA ms; INFILE ‘c:\msyun\sample2.dat’ ; INPUT a b c; RUN; 2. SAS 자료 입력 저장 (8/12)

4 SAS 에서 직접 자료 입력 4.1 DATA 문 ( 데이터세트의 형성 ) [ 예제 4.2] DATA sample (KEEP=age); [ 예제 4.2] DATA sample (KEEP=age); RUN; RUN; [ 예제 4.3] DATA sample (DROP=age); [ 예제 4.3] DATA sample (DROP=age); RUN; RUN; DATA 선택사항 ; 2. SAS 자료 입력 저장 (9/12)

[ 예제 4.4] DATA sample1; SET sample; KEEP age ; RUN; [ 예제 4.5] DATA sample1; SET sample; DROP age ; RUN; 2. SAS 자료 입력 저장 (10/12)

4.2 INPUT 문 ( 자료의 입력 및 변수의 지정 )  자유형식 (free format) INPUT 문  고정 입력 방식 (fixed format) INPUT 문 INPUT variables $ INPUT variables $ 시작열 (col.) – 끝열 (col.) 2. SAS 자료 입력 저장 (11/12)

4.3 CARDS 문 ( 프로그램 내에서 자료 입력 ) [ 예제 4.6] DATA x; INPUT gender $ age score CARDS; m f f ; RUN; 2. SAS 자료 입력 저장 (12/12)

3.1 산술 할당문 3.1 산술 할당문 3. 데이터세트를 이용하는 명령어 새로운 변수 = SAS 식 ▶ 산술 할당문의 위치 : INPUT 문 뒤 or SET 문 뒤 [ 예제 3.1] DATA A; SET SAMPLE; TOT1 = hgt + wgt ; TOT2 = TOT1 + food ; RUN;

 연산자  연산자 ▪ 산술 연산자 ▪ 산술 연산자 +( 더하기 ) -( 빼기 ) +( 더하기 ) -( 빼기 ) *( 곱하기 ) /( 나누기 ) **( 지수 ) *( 곱하기 ) /( 나누기 ) **( 지수 ) ▪ 비교 연산자 ▪ 비교 연산자 = or EQ( 같다 ) ^= or NE( 같지 않다 ) = or EQ( 같다 ) ^= or NE( 같지 않다 ) > or GT( 크다 ) or GT( 크다 ) < or LT( 작다 ) >= or GE( 크거나 같다 ) = or GE( 크거나 같다 ) <= or LE( 작거나 같다 ) 3. 데이터세트를 이용하는 명령어

[ 예 3.2] x1=log(x); y=b/a ; y=a*(c+3) ; [ 예 3.3] DATA kim; INPUT a b; c=(a**2)+b;

 SAS 에서 이용되는 함수  SAS 에서 이용되는 함수 ▪ 산술함수 ▪ 산술함수 ABS( 절대값 ), SIGN( 부호 ) ABS( 절대값 ), SIGN( 부호 ) MAX( 최대값 ), M IN( 최소값 ) MAX( 최대값 ), M IN( 최소값 ) ▪ 절단함수 ▪ 절단함수 INT( 소수점 이하를 절단 ) INT( 소수점 이하를 절단 ) ROUND( 지정된 자리에서 반올림 ) ROUND( 지정된 자리에서 반올림 ) 3. 데이터세트를 이용하는 명령어

▪ 표본통계량함수 ▪ 표본통계량함수 MAX, MIN MAX, MIN MEAN ( 평균 ) MEAN ( 평균 ) SUM ( 합 ) SUM ( 합 ) VAR ( 분산 ) VAR ( 분산 ) STD ( 표준편차 ) STD ( 표준편차 ) STDERR ( 표준오차 ) STDERR ( 표준오차 ) 3. 데이터세트를 이용하는 명령어

▪ 특수함수 ▪ 특수함수 LAG ( 지체된 함수 ) LAG ( 지체된 함수 ) DIF ( 현재 값과 지체된 값의 차이 ) DIF ( 현재 값과 지체된 값의 차이 ) => DIFn(x)=x-LAGn(x) => DIFn(x)=x-LAGn(x) 3. 데이터세트를 이용하는 명령어

[ 예제 3.4] DATA A; SET B; average=MEAN (X1, X2, X3); or MEAN(OF X1-X3); RUN; [ 예제 3.5] x=ROUND( ,1); y=ROUND( , 100); z=ROUND( , 0.01); w=INT( );

3. 데이터세트를 이용하는 명령어 [ 예제 3.6] DATA lag_test; INPUT x; y=LAG1(x); z=LAG2(x); datalines; RUN; [ 결과 ] xyz

3. 데이터세트를 이용하는 명령어 [ 예제 3.7] DATA diff_test; INPUT x; v=DIF1(x); w=DIF2(x); datalines; RUN; [ 결과 ] xvw

3.2 IF 문 ( 조건문 ) 1.IF SAS 식 ; 2.IF SAS 식 THEN 명령문 ; 3.IF SAS 식 THEN 명령문 ; ELSE 명령문 ; 4. IF SAS 식 THEN 명령문 ; ELSE IF SAS 식 THEN 명령문 ; ELSE 명령문 ; 3. 데이터세트를 이용하는 명령어

[ 예 3.8] IF gender=. THEN delete; [ 예 3.9] IF ave <= 120 THEN strata=1; ELSE IF 120 < ave <= 125 THEN strata=2; ELSE strata=3;

3.3 SET 문 3.3 SET 문  변수의 복사 3. 데이터세트를 이용하는 명령어 [ 예제 5.10] DATA new; SET old; RUN;

 변수의 부분 선택과 연산 3. 데이터세트를 이용하는 명령어 [ 예제 3.11] DATA new1; SET old; KEEP(DROP) age ; RUN; [ 예제 3.12] DATA new2; SET old; total=hgt+wgt; RUN;

 둘 이상의 SAS 자료를 변수를 기준으로 결합 [ 예제 3.13] [ 예제 3.13] 3. 데이터세트를 이용하는 명령어 name gender Sung M Park F Kim M Lee F DATA new; SET a1 a2; RUN; name gender Moon F Yoon M Oh M Jang F name gender Sung M Park F Kim M Lee F Moon F Yoon M Oh M Jang F + ⇒

3.4 MERGE 문 3.4 MERGE 문  둘 이상의 SAS 자료를 관측치를 기준으로 병합 [ 예제 3.14] [ 예제 3.14] 3. 데이터세트를 이용하는 명령어 name Sung Park Kim Lee year make model 1993 Kia Sephia 2005 Hyundai Sonata 2001 Kia Optima Color Purple Silver Pearl Red

3. 데이터세트를 이용하는 명령어 name year make $ model $ Color $ Sung 1993 Kia Sephia Purple Park 2005 Hyundai Sonata Silver Kim 2001 Kia Optima Pearl Lee... Red DATA new; MERGE a1 a2 a3; RUN;

[ 예제 3.15] [ 예제 3.15] 3. 데이터세트를 이용하는 명령어 Name year make model Sung 1993 Kia Sephia Park 2005 Hyundai Sonata Kim 2001 Kia Optima Name Color Park Purple Yoon Silver Kim Pearl Sung Red Name year make model Color Sung 1993 Kia Sephia Red Park 2005 Hyundai Sonata Purple Kim 2001 Kia Optima Pearl Yoon... Silver

3. 데이터세트를 이용하는 명령어 PROC SORT data=a1; BY name; RUN; PROC SORT data=a2; BY name; RUN; DATA new; MERGE a1 a2 ; RUN; ▶ 반드시 sort 후에 MERGE 할 것 !

3.5 RETAIN 문 3.5 RETAIN 문  방금 읽은 값을 계속 유지하게 하는 명령어로 실행문이 아니라 선언문으로 LAG1 과 같은 역할을 실행문이 아니라 선언문으로 LAG1 과 같은 역할을 한다. 한다. 3. 데이터세트를 이용하는 명령어 RETAIN 변수 ;

 동일한 관측이 겹쳐진 자료의 제거 3. 데이터세트를 이용하는 명령어 [ 예제 3.16] DATA phone; INPUT name $ area $ number CARDS; Sung Moon Oh Ketel Moon Sung RUN; ( 계속 )

3. 데이터세트를 이용하는 명령어 PROC SORT; by name; RUN; DATA phone1; SET phone; RETAIN oldname; IF oldname=name THEN delete; oldname=name; RUN;

PROC PRINT PROC SORT PROC MEANS PROC SUMMARY PROC UNIVARIATE PROC FREQ PROC ttest 4. 기초적인 프로시저

4.1 PROC PRINT ( 자료의 출력 ) PROC PRINT [data=dsn] [ 선택사항 ] ; var 변수명 ; by 변수명 ; run; 4. 기초적인 프로시저

4.2 PROC SORT ( 자료의 정렬 ) 4.2 PROC SORT ( 자료의 정렬 ) PROC SORT [data=dsn] [out=dsn] [ 선택사항 ] ; by [descending] 변수명 ; run; 4. 기초적인 프로시저

4.3 PROC MEANS ( 평균과 관련된 통계량 ) 4.3 PROC MEANS ( 평균과 관련된 통계량 ) PROC MEANS [data=dsn] [ 선택사항 ] ; var 변수명 ; class 변수명 ; output out=[dsn] keyword=[name]; RUN; PROC PRINT data=[dsn]; RUN; 4. 기초적인 프로시저

[ 예제 4.1] [ 예제 4.1] PROC MEANS data=a n mean std sum; PROC MEANS data=a n mean std sum; VAR hgt wgt ; VAR hgt wgt ; OUTPUT out=b mean=mean1 mean2; OUTPUT out=b mean=mean1 mean2; RUN; RUN; PROC PRINT data=bb; PROC PRINT data=bb; RUN; RUN; 4. 기초적인 프로시저

[ 예제 4.2] [ 예제 4.2] proc means data=testdata1; class gender; var height weight bmi; run; proc sort data=testdata1; by gender; run; PROC PRINT data=; PROC PRINT data= testdata1 ;RUN; 4. 기초적인 프로시저

4.4 PROC SUMMARY ( 자료의 요약 ) 4.4 PROC SUMMARY ( 자료의 요약 ) PROC SUMMARY [data=dsn] [ 선택사항 ] ; var 변수명 ; class 변수명 ; output out=[dsn] keyword=[name]; run; 4. 기초적인 프로시저

[ 예제 4.2] [ 예제 4.2] PROC SUMMARY data=b ; PROC SUMMARY data=b ; CLASS gender ; CLASS gender ; VAR age score ; VAR age score ; OUTPUT OUT=bb mean=mean1 mean2; OUTPUT OUT=bb mean=mean1 mean2; RUN; RUN; PROC PRINT data=bb; PROC PRINT data=bb; RUN; RUN; 4. 기초적인 프로시저

4.5 PROC UNIVARIATE ( 분포와 통계량 ) 4.5 PROC UNIVARIATE ( 분포와 통계량 ) PROC UNIVARIATE [data=dsn] [ 선택사항 ] ; var 변수명 ; output out=[dsn] keyword=[name]; run; 4. 기초적인 프로시저

4.6 PROC FREQ ( 도수분포표 및 분할표 ) 4.6 PROC FREQ ( 도수분포표 및 분할표 ) PROC FREQ [data=dsn] [ 선택사항 ] ; tables 변수명 * 변수명 ; weight 변수명 ; run; 4. 기초적인 프로시저

[ 예제 4.3] PROC FREQ data=b ; TABLES gender ; RUN; [ 예제 4.5] PROC FREQ; TABLES x1-x30 ; RUN; [ 예제 4.6] PROC FREQ; TABLES a*(b c) ; RUN; [ 예제 4.4] PROC FREQ; TABLES gender*strata ; RUN; 4. 기초적인 프로시저

proc plot – scatter plot proc plot data=readin1; title ‘scatter plot of accept rate and grad rate’; plot accept_rate*graduate_rate; run;