Loading data into R 전자전기컴퓨터공학부 G201449030 이승연.

Slides:



Advertisements
Similar presentations
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
Advertisements

오라클 백업과 복구.
OpenCV 안드로이드 연동 환경설정 OpenCV-Android 를 다운 받습니다.
DB 프로그래밍 학기.
DB 프로그래밍 학기.
Image & Video processing
Power Java 제3장 이클립스 사용하기.
MS-Access의 개요 1강 MOS Access 2003 CORE 학습내용 액세스 응용 프로그램은 유용한 데이터를
Ch.07-5 xml-rpc 사용하기 김상엽.
JSP Programming with a Workbook
제 09 장 데이터베이스와 MySQL 학기 인터넷비즈니스과 강 환수 교수.
블록 속성 정의와 추출 속성 정의 블록을 만들 객체들에 문자를 사용하여 속성을 설명하는 꼬리표에 해당하는 태그를 정의하는
PHP입문 Izayoi 김조흔.
뇌를 자극하는 SQL Server 장. SQL Server 2005 통합 서비스.
웹 서버 동작 HTTP 클라이언트가 서버와 대화하는 방법과 데이터를 서버에서 클라이언트로 전송 하는 방법을 정의한 프로토콜
MySQL 및 Workbench 설치 데이터 베이스.
5장 Mysql 데이터베이스 한빛미디어(주).
4장. 웹로직 서버상에서의 JDBC와 JTA의 운용
Java 기초 (Java JDK 설치 및 환경설정)
07 그룹 함수 그룹 함수의 개념 그룹 함수의 종류 데이터 그룹 생성 HAVING 절.
5장. 참조 타입.
1.4 프로그래밍을 위한 환경 설정.
4-1장. MySQL 제13장.
SqlParameter 클래스 선문 비트 18기 발표자 : 박성한.
13 인덱스 인덱스의 개념 인덱스의 구조 인덱스의 효율적인 사용 방법 인덱스의 종류 및 생성 방법 인덱스 실행 경로 확인
                              데이터베이스 프로그래밍 (소프트웨어 개발 트랙)                               퍼스널 오라클 9i 인스톨.
모바일 자바 프로그래밍 JDBC / WAP Ps lab 오민경.
18강. 데이터 베이스 - II JDBC 살펴보기 Statement객체 살펴보기 Lecturer Kim Myoung-Ho
17강. 데이터 베이스 - I 데이터 베이스의 개요 Oracle 설치 기본적인 SQL문 익히기
학습목표 학습목차 다른 홈페이지의 HTML 파일 코드를 보는 방법에 대해 알아봅니다.
ASP.NET AJAX 비동기 게시판 작성 2007 컴퓨터공학실험( I )
KHS JDBC Programming 4 KHS
Servlet 서블릿 기초 FORM 처리 서블릿의 API 세션과 쿠키 com.oreilly.servelet 패키지
5장 Mysql 데이터베이스 한빛미디어(주).
자바 5.0 프로그래밍.
13 인덱스 인덱스의 개념 인덱스의 구조 인덱스의 효율적인 사용 방법 인덱스의 종류 및 생성 방법 인덱스 실행 경로 확인
웹 어플리케이션 보안 2016년 2학기 3. Mongo db.
사용자 함수 사용하기 함수 함수 정의 프로그램에서 특정한 기능을 수행하도록 만든 하나의 단위 작업
JDBC Lecture 004 By MINIO.
2015학년도 PHP 기말 레포트 로그인 홈페이지 제작.
2장. 데이터베이스 관리 시스템 데이터베이스 관리 시스템의 등장 배경 데이터베이스 관리 시스템의 정의
영상처리 실습 인공지능연구실.
HTTP 프로토콜의 요청과 응답 동작을 이해한다. 서블릿 및 JSP 를 알아보고 역할을 이해한다.
Chapter6 : JVM과 메모리 6.1 JVM의 구조와 메모리 모델 6.2 프로그램 실행과 메모리 6.3 객체생성과 메모리
프로그래밍 원리 Chapter 05 자바스크립트 기초 신한대학교 IT융합공학부 박 호 균.
안드로이드 앱 개발과정 Step1. 기초과정 강사 : 정 훈 희.
ASP.NET AJAX / AJAX Control Toolkit 응용 2008 컴퓨터공학실험( I )
자바 5.0 프로그래밍.
MovieStory 작성자 홍성혁 소속 전자전기컴퓨터공학부 학번
자바 가상 머신 프로그래밍 Chap 10. 자바 컴파일링의 안쪽 ② Pslab 오민경.
5강. 배열 배열이란? 배열의 문법 변수와 같이 이해하는 배열의 메모리 구조의 이해 레퍼런스의 이해 다차원 배열
14강. 세션 세션이란? 세션 문법 Lecturer Kim Myoung-Ho Nickname 블스
CHAP 21. 전화, SMS, 주소록.
2014년 가을학기 손시운 지도 교수: 문양세 교수님 데이터 프레임 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
네트워크 환경 구축과 이미지 전송 호스트/타겟 통신 직렬 통신을 이용한 이미지 전송 수퍼 데몬 BOOTP 환경 구축
01. 개요 네트워크에 있는 컴퓨터와 그룹에 대한 NetBIOS 이름에 대응되는 IP 주소를 찾아주는 서비스
문성우 SQL 실습 Part Ⅰ 문성우.
웹(WWW).
12강. 컨트롤러 컨트롤러 클래스 제작 요청 처리 메소드 제작 뷰에 데이터 전달
오라클 11g 보안.
Chapter 10 데이터 검색1.
세션에 대해 알아보고 HttpSession 에 대해 이해한다 세션 관리에 사용되는 요소들을 살펴본다
발표자 : 이지연 Programming Systems Lab.
1. 입력 데이터 ② 대학, 학과: 대학이 존재하지 않을 경우 학과명을 대학에 입력 학과명은 공백으로 유지 (하단 참조)
슬라이드 쇼의 설정 슬라이드 쇼의 실행 파일과 폴더의 관리 글꼴을 포함해서 저장 웹 페이지로 게시 압축 파일
CHAP 15. 데이터 스토리지.
 6장. SQL 쿼리.
JAVA 프로그래밍 16장 JNLP.
20 XMLHttpRequest.
Ⅰ. 데이터베이스 정의 Ⅱ. MS SQL 서버 Ⅲ. 데이터베이스 인터페이스
Presentation transcript:

Loading data into R 전자전기컴퓨터공학부 G201449030 이승연

This chapter covers 파일에 있는 데이터로 작업하기 관계형 데이터베이스로 작업하기 마무리

파일에 있는 데이터로 작업하기 데이터프레임 구조 이해 - 잘 구조화된 데이터 읽기 가장 쉬운 데이터 형식 : 헤더가 포함된 테이블 구조 행과 열(row & column) 행렬과 마찬가지의 모습을 하고 있지만 행렬과 달리 다양한 변수, 관측치, 범주 등을 표현하기 위해 특화됨 저장되거나 전송되는 데이터 블록의 맨 앞에 위치한 보충 데이터

파일에 있는 데이터로 작업하기 데이터프레임 구조 이해 - 잘 구조화된 데이터 http://win-vector.com/dfiles/car.data.csv 헤더로서 column의 이름 분리자가 콤마일 경우 comma-separated values(.csv)형식 실제 데이터들

파일에 있는 데이터로 작업하기 URL을 통하여 데이터 불러오기 uciCar : 새로운 데이터 프레임 오브젝트 컬럼이나 필드를 콤마로 분리 헤더의 유무

파일에 있는 데이터로 작업하기 불러온 데이터 분석하기 Class() : R 오브젝트의 타입

파일에 있는 데이터로 작업하기 불러온 데이터 분석하기 summary() : R 오브젝트의 요약본

파일에 있는 데이터로 작업하기 불러온 데이터 분석하기 dim() : row, column의 수

파일에 있는 데이터로 작업하기 불러온 데이터 분석하기 help() : 클래스에 관한 도움 문서 제공 help(class(uciCar)) help(“data.frame”)

파일에 있는 데이터로 작업하기 다른 데이터 형식 : .tsv, pipe-separated file, Microsoft Excel workbooks, JSON data, XML read.table() : tab, spaces, pipes등으로 분리된 타입에도 사용 가능 R 패키지 Powerful Flexible

파일에 있는 데이터로 작업하기 의미 있는 데이터 데이터프레임 구조 이해 - 덜 구조화된 데이터 모든 데이터가 항상 사용될 준비가 되지는 않았다 ex) http://mng.bz/mZbu data 불러오기 의미 있는 데이터 using R 문자열을 factor로 자동 변경 X

파일에 있는 데이터로 작업하기 결과화면 의미있는 데이터

파일에 있는 데이터로 작업하기 column이름 설정하기 column 이름 설정 c() : R의 메소드를 벡터로 만들어 주는 명령어 factor : 범주형 변수를 위한 데이터 타입

파일에 있는 데이터로 작업하기 결과화면 Column 이름이 생성됨 Good.Loan의 데이터 값이 BadLoan과 GoodLoan으로 변경 달라진점

파일에 있는 데이터로 작업하기 리스트 생성 반복문 실행 데이터프레임 d에 있는 column의 수 열 데이터프레임 d에 있는 column의 수 반복문 실행되는 동안 데이터의 전체 column이 리스트를 통해 재배치

This chapter covers 파일에 있는 데이터로 작업하기 관계형 데이터베이스로 작업하기 마무리

관계형데이터베이스로 작업하기 다양한 DB 툴 -> 파일로 가져오기 까다로움 가장 중요한 클라이언트 데이터 다양한 DB 툴 -> 파일로 가져오기 까다로움 DB의 데이터로 작업하기에 가장 옳은 방법 : R과 데이터베이스를 바로 연 결 MySQL,  PostgreSQL, H2…

관계형데이터베이스로 작업하기 데이터 예시 PUMS data(Public Use Microdata Sample; American Community Survey) http://www2.census.gov/acs2011_1yr/pums/csv_pus.zip http://www2.census.gov/acs2011_1yr/pums/csv_hus.zip 서버가 없는 데이터베이스 엔진 http://www.h2database.com/html/main.html 데이터베이스 로딩 툴 https://github.com/WinVector/SQLScrewdriver/blob/master/SQLScrewdriver.jar 데이터베이스 브라우저 http://squirrel-sql.sourceforge.net/

관계형데이터베이스로 작업하기 자바 명령어 실행 위해 자바 설치 -> 시스템 변수 편집(java jdk와 jre가 설치되어 있는 곳\bin;) 명령 용이하게 파일은 한 곳에

관계형데이터베이스로 작업하기 Squirrel SQL 설치방법

관계형데이터베이스로 작업하기 Squirrel SQL 설치방법

관계형데이터베이스로 작업하기 Squirrel SQL 설치방법

관계형데이터베이스로 작업하기 Squirrel SqL 설치방법

관계형데이터베이스로 작업하기 Squirrel SQL과 H2가 설치되어 잘 연결된 결과화면 Squirrel SQL H2

관계형데이터베이스로 작업하기 데이터베이스에 데이터 넣기 SQL Screwdriver XML configuration file

관계형데이터베이스로 작업하기 데이터베이스에 데이터 넣기 SQL Screwdriver XML configuration file MySQL, PostgreSQL SQL Screwdriver XML configuration file

관계형데이터베이스로 작업하기 데이터베이스에 데이터 넣기 H2 화면 Squirrel SQL 화면

관계형데이터베이스로 작업하기 데이터베이스에 데이터 넣기 H2 화면 Squirrel SQL 화면

DB드라이버가 로드되기 전에 여분의 메모리를 위한 자바 옵션 설정 관계형데이터베이스로 작업하기 데이터베이스에 있는 데이터를 R로 불러오기 DB드라이버가 로드되기 전에 여분의 메모리를 위한 자바 옵션 설정

관계형데이터베이스로 작업하기 데이터베이스에 있는 데이터를 R로 불러오기 패키지 설치 후 불러오기

XML database configuration과 같이 데이터베이스 드라이버의 이름 명료화 관계형데이터베이스로 작업하기 데이터베이스에 있는 데이터를 R로 불러오기 XML database configuration과 같이 데이터베이스 드라이버의 이름 명료화

열 이름을 문자열로 묶을 때 작은 따옴표를 식별자로 관계형데이터베이스로 작업하기 데이터베이스에 있는 데이터를 R로 불러오기 열 이름을 문자열로 묶을 때 작은 따옴표를 식별자로

관계형데이터베이스로 작업하기 데이터베이스에 있는 데이터를 R로 불러오기 DB로 연결

hus 테이블에서 ORIGRANDGROUP<=1의 조건을 만족하는 튜플 추출 -> dhus로 관계형데이터베이스로 작업하기 데이터베이스에 있는 데이터를 R로 불러오기 hus 테이블에서 ORIGRANDGROUP<=1의 조건을 만족하는 튜플 추출 -> dhus로

관계형데이터베이스로 작업하기 데이터베이스에 있는 데이터를 R로 불러오기 IN아래의 조건을만족하는 hus.SERIALNO 값들 과 같은 값을 가지는 pus테이블 안의 SERIALNO 데이터를 dpus로

관계형데이터베이스로 작업하기 데이터로부터 subset 선택하기 자료요약함수, 데이터프레임의 부분집합을 추출할 때 편리한 함수

관계형데이터베이스로 작업하기 Recoding Variables : 가독성 위하여 변수 recoding Reorder levels of factor Ex) 레퍼런스 M을 만들어서 F가 M으로부터 다르게 부호화

관계형데이터베이스로 작업하기 Recoding Variables : 가독성 위하여 변수 recoding 1~7

관계형데이터베이스로 작업하기 Recoding Variables : 가독성 위하여 변수 recoding 1~24

관계형데이터베이스로 작업하기 Recoding Variables : 가독성 위하여 변수 recoding

관계형데이터베이스로 작업하기 Recoding Variables : 가독성 위하여 변수 recoding

관계형데이터베이스로 작업하기 as.factor() 명령어 levels라 불리는 값들 각 level은 지시자 변수(indicator variable) 역할을 한다 levels라 불리는 값들 Null값 처리를 위해 호스트 변수와 함께 사용하는 변수

관계형데이터베이스로 작업하기 Summary()

This chapter covers 파일에 있는 데이터로 작업하기 관계형데이터베이스로 작업하기 마무리

The end 마무리 데이터 프레임의 정의 구조 이해하기 파일과 데이터베이스로부터 데이터 불러오기 큰 규모의 dataset -> 데이터베이스로부터 직접 연결 Chap3 : explore, examine, summarize 추천! The end