2014년 가을학기 손시운 (ssw5175@kangwon.ac.kr) 지도 교수: 문양세 교수님 데이터 프레임 2014년 가을학기 손시운 (ssw5175@kangwon.ac.kr) 지도 교수: 문양세 교수님.

Slides:



Advertisements
Similar presentations
제철고 프로그래밍언어 2015 가을학기 강의 #2 Python 변수, 입출력, 배열 박성우 POSTECH 컴퓨터공학과 2015 년 9 월 30 일.
Advertisements

6 장. printf 와 scanf 함수에 대한 고찰 printf 함수 이야기 printf 는 문자열을 출력하는 함수이다. – 예제 printf1.c 참조 printf 는 특수 문자 출력이 가능하다. 특수 문자의 미 \a 경고음 소리 발생 \b 백스페이스 (backspace)
1. 2 차원 배열  배열은 동일한 데이터 유형으로 여러 개의 변수를 사용할 경우 같은 이 름으로 지정하여 간편하게 사용할 수 있도록 하는 것으로서 앞에서 1 차원 배열을 공부하였습니다.  2 차원 배열은 바둑판을 생각하면 되며, 1 차원 배열에서 사용하는 첨자를 2.
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
ㅎㅎ 구조체 구조체 사용하기 함수 매개변수로서의 구조체 구조체 포인터와 레퍼런스 구조체 배열.
ㅎㅎ C++ 프로그래밍의 첫 걸음 C++로 프로그래밍한다는 것의 의미 세상에서 가장 간단한 C++ 프로그램
Report #5 - due: 4/13 다음 10*5의 희소 행렬 A, B를 고려하라.
Excel 일차 강사 : 박영민.
제 9 장 구조체와 공용체.
컴퓨터 프로그래밍 기초 [Final] 기말고사
제 09 장 데이터베이스와 MySQL 학기 인터넷비즈니스과 강 환수 교수.
보고서 #7 (기한: 6/2) 2개의 스택, stk1, stk2를 이용하여 큐를 구현하라.
MySQL 및 Workbench 설치 데이터 베이스.
C 8장. 포인터 #include <stdio.h> int main(void) { int num;
데이터 마이닝 - 강의 개요 년 가을학기 강원대학교 컴퓨터과학전공 문양세.
기본적인 SELECT문 작성.
4장. 웹로직 서버상에서의 JDBC와 JTA의 운용
07 그룹 함수 그룹 함수의 개념 그룹 함수의 종류 데이터 그룹 생성 HAVING 절.
5장. 참조 타입.
Heesang kim PL/SQL 3 Heesang kim.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
SqlParameter 클래스 선문 비트 18기 발표자 : 박성한.
컴퓨터 프로그래밍 기초 #02 : printf(), scanf()
Error Detection and Correction
13 인덱스 인덱스의 개념 인덱스의 구조 인덱스의 효율적인 사용 방법 인덱스의 종류 및 생성 방법 인덱스 실행 경로 확인
18강. 데이터 베이스 - II JDBC 살펴보기 Statement객체 살펴보기 Lecturer Kim Myoung-Ho
6장. printf와 scanf 함수에 대한 고찰
Chapter 07. 기본 함수 익히기.
PySpark Review 박영택.
11장. 1차원 배열.
13 인덱스 인덱스의 개념 인덱스의 구조 인덱스의 효율적인 사용 방법 인덱스의 종류 및 생성 방법 인덱스 실행 경로 확인
C#.
Loading data into R 전자전기컴퓨터공학부 G 이승연.
소프트웨어시스템실습 3강: R 프로그래밍 및 데이터 조작
C 프로그래밍 C언어 (CSE2035) (Chap11. Derived types-enumerated, structure, and union) (1-1) Sungwook Kim Sogang University Seoul, Korea Tel:
JA A V W. 03.
사용자 함수 사용하기 함수 함수 정의 프로그램에서 특정한 기능을 수행하도록 만든 하나의 단위 작업
프로그래밍 개요
박성진 컴퓨터 프로그래밍 기초 [09] 배열 part 1 박성진
13. 포인터와 배열! 함께 이해하기 IT응용시스템공학과 김 형 진 교수.
27장. 모듈화 프로그래밍.
강의 개요. 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
Device Driver 임베디드 시스템 I.
Java의 정석 제 5 장 배 열 Java 정석 남궁성 강의 의
2장. 데이터베이스 관리 시스템 데이터베이스 관리 시스템의 등장 배경 데이터베이스 관리 시스템의 정의
Quiz #7 다음 수들을 합병 정렬과 퀵 정렬 알고리즘을 이용하여 오름 차순으로 정렬하였을 때, 데이터 이동 회수를 각각 구하라. 여러분은 정렬 과정을 단계별로 보이면서 이동 회수를 추적해야 한다. 단, 퀵 정렬시에 피봇으로 배열의 왼쪽 첫 번째 원소를 선택한다. 5.
Chapter6 : JVM과 메모리 6.1 JVM의 구조와 메모리 모델 6.2 프로그램 실행과 메모리 6.3 객체생성과 메모리
볼링게임 시스템 3조 오지연, 손수경.
컴퓨터 프로그래밍 기초 - 10th : 포인터 및 구조체 -
08장 쿠키와 세션.
컴퓨터 프로그래밍 기초 - 8th : 함수와 변수 / 배열 -
보고서 #7 (기한: 6/2) 2개의 스택, stk1, stk2를 이용하여 큐를 구현하라.
데이터 마이닝 - 강의 개요 년 가을학기 강원대학교 컴퓨터과학전공 문양세.
Linux/UNIX Programming
디버깅 관련 옵션 실습해보기 발표 : 2008년 5월 19일 2분반 정 훈 승
4장. 데이터 표현 방식의 이해. 4장. 데이터 표현 방식의 이해 4-1 컴퓨터의 데이터 표현 진법에 대한 이해 n 진수 표현 방식 : n개의 문자를 이용해서 데이터를 표현 그림 4-1.
오라클 11g 보안.
Chapter 10 데이터 검색1.
11장 배열 1. 배열이란? 1.1 배열의 개요 1.2 배열의 선언과 사용.
컴퓨터 프로그래밍 기초 - 9th : 배열 / 포인터 -
구조체(struct)와 공용체(union)
Summary of Pointers and Arrays
Android -Data Base 윤수진 GyeongSang Univ. IT 1.
2014년 가을학기 손시운 지도 교수: 문양세 교수님 행렬과 배열 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
어서와 C언어는 처음이지 제21장.
 6장. SQL 쿼리.
                              데이터베이스 설계 및 실습 #6 - SQL 실습 한국외국어대학교 DaPS 연구실                              
13. 포인터와 배열! 함께 이해하기.
6 객체.
20 XMLHttpRequest.
Presentation transcript:

2014년 가을학기 손시운 (ssw5175@kangwon.ac.kr) 지도 교수: 문양세 교수님 데이터 프레임 2014년 가을학기 손시운 (ssw5175@kangwon.ac.kr) 지도 교수: 문양세 교수님

데이터 프레임 직관적으로 데이터프레임은 행과 열의 2차원 구조를 가진 행렬 하지만 각 열이 다른 형식을 취할 수 있다는 점에서 행렬과 다름 employees name salary union “Joe” 55000 TRUE “Jack” 45000 FALSE “Jill” 60000 “Jillian” 50000 “Jim”

데이터 프레임 생성 data.frame() 함수: 데이터 프레임을 생성하는 함수 stringsAsFactors 인수 팩터는 간단하게 벡터에 ‘레벨’이라는 추가 정보가 더해진 것 (자세한 것은 생략) 여기서는 문자 데이터를 팩터가 아닌 벡터로 사용하므로 FALSE로 설정 기본적으로 TRUE로 설정되어 있음

파일로부터 데이터 프레임 생성 read.table() 함수: 파일을 읽고 데이터 프레임으로 연결하는 함수 데이터 파일의 경로를 명시한 후, header 인수에 헤더의 표기 유무를 정의

데이터 프레임 접근 데이터 프레임은 리스트이므로 구성요소의 이름 또는 인덱스를 통해 접근 데이터 프레임이 행렬과 같은 성격이기 때문에 행렬처럼 접근할 수 있음 접근 방법 중 d$kids가 명확하기 때문에 보다 안전

행렬 방식 연산 부분 데이터 프레임 추출 데이터 프레임은 행과 열로 표현하므로, 인덱스를 통해 데이터를 추출 가능

행렬 방식 연산 부분 데이터 프레임 추출 하나의 열을 추출할 경우 데이터 프레임이 아닌, 벡터로 추출됨 이를 방지하기 위해, drop 인수를 FALSE로 명시

행렬 방식 연산 필터링 행렬과 유사하게 필터링이 가능 e.g.) 첫 번째 시험의 점수가 3.0 이상인 학생들의 데이터

행렬 방식 연산 NA 값을 다루는 추가적 방법들 subset() 함수: 필터링을 다루며 NA 값은 처리하지 않음 (ch. 2) subset() 함수에서 examsquiz를 불필요하게 중복하여 작성할 필요가 없음

행렬 방식 연산 NA 값을 다루는 추가적 방법들 경우에 따라 NA가 있는 관측치는 모두 제거할 필요가 있음 complete.cases() 함수: 데이터 프레임의 NA가 없는 행을 TRUE로 반환

rbind(), cbind() 함수 사용 rbind()를 통해 행을 추가하는 경우 cbind()를 통해 열을 추가하는 경우

데이터 프레임 결합 merge() 함수: 두 데이터 프레임을 공통 변수 값을 이용해 하나로 결합 관계형 데이터베이스에서 ‘조인join’ 개념과 유사

데이터 프레임 결합 by.x, by.y 인수: 같은 정보를 갖지만 이름이 다를 경우에 사용

데이터 프레임 결합 원치 않는 중복에 대한 결과 위 경우처럼 오류가 생길 수 있으므로, 결합할 때는 신중히 변수를 결정

데이터 프레임에 함수 적용 (1/2) 리스트에서처럼 데이터 프레임에서도 lapply() 함수를 사용할 수 있음

데이터 프레임에 함수 적용 (2/2) lapply() 함수는 결과를 리스트로 반환 as.data.frame() 함수: 데이터를 데이터 프레임 형태로 바꿔주는 함수 이름과 지역의 관계가 사라졌으므로 가치가 없음 예를 들어, John의 지역은 HI였으나, 정렬 후 MA로 변형 order() 함수를 사용하여 정렬할 것을 권장

order() 함수를 사용한 정렬 order() 함수: 정렬된 데이터의 인덱스를 반환하는 함수 기본적으로 오름차순이며, 내림차순은 “-”를 붙여 음수로 만들어 사용 앞의 예제를 states 기준으로 정렬한 경우