데이터의 시각화 대전과학고등학교 김종헌.

Slides:



Advertisements
Similar presentations
일정 관리 다이어리 제작 JSP Programming with a Workbook. 학습 목표  사용자의 일정을 관리할 수 있는 다이어리에 대하여 알아보자. JSP Programming with a Workbook2.
Advertisements

Mining the by Graph API. 1. 페이스북 소셜 그래프와 Graph API, OGP 2. 페이스북 페이지와 친구들에서 좋아요 분석하기 3. 소셜 그래프 분석을 위한 결속집단 분석 4. 소셜 그래프 시각화.
R 을 활용하여 실전 분석하기  Review- 비정형데이터 분석 / 그래프 그리기  비정형 데이터로 그래프 그리기 예제 ) 제주도 여행 코스  정형 데이터로 그래프 그리기 예제 1) 라면가격 상승률과 물가상승률 비교 예제 2) 2 호선 역별 승하차인원수 1.
경영통계 제 1 장 통계란 무엇인가 도수분포표. 도수분포 도수분포 상대도수분포 상대도수분포 누적 도수 누적 도수 분석 도구 - 히스토그램 분석 도구 - 히스토그램.
흙과 물에 따른 보리의 성장 초등과학 궁내초 4 학년 이주형, 김민재, 박지우 지도교사 궁내초 채현우, 이경자.
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
2016 유성환 Hybrid MOBILE.
컴퓨터와 인터넷.
가상환경 구축 및 리눅스 터미널 실습 충북대학교 지능로봇연구실.
Electronic Throttle Control
[별첨] 특허 DB 구축 및 토픽 모델링 수행 과정 Flowchart, File List
SEOUL NATIONAL UNIVERSITY OF SCIENCE & TECHNOLOGY
신호처리 실험 (Signal Processing Lab)
제7강 학습 내용 주소지정 방식의 예 값 즉시 지정 방식과 실행 예 레지스터 직접지정 방식 메모리 직접지정 방식과 실행 예
2장 데이터가 가지고 있는 특성을 정리하여 그래프로 표현하기
데이터베이스 및 설계 금오공과대학교 컴퓨터공학부 이 이섭.
레고 Digital Designer 사용법 알아보기
QC 7가지 도구
SEOUL NATIONAL UNIVERSITY OF SCIENCE & TECHNOLOGY
Graph 개론 통계분석을 위한 Excel Chart 기초.
뇌를 자극하는 SQL Server 장. SQL Server 2008 소개.
Keller: Stats for Mgmt & Econ, 7th Ed
DK-128 ADC 실습 아이티즌 기술연구소
SPSS 들어가기 제 4장 영산대학교 간호학과 안혜경 2010년 2학기 물리치료학과
멀티미디어.
Git 사용법 GitHub 가입 GitHub 새 저장소 만들기 Git 설치 로컬 저장소 만들기 로컬 저장소와 원격 저장소 연결
DMAIC 기본 Tools M-2. Y’의 데이터 수집계획.
1학기 물리실험 I 리뷰 Prof. Seewhy Lee.
10장 컴퓨터 기반 데이터 획득 응용 프로그램 LabVIEW 사용법
Loading data into R 전자전기컴퓨터공학부 G 이승연.
치과기공소에서 알아야 할 산업안전보건법
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
타대학 학점인정 신청 매뉴얼 ○포털시스템에 접속하여 로그인.
카카오톡 속의 우리 모습 이 부 일 충남대학교 정보통계학과.
엑셀 피벗 테이블로 분석하고 차트로 시각화하기
4. 도표 다루기.
SAS Statistical Analysis System 통계패키지 실습 (2011년 1학기)
LCD Controller Colorbar
2014년 가을학기 손시운 지도 교수: 문양세 교수님 분류 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
‘그린나래호텔’은 대한민국 공군에서 해운대 해수욕장변에 건축한 군의 복지향상을 위해 지은 군휴양소 건물입니다.
Web & Internet [06] CSS3 응용과 레이아웃
입찰금액절감사유서 적합/부적합 사례 2010년 06월.
(Data Exploration & Analysis)
데이터 탐색 (Data Exploration) 2014년 가을학기 강원대학교 컴퓨터과학전공 문양세.
인터넷응용프로그래밍 MYSQL(phpMyAdmin).
화재발생시 행동요령 1. 발화초기의 안전조치 2. 화재신고 3. 피난유도 및 대피요령
Clipping 이진학.
생활 습관과 학교 성적의 통계분석 조장: 이태훈 조원: 이진원.
컴퓨터 그래픽 I 영화 홍보 사이트 분석 과목 : 컴퓨터 그래픽 I 담당교수 : 손애경 교수님 학과 : 정보처리과 1반(A1)
LabVIEW WiznTec 주임 박명대 1.
Java , 안드로이드를 이용한 ‘사천성’ Game
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
Chapter 7. 그래프.
Web & Internet [01] 인터넷 기술의 개요
체육관용 SD-201 system(특허 ) 장선: 30x70x1.0t 지주: 주 장선 간격 : 700mm
~27 윤형기 Python 프로그래밍 (보충) ~27 윤형기
척도의 속성 - 목 차- 자료수집과정 척도의 속성 -명목척도 -서열척도 -등간척도 -비율척도 -리커트척도 3.Data(자료)
셀프 프로그래밍으로 쓰기 셀프 프로그래밍이란? 프린트포트의 ISP 모듈을 사용하지 않음 부트로더에 의한 펌웨어 다운로드
문서 작성에 사용되는 기본태그 HR, PRE, B, I, U, S.
2장. 솔라리스10 설치. 2장. 솔라리스10 설치 Solaris 1. 솔라리스10 설치 전 시스템 정보 확인 하드웨어 / 소프트웨어 준비 사항 설치 과정 이해 웹사이트 활용 VMware 다운로드 Solaris10 SPARC.
디지털 사운드를 GoldWave로 변환하자
2015년도 2학기 제 10 장 기술통계와 도수분포 마케팅조사.
▶서류관리 프로그램 1. 로그인….2 2. 서류등록 … 서류도착 서류스티커발행
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
In-house Consultant Training
정신과 전문병원 내에서 인권문제 국가인권위 권고사항을 중심으로.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
고해상도 IP 무선 송수신기 제품 MANUAL Model Name : D2400.
엑셀 Add-In 응용프로그램 개발 소개
1. 단순한 차트의 종류 < 차트 > 데이터의 분포 파악 데이터 분석 결과의 효과적인 전달 graphics 패키지
Presentation transcript:

데이터의 시각화 대전과학고등학교 김종헌

1. 데이터 불러오기 및 패키지 설치 가. 데이터 불러오기 나. 패키지 설치 data( mydata <- data.frame(iris) str(mydata) names(mydata)=c("꽃받침길이", "꽃받침너비", "꽃잎길이", "꽃잎너비", "종류") 나. 패키지 설치 Install.packages("ggpubr") library(ggpubr)

2. 연속형 대 연속형 가. 히스토그램 그리기 gghistogram(mydata, x="꽃받침길이", bins=30) gghistogram(mydata, x="꽃받침길이", bins=30, fill="종류") gghistogram(mydata, x="꽃받침길이", bins=30, fill="종류", add ="mean" ) gghistogram(mydata, x=c("꽃받침길이","꽃받침너비"), bins=30, combine=T, color="종류", fill="종류", xlab="꽃받침", ylab="빈도수", add="mean") ggdensity(mydata, x=c("꽃받침길이","꽃받침너비"), combine=T, color="종류", fill="종류", xlab="꽃받침", ylab="밀도", add="mean") library(dplyr) mydata$종류 <- recode(mydata$종류, "setosa"="쎄토사", "versicolor"="버시칼라", "virginica"="버지니카" )

2. 연속형 대 연속형 나. 분산형 그래프 그리기 ggscatter(mydata, x="꽃받침길이", y="꽃받침너비") ggscatter(mydata, x="꽃받침길이", y="꽃받침너비", color="종류") ggscatter(mydata, x="꽃받침길이", y="꽃받침너비", color="종류", size="꽃잎너비") ggscatter(mydata, x="꽃받침길이", y="꽃받침너비", color="종류", size="꽃잎너비", legend="right", add="reg.line", conf.int=T) ggscatter(mydata, x="꽃받침길이", y="꽃받침너비", color="종류", size="꽃잎너비", legend="right", add="reg.line", conf.int=T)+stat_regline_equation(aes(color = 종류)) +stat_cor(aes(color = 종류), label.x=6)

2. 연속형 대 연속형 다. 선형 그래프 그리기 ggline(mydata, x="꽃잎길이", y="꽃잎너비") ggline(mydata, x="꽃잎길이", y="꽃잎너비", color="종류") ggline(mydata, x="꽃잎길이", y="꽃잎너비", color="종류", x.text=90) ggline(mydata, x="종류", y="꽃잎너비", add="mean_sd")

2. 연속형 대 연속형 라. 3D 그래프 그리기 library(scatterplot3d) s3d <- scatterplot3d(with(mydata, data.frame(꽃받침길이, 꽃받침너비, 꽃잎너비)), highlight.3d=T, angle=60) s3d.fit <- lm(꽃잎너비 ~ 꽃받침길이+꽃받침너비, data=mydata); summary(s3d.fit) s3d$plane3d(s3d.fit, draw_polygon=T, draw_lines=T) s3d.orig <- s3d$xyz.convert(mydata$꽃받침길이, mydata$꽃받침너비, mydata$꽃잎너비) s3d.plane <- s3d$xyz.convert(mydata$꽃받침길이, mydata$꽃받침너비, fitted(s3d.fit)) s3d.negpos <- 1 + (resid(s3d.fit) > 0) segments(s3d.orig$x, s3d.orig$y, s3d.plane$x, s3d.plane$y, col = c("blue", "red")[s3d.negpos], lty = (2:1)[s3d.negpos])

3. 범주형 대 연속형 가. 파이챠트 그리기 summary(mydata$종류) mydata.pie <- data.frame(종류=c("쎄토사", "버시칼라", "버지니카"), 값=c(50, 50, 50)) pie.text <- paste0(mydata.pie$종류, "(", mydata.pie$값, ")"); pie.text ggpie(mydata.pie, "값", fill="종류", label=pie.text, lab.pos = "in", lab.font="white")

3. 범주형 대 연속형 나. 막대 그래프 그리기 ggbarplot(mydata, x="종류", y="꽃받침길이", fill="종류", add=c("mean")) ggbarplot(mydata, x="종류", y="꽃받침길이", fill="종류", add=c("mean_sd"), x.text=0) ggbarplot(mydata, x="종류", y="꽃받침길이", fill="종류", add=c("mean_sd"), label=T, lab.hjust=1.2, lab.nb.digits=1) compare_means(꽃받침길이 ~ 종류, data = mydata) ggbarplot(mydata, x="종류", y="꽃받침길이", fill="종류", add=c("mean_sd"), label=T, lab.hjust=1.2, lab.nb.digits=1) + stat_compare_means(label.x=1.7, method="anova") ggbarplot(mydata, x="종류", y="꽃받침길이", fill="종류", add=c("mean_sd"), label=T, lab.hjust=1.2, lab.nb.digits=1) + stat_compare_means(comparisons=list(c("쎄토사", "버시칼라"), c("버시칼라", "버지니카")), label="p.signif", label.y=c(7.3, 8))

3. 범주형 대 연속형 다. Wide format 데이터, 막대 그래프 그리기 library(ezpickr) mydata <- pick("data.xlsx", sheet=2) mydata.bar <- data.frame(탐구방법=mydata$method, 사전창의성=mydata$bcre, 사후창의성=mydata$acre) library(tidyr) mydata.bar <- gather(mydata.bar, key="전후", value="창의적사고역량", -c("탐구방법")) ggbarplot(mydata.bar, x="전후", y="창의적사고역량", fill="전후", add=c("mean_sd"))+ stat_compare_means(method="t.test", paired=T, label.x=1.3) ggbarplot(mydata.bar, x="탐구방법", y="창의적사고역량", fill="전후", add=c("mean_sd"), add.params = list(group = "전후"), position = position_dodge(0.8))+ stat_compare_means(aes(group = 전후), label="p.format", label.x=1.3)

4. 그래프 모아 그리기 library(cowplot) ggdraw( )+ draw_plot(plot1, x=0, y=0.5, width=0.6, height=0.5)+ draw_plot(plot2, x=0.6, y=0.5, width=0.4, height=0.5)+ draw_plot(plot3, x=0, y=0, width=1, height=0.5)