카카오톡 속의 우리 모습 이 부 일 충남대학교 정보통계학과.

Slides:



Advertisements
Similar presentations
제철고 프로그래밍언어 2015 가을학기 연습 #1 Python 연산식 이다훈 POSTECH 컴퓨터공학과 2015 년 9 월 23 일.
Advertisements

Mining the by Graph API. 1. 페이스북 소셜 그래프와 Graph API, OGP 2. 페이스북 페이지와 친구들에서 좋아요 분석하기 3. 소셜 그래프 분석을 위한 결속집단 분석 4. 소셜 그래프 시각화.
프로그래밍언어론 TA 윤들녁. 소개 윤들녁 연락처 : 공대 7 호관 4 층 401 호 데이터베이스 연구실 실습 후 날짜 _ 학번.zip 으로.
1/ 편집 기능 사용하기 – 실습 1 글자 모양을 바꾸고 싶은 곳을 블록 설정 [ 글자 모양 ] 대화 상자에서 [ 글꼴 ] ‘ 궁서체 ’, [ 글자 색 ] ‘ 토마토색 ’ 으로 선택 → [ 설정 ] 클릭 → 글자 모양 변경.
가족 문화 정보 한마당 대단원 1 – 중단원 4 영진.COm영진.COm 1. 마음이 담긴 쪽지 쓰기  워드 프로세서 (Word processor)  문서를 작성하고 편집 · 출력할 수 있는 프 로그램  워드 프로세서의 기능  문서의 입력 기능  문서의 편집.
을지대학교 무선 네트워크 사용 방법 2010 년 06 월 01 일. 을지대학교 무선 네트워크 사용 방법 1. PC 무선랜 카드 활성화 및 체크 1 단계 : 시작 -> 설정 -> 네트워크 설정 2 단계 : 무선 네트워크 설정 선택 -> 마우스 버튼 오른쪽 클릭 -> 사용.
임직원 APP 설치 가이드 경영전략처 정보기획 TF 팀. 임직원 App- 운영체제 구분  안드로이드 갤럭시, 갤럭시노트, 갤럭시 S4 [ 삼성전자 ] 옵티머스 [LG 전자 ] 베가 [ 팬텍 모토로이 [ 모토롤라 ]  ios 아이폰 [ 애플.
Window media player 1. 윈도우 미디어 플레이어가 많이 끊길 때 윈도우 미디어 플레이어실행 > 도구 > 옵션 > 성능 > 연결 속도 > 연결 속도 선택 Lan(10Mbps) 선택 > 네트워크 버퍼링 버퍼 10 초 네트워크창 > 스트리밍 프로토콜 > UDP.
EBSCO eBooks 이용 방법 및 다운로드 (대출모드) 안내
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
난이도 : 초급 제1장 앱 인벤터 소개 및 준비.
컴퓨터와 인터넷.
가상환경 구축 및 리눅스 터미널 실습 충북대학교 지능로봇연구실.
PARK SUNGJIN Oracle 설치 PARK SUNGJIN
파워포인트 2007.
DB 프로그래밍 학기.
DB 프로그래밍 학기.
[별첨] 특허 DB 구축 및 토픽 모델링 수행 과정 Flowchart, File List
[첨부] 지원서 양식 및 과제 요강 삼성전자 VIP센터 2016 대학생 IDEA POOL 10기 모집.
피티라인 파워포인트 템플릿.
텍스트마이닝 실습 (R 이용).
윈도우7 체크 설치 매뉴얼
데이터 파일 C 데이터 파일과 스트림(Stream) 텍스트 파일 처리
레고 Digital Designer 사용법 알아보기
임베디드 시스템 개론 크로스 플랫폼 설치 2일차 강의 자료 Embedded System Lab.
NCS 학사운영 시스템 Guide.
SEOUL NATIONAL UNIVERSITY OF SCIENCE & TECHNOLOGY
iframe 사용하기 Chapter 3 Part 2
                              데이터베이스 프로그래밍 (소프트웨어 개발 트랙)                               퍼스널 오라클 9i 인스톨.
부트로더와 Self Programming
학습목표 학습목차 다른 홈페이지의 HTML 파일 코드를 보는 방법에 대해 알아봅니다.
KeyNote Blur Template By BlancStar.
Git 사용법 GitHub 가입 GitHub 새 저장소 만들기 Git 설치 로컬 저장소 만들기 로컬 저장소와 원격 저장소 연결
You YoungSEok Oracle 설치 You YoungSEok
Jupyter Notebook Install
(인터페이스 상세 이용 방법 및 다운로드 (대출모드) 안내)
IPAD2(ios 5.0.1) 사용자 메뉴얼 Mobile Service Team.
7가지 방법 PowerPoint에서 공동 작업하는 다른 사용자와 함께 편집 작업 중인 사용자 보기
강의 개요. 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
SAS Statistical Analysis System 통계패키지 실습 (2011년 1학기)
유승석 FILE I/O File Input/Output 유승석 SD50 – C# & .NET Platform.
Web & Internet [03] HTML5 다양한 태그
카카오톡 속의 우리 모습 이 부 일 충남대학교 정보통계학과
1. 설치 2. SPC_Wave 사용설명 SPC_Reflow 사용방법은 Wave와 같습니다.
Endnote 이용 안내 2010 중 앙 도 서 관.
1. 입력 데이터 대학, 학과: 대학이 존재하지 않을 경우 학과명을 대학에 입력 학과명은 공백으로 유지
BIC 사례 1 연관규칙과 분류모형을 결합한 상품 추천 시스템: G 인터넷 쇼핑몰 사례
자바 5.0 프로그래밍.
Text Mining (Parsing) with R
컴퓨터 프로그래밍 기초 [01] Visual Studio 설치 및 사용방법
ARI패널 활동 메뉴얼 교육품질관리센터.
기획재정부 국고보조금통합관리시스템 구축 추진단
Cold Spring Harbor Laboratory Press 저널 이용 매뉴얼
헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 텍스트 샘플 텍스트
ITQ 정보기술자격 국가공인 Excel 2007 Ⅱ 함수- 15회차 강사 : 박영민.
Linux 9.X 기초에서 활용까지 Chapter 06 VI 편집기.
50주년 기념 상품 및 서비스 공모전 서울대학교 생활과학대학
Chapter 10 데이터 검색1.
시스템 인터페이스 Lab1 X-window 및 명령어 사용.
1. 입력 데이터 ② 대학, 학과: 대학이 존재하지 않을 경우 학과명을 대학에 입력 학과명은 공백으로 유지 (하단 참조)
서적DB개발 과제 Page 2의 ERD를 통해 구축할 서적 DB의 구조를 파악한다. (4개의 개체에 대해 확인함)
PMS Program과 신한카드 연계 대성정보기술㈜
실사 재고 조사 방법 기초작업 "물류/재고관리 - 재고현황" 메뉴에서 리스트 추출 엑셀로 카피 – 목록 수정
Excel 일차 강사 : 박영민.
과제물 3호 3번 문제 설명자료.
피티라인 파워포인트 템플릿.
펌웨어(S/W) Upgrade 방법 Samsung Kies3
Chapter 11. 문서 인쇄 및 파일 형식.
Presentation transcript:

카카오톡 속의 우리 모습 이 부 일 충남대학교 정보통계학과

카카오톡 [ 출처 ] http://blog.naver.com/PostView.nhn?blogId=big_study&logNo=220163649988

카카오톡 : 이모티콘 [ 출처 ] http://blog.naver.com/PostView.nhn?blogId=big_study&logNo=220163649988

카카오톡 : 이용자 수 출처 : 다음카카오 2015년 1분기 실적발표 자료 카카오톡 : 이용자 수 출처 : 다음카카오 2015년 1분기 실적발표 자료 http://www.daumkakao.com/upload_resources/ir/siljeok/siljeok_20150514080024.pdf

대한민국 고등학생 연령의 인구 출처 : KOSIS(국가통계포털) 2010년 인구주택총조사 자료 대한민국 고등학생 연령의 인구 출처 : KOSIS(국가통계포털) 2010년 인구주택총조사 자료 http://kosis.kr/statisticsList/statisticsList_01List.jsp?vwcd=MT_ZTITLE&parentId=A#SubCont

카카오톡 이용 패턴 분석하기 자기 물드세요 대상자 : 가족 받음 라인 : 1 어절 : 2 음절 : 6

카카오톡 이용 패턴 분석하기 대상자 : 가족 시 간 : 오후 받음 라인 : 2 어절 : 3 음절 : 7 보냄 라인 : 8 카카오톡 이용 패턴 분석하기 대상자 : 가족 시 간 : 오후 받음 라인 : 2 어절 : 3 음절 : 7 보냄 라인 : 8 어절 : 12 음절 : 26 이모티콘 : 1

카카오톡 이용 패턴 분석하기

카카오톡 이용 패턴 분석하기 분석 방향 각자 최근 3일 동안 사용했던 카카오톡의 내용을 대상자별로 구분하여 기록함 (단, 사용기간은 분임에서 조정 가능함. 최소 3일은 유지) 최종 분석 자료 : 분임별 구성원의 자료를 합친 것 분임별로 대상자(부모, 친구, 기타)에 따라서 카카오톡 이용 패턴에 어떠한 차이 를 보이는지 파악함 파악한 특징을 파워포인트로 작성하여 발표함 제시된 내용 이외의 아이디어를 적용하여 대상자에 따른 이용 패턴의 차이를 파악하는 것도 가능함

카카오톡 이용 패턴 분석하기 유용한 분석 도구들 엑셀의 피벗 테이블 기능 카카오톡 대화분석기(앱) R 프로그램

R 프로그램 다운로드 및 설치 www.r-project.org Download -> CRAN Korea -> http://cran.nexr.com Windows Base R 3. 2. 1 실행

RStudio 프로그램 다운로드 및 설치 www.rstudio.com Download Desktop Open source Window 0.99.467 실행

RStudio 프로그램 실행 및 파일 불러오기 File -> Open File textmining.R

RStudio 프로그램 실행 및 파일 불러오기 File -> Open File textmining.R

Text Mining in R Bar plot 3D Pie plot Word cloud

Text Mining in R # 작업공간 설정 및 보기 setwd("d:/") getwd() # 관련 패키지 설치 및 로딩하기 install.packages("KoNLP") install.packages("wordcloud") install.packages("RColorBrewer") require(KoNLP) require(wordcloud) require(RColorBrewer)

Text Mining in R # 텍스트 파일을 한 줄씩 읽어오기 rent1 = readLines("new_myray.txt") # 단어 중에서 명사를 추출하기 rent2 = sapply(rent1, extractNoun, USE.NAMES=FALSE) # 리스트(List) 형태의 데이터를 벡터(Vector)로 저장하기 rent3 = unlist(rent2) # 특정한 단어들을 처리하기 rent3 = gsub("[0-9]", "", rent3) # 숫자를 공백으로 rent3 = gsub("[a-z]", "", rent3) # 소문자 알파벳을 공백으로 rent3 = gsub("[A-Z]", "", rent3) # 대문자 알파벳을 공백으로 rent3 = gsub("[:punct:]", "", rent3) # 특수기호를 공백으로 rent3 = Filter(function(x){nchar(x)>=2}, rent3) # 음절의 길이가 2이상인 것만

Text Mining in R # 참고로 이러한 작업은 공백을 제거하기 위함이다. write(unlist(rent3), "myray2.txt") # 새로운 텍스트 파일 읽어오기 rent4 = read.table("myray2.txt") # 단어의 빈도를 구하기 wordcount = table(rent4) # 단어의 색을 지정 palete = brewer.pal(n=9, name="Set3")

Text Mining in R # 워드 클라우드 작성 wordcloud(names(wordcount), # 단어명 freq=wordcount, # 단어의 빈도 min.freq=2, # 워드 클라우드에 나오게 하는 최소의 빈도 rot.per=0.25, # 단어의 회전 각도 scale=c(5,1), # 가장 큰 글자는 5, 가장 작은 글자는 1로 지정 random.order=FALSE, # 단어의 순서를 임의로 지정하지 않음 random.color=TRUE, # 단어의 색은 임의로 지정 colors=palete) # 단어의 색을 지정

Text Mining in R # 추출된 단어 중에서 상위 10개만 저장하기 top10 = head(sort(wordcount, decreasing=TRUE), n=10) # 막대그래프 작성 bt = barplot(top10, col="purple", cex.names=0.8,ylim=c(0,15)) text(x=bt, y=top10*1.05, labels=paste(top10, "건", sep=""), col="black", cex=0.7) # 3차원 원그래프 작성 install.packages("plotrix") require(plotrix) pie3D(top10, col=rainbow(10), cex=0.5, explode=0.05)