카카오톡 속의 우리 모습 이 부 일 충남대학교 정보통계학과 010-3420-8736.

Slides:



Advertisements
Similar presentations
개인의견 차가있을수있음 훈훈한남자 배우 TOP 5. 5 위는 박보검 웃을때보이는 치명적인 미소 꺄 ~~~ 5위5위.
Advertisements

플레이스토어가 아닌 곳에서 다운받은 스마트폰 어플리케이션 설치방법 1. 스마트폰에 있는 환경설정 어플리케이션을 찾은후에 실행 시킨다.( 본 기종은 갤럭시노트 2)
기업 인사담당자가 밝힌 면접 합격 비법 취업포털 사람인 ( 기업 인사담당자 397 명 조사 )
WCL 이민학 Big Data & Hadoop.
5 조 - 음악학과 이수영 5 조 - 음악학과 이수영 사회복지학과 김원미 사회복지학과 김원미 신민지 신민지 이정원
㈜ 금산산업 회사 소개서. 회사 소개 회사 개요 회사 연혁 공장약도 제품 소개 원료 관리 필렛 작업 염 ( 소금 ) 침지 공정 급속동결 및 진공 포장 거래처 LIST 거래처별 매출 실적 공장사진 목 차.
통계학 강의 노트 제 2 장 0/10 기 초 통 계기 초 통 계 기 초 통 계기 초 통 계.
Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ ’ ( 금 ) ~ ( 목 ) / 15 개 시・군 대한체육회 / 도, 교육청, 도체육회 47 개 종목 / 32 천명 ’ ( 금 ) ~ ( 화 ) / 9 개 시・군 대한장애인체육회 / 도,
제주특별자치도 교육청 Messenger Manual
2. 문학의 활동 방법 [1] 문학의 수용 01 소설가 구보 씨의 일일 작가 소개 작품 정리 읽기 중 활동 학습 활동.
표 및 그래프 작성.
1. Association rule analysis
QUAL2E-PLUS 환경공학과 임 건 섭.
센테니카 마케팅 방향.
텍스트마이닝 실습 (R 이용).
리눅스를 이용한 임베디드 시스템의 기술 동향 정보통신과 2학년 B반 이승훈.
문제제기 문제분석 기대효과.
주택형 : 59m²(24py), 75m²(30py), 84m²(34py) 견본주택 : 18年 05月 18日 OPEN
BIG Data 컴퓨터응용과학부 박진완.
데이터 웨어 하우스 이병규 김기훈.
<대상 : Visual studio bit>
제3장 이클립스 사용하기.
8. 빅데이터 기법(텍스트마이닝).
Windows 2008R2 Hyper-V 기반 데스크톱 가상화 환경
Java IT응용시스템공학과 김형진 교수 2장. 자바의 환경 public class SumTest {
MFC UI for TS Analyzer 서울시립대학교 컴퓨터통계학과 최 용 진.
Computer Architecture
2016년 9월 전자전기컴퓨터공학부 김한준 소프트웨어시스템 실습 2016년 9월 전자전기컴퓨터공학부 김한준
6장 스마트아트 실습 철도경영과 학번( ) 성명( )
소리가 작으면 이어폰 사용 권장!.
CHAPTER 2 자바의 환경 Section 1 자바 프로그램의 형태 Section 2 자바 프로그램의 실행환경.
▶ GTQ - Photoshop 어플리케이션 바 메뉴 표시줄 옵션바 4. 툴 패널 5. 총 30개의 패널
글사랑 캡션 편집 안드로이드 앱 담당 교수님 전진우 교수님 진세훈 정상기 글사랑.
Premiere의 개요 Adobe사에서 제작한 동영상 편집 소트프웨어로 비디오와 오디오 편집뿐만 아니라 애니매이션, 사진 및 그래픽 등을 동영상에 첨가하여 결합된 형태인 디지털 무비(Digital Movie)를 제작하는 프로그램 Premiere는 원래 매킨토시용으로 개발된.
카카오톡 속의 우리 모습 이 부 일 충남대학교 정보통계학과.
III. 순수관광 목적 방문지역별 여행 실태 서울 부산 대구 인천 광주 대전 울산 경기 강원 충북 충남 전북 전남 경북 경남
4. 도표 다루기.
Matlab 기초 한밭대학교 전기공학과 담당교수 : 이 경 복.
부품·소재전문기업육성등에관한특별조치법안(개요)
1 2 ■ EPC 커스터마이징 품목 운영 결과 보고 커스터마이징 품목 : 매출 ↑ , CS만족도 ↓ System 개선
III. 순수관광 목적 방문지역별 여행 실태 서울 부산 대구 인천 광주 대전 울산 경기 강원 충북 충남 전북 전남 경북 경남
모두가 행복한 교육, 미래를 여는 창의인재 2015 개정교육과정 서울숭인초등학교 교사 이소정.
네트워크 설정 방법 (측정값데이터수집설정)
Insight Deep MininG 건강을 위한 마이너스, 무첨가 식품 인사이트코리아/식품음료신문 공동 기획 기사
Text Mining (Parsing) with R
[ 강남구 청담동 “이동수에프엔지” ].
III. 순수관광 목적 방문지역별 여행 실태 서울 부산 대구 인천 광주 대전 울산 경기 강원 충북 충남 전북 전남 경북 경남
Ⅶ. 명함관리 1. 초기 화면 설명 2. 명함 분류 관리 3. 명함 이동,공유,복사 4. 명함 등록, 수정 5. 상세검색 6.
사회생활과 준법의식 사회(일반사회) 중학교 2학년 2학기 Ⅶ. 사회생활과 법규범
(주)로티코리아 LOTIR KOREA.
3D 프린팅 프로그래밍 04 – 도형 회전 (하트 열쇠고리 만들기) 강사: 김영준 목원대학교 겸임교수.
2013년도 상반기 고객만족도 조사 결과 보고서
2013년도 하반기 고객만족도 조사 결과 보고서
XSS 정 여 진.
Advanced Data Analytics 데이터분석 전문가
영화 속 지도학 지리학과 조우현.
01. ‘한글뷰어’ 설치 전 준비사항.
전류는 자계에서 힘을 받는다 기계공학교육 박지훈 황인석 한만혁 이덕균.
리더 코딩 스토리 디자인 박찬준 이근영 박동현 박나영
III. 순수관광 목적 방문지역별 여행 실태 서울 부산 대구 인천 광주 대전 울산 경기 강원 충북 충남 전북 전남 경북 경남
주택행정 도시행정론.
해원에스티 주식회사 제[ ]회 무보증 사모사채 발행
실시간 음성 채팅 서비스 (Voice Chatting Programe)
Excel 2007을 이용한 통계학 제 2 장 자료의 정리.
房思琪的初恋乐园 ‘팡쓰치’로 보는 문학의 힘 정은비.
북한학 과목소개 최 장 옥 교 수 연평도 앞 월래도 시찰.
박 현 미 울산여자상업고등학교 창업포스터 만들며 포토샵과 친해지기 박 현 미 울산여자상업고등학교.
유예 X-FILE *조사자* 1301권희원 1315이예지 1317장아정 1322홍자현.
에서 트리니티 아이디와 패스워드 치기 Download, Packages CRAN
삶을 낭비하지 말라 친구초청잔치 준비 설교 I 울산시민교회 비전틴(고등부)
Presentation transcript:

카카오톡 속의 우리 모습 이 부 일 충남대학교 정보통계학과 010-3420-8736

텍스트 마이닝(Text mining)

텍스트 마이닝(Text mining)

텍스트 마이닝(Text mining)

카카오톡 [ 출처 ] http://blog.naver.com/PostView.nhn?blogId=big_study&logNo=220163649988

카카오톡 : 이모티콘 [ 출처 ] http://blog.naver.com/PostView.nhn?blogId=big_study&logNo=220163649988

카카오톡 : 이용자 수 출처 : 다음카카오 2015년 1분기 실적발표 자료 카카오톡 : 이용자 수 출처 : 다음카카오 2015년 1분기 실적발표 자료 http://www.daumkakao.com/upload_resources/ir/siljeok/siljeok_20150514080024.pdf

대한민국 고등학생 연령의 인구 출처 : KOSIS(국가통계포털) 2010년 인구주택총조사 자료 대한민국 고등학생 연령의 인구 출처 : KOSIS(국가통계포털) 2010년 인구주택총조사 자료 http://kosis.kr/statisticsList/statisticsList_01List.jsp?vwcd=MT_ZTITLE&parentId=A#SubCont

카카오톡 이용 패턴 분석하기(01) “자기 물드세요” 대상자 : 가족 받음 라인 : 1 어절 : 2 음절 : 6

카카오톡 이용 패턴 분석하기(02) 대상자 : 가족 시 간 : 오후 받음 라인 : 2 어절 : 3 음절 : 7 보냄 카카오톡 이용 패턴 분석하기(02) 대상자 : 가족 시 간 : 오후 받음 라인 : 2 어절 : 3 음절 : 7 보냄 라인 : 8 어절 : 12 음절 : 26 이모티콘 : 1

카카오톡 이용 패턴 분석하기(03) 자료 수집 각자 최근 1일 동안 사용했던 카카오톡의 내용을 대상자별로 구분하여 기록함(단, 사용기간은 분임에서 조정 가능함) 최종 분석 자료 : 분임별 구성원의 자료를 합친 것 분임별로 카카오톡 이용 패턴의 특징을 파악함 파악한 특징을 파워포인트로 작성하여 발표함 제시된 내용 이외의 아이디어를 적용하여 대상자에 따른 이용 패턴의 차이를 파악하는 것도 가능함

카카오톡 이용 패턴 분석하기(04) 자료 수집 카카오톡을 안 하는 경우는 문자로 대신함 단체방은 포함하지 않음

카카오톡 이용 패턴 분석하기(05) 발표시 주의할 점 자료 수집 방법을 소개할 것 카카오톡 이용 패턴 분석하기(05) 발표시 주의할 점 자료 수집 방법을 소개할 것 발표에 사용하는 단어의 개념에 대한 정의를 명확히 할 것 막대그래프인 경우는 y축이 무엇을 의미하는지 표시할 것 인터넷 등을 통한 외부 자료를 사용할 경우는 출처를 명확히 할 것

카카오톡 이용 패턴 분석하기(06)

카카오톡 이용 패턴 분석하기(07) 라인수, 어절수, 음절수, 기타 현황은 어떠한가? 누구와 대화를 하는가? 카카오톡 이용 패턴 분석하기(07) 라인수, 어절수, 음절수, 기타 현황은 어떠한가? 누구와 대화를 하는가? 어떠한 내용의 대화를 하는가? 언제 하는가? 어디서 하는가?

카카오톡 이용 패턴 분석하기(08) 유용한 분석 도구들 엑셀의 피벗 테이블 기능 카카오톡 대화분석기(앱, 인터넷 사이트) 카카오톡 이용 패턴 분석하기(08) 유용한 분석 도구들 엑셀의 피벗 테이블 기능 카카오톡 대화분석기(앱, 인터넷 사이트) R 프로그램

R 프로그램 다운로드 및 설치 www.r-project.org Download -> CRAN Korea -> http://cran.nexr.com Windows Base R 3. 2. 1 실행

RStudio 프로그램 다운로드 및 설치 www.rstudio.com Download Desktop Open source Window 0.99.467 실행

RStudio 프로그램 실행 및 파일 불러오기 File -> Open File textmining.R

RStudio 프로그램 실행 및 파일 불러오기 File -> Open File textmining.R

Text Mining in R Bar plot 3D Pie plot Word cloud

Text Mining in R # 작업공간 설정 및 보기 setwd("d:/") getwd() # 관련 패키지 설치 및 로딩하기 install.packages("KoNLP") install.packages("wordcloud") install.packages("RColorBrewer") require(KoNLP) require(wordcloud) require(RColorBrewer)

Text Mining in R # 텍스트 파일을 한 줄씩 읽어오기 rent1 = readLines("new_myray.txt") # 단어 중에서 명사를 추출하기 rent2 = sapply(rent1, extractNoun, USE.NAMES=FALSE) # 리스트(List) 형태의 데이터를 벡터(Vector)로 저장하기 rent3 = unlist(rent2) # 특정한 단어들을 처리하기 rent3 = gsub("[0-9]", "", rent3) # 숫자를 공백으로 rent3 = gsub("[a-z]", "", rent3) # 소문자 알파벳을 공백으로 rent3 = gsub("[A-Z]", "", rent3) # 대문자 알파벳을 공백으로 rent3 = gsub("[:punct:]", "", rent3) # 특수기호를 공백으로 rent3 = Filter(function(x){nchar(x)>=2}, rent3) # 음절의 길이가 2이상인 것만

Text Mining in R # 참고로 이러한 작업은 공백을 제거하기 위함이다. write(unlist(rent3), "myray2.txt") # 새로운 텍스트 파일 읽어오기 rent4 = read.table("myray2.txt") # 단어의 빈도를 구하기 wordcount = table(rent4) # 단어의 색을 지정 palete = brewer.pal(n=9, name="Set3")

Text Mining in R # 워드 클라우드 작성 wordcloud(names(wordcount), # 단어명 freq=wordcount, # 단어의 빈도 min.freq=2, # 워드 클라우드에 나오게 하는 최소의 빈도 rot.per=0.25, # 단어의 회전 각도 scale=c(5,1), # 가장 큰 글자는 5, 가장 작은 글자는 1로 지정 random.order=FALSE, # 단어의 순서를 임의로 지정하지 않음 random.color=TRUE, # 단어의 색은 임의로 지정 colors=palete) # 단어의 색을 지정

Text Mining in R # 추출된 단어 중에서 상위 10개만 저장하기 top10 = head(sort(wordcount, decreasing=TRUE), n=10) # 막대그래프 작성 bt = barplot(top10, col="purple", cex.names=0.8,ylim=c(0,15)) text(x=bt, y=top10*1.05, labels=paste(top10, "건", sep=""), col="black", cex=0.7) # 3차원 원그래프 작성 install.packages("plotrix") require(plotrix) pie3D(top10, col=rainbow(10), cex=0.5, explode=0.05)