Social Network Analysis 우영상. 목차목차 1.Network of Terms 2.Network of Tweets 3.Two-Mode Network.

Slides:



Advertisements
Similar presentations
6 장 객체 - 지향 설계 ③. 목차 GUI 레이아웃  전화기 키 패드 전화기 키 패드 전화기 키 패드 모양의 GUI 를 만드는 Telephone.java, TelephonePanel.java 를 완성해 보자.  주석을 참고하여 TelephonePanel.java.
Advertisements

1 텍스트 마이닝 기법을 이용한 소셜 미디어 데이터 분석 송민 연세대학교 문헌정보학과 Text and Social Media Mining (TSMM) Lab.
1/37 한글에는 전문적인 문서 편집을 위한 고급 기능이 있다. 문서를 편리하게 수 정할 수 있도록 도와주는 찾기 / 찾아 바꾸기, 다른 위치로 이동할 수 있는 책 갈피와 하이퍼링크에 대해 알아보자. 그리고 자주 사용하는 서식을 미리 정 해 놓고 쓰는 스타일 활용법과 스타일이.
14 장. 그래프 알고리즘 Internet Computing KUT Youn-Hee Han.
재료수치해석 HW # 박재혁.
전자파 연구실 Fast Beamforming of Electronically Steerable Parasitic Array Radiator Antennas: Theory and Experiment 세미나 자료 발표자 : 이동현 1.
Cary UV 분석 매뉴얼 1. 바탕화면의 Cary WinUV 클릭 정량분석 다 파장 동시분석 단 파장 분석
Maximum Flow.
Shortest Path Algorithm
블로그 활용 현황 학과 : 영어영문학과 학번 : 이름 : 정경업
Report #5 - due: 4/13 다음 10*5의 희소 행렬 A, B를 고려하라.
인공지능실험실 석사 2학기 이희재 TCP/IP Socket Programming… 제 11장 프로세스간 통신 인공지능실험실 석사 2학기 이희재
Report #2 - Solution 문제 #1: 다음과 같이 프로그램을 작성하라.
CHAP 10:그래프 순천향대학교 하상호.
CHAP 10:그래프 C로 쉽게 풀어쓴 자료구조 생능출판사 2005.
6 장. ER-관계 사상에 의한 관계 데이터베이스 설계
Chapter 10 그래프(graph) SANGJI University Kwangman KO
Simulating Boolean Circuits on a DNA Computer
D / K / I / T / E / C / H / N / O / L / O / G / Y
메시지 큐[5] – test1.c 메시지 제어: msgctl(2) #include <sys/msg.h>
Homework #5 (1/3) 다음을 수행한 후, 결과 파일들을 출력하여 제출한다.
2007 1학기 11 프로젝트 기초 실습.
보고서 #5(제출기한: 10/14) 다음 문제를 해결하시오.
자료구조: CHAP 4 리스트 (3) 순천향대학교 컴퓨터공학과 하 상 호.
그래프(graph) 연결되어 있는 객체 간의 관계를 표현하는 자료구조 가장 일반적인 자료구조 형태
Ⅱ. 지구의 변동과 역사 1. 지구의 변동 2. 지구의 역사 3. 우리나라의 지질.
제주닷컴 매뉴얼 (실시간 예약시스템) 2013년 10월.
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
프로그래밍 개요
카카오톡 속의 우리 모습 이 부 일 충남대학교 정보통계학과.
자료구조: CHAP 7 트리 –review 순천향대학교 컴퓨터공학과 하 상 호.
Social Network Analysis
Report #3 - due: 4/6 100*100의 2개의 희소 행렬 A, B를 전달 받아서 이들의 덧셈을 구하고, 그 결과의 행렬 C를 반환하는 add_sparse_matrix(A, B, C)를 다음과 같이 작성하라. 희소 행렬은 sparse_matrix 타입으로 표현된다.
Chapter6 : JVM과 메모리 6.1 JVM의 구조와 메모리 모델 6.2 프로그램 실행과 메모리 6.3 객체생성과 메모리
3D 프린팅 프로그래밍 01 – 기본 명령어 강사: 김영준 목원대학교 겸임교수.
관계 기본 개념 관계의 표현 관계의 성질 관계의 연산 관계의 폐포 동치 관계 부분순서 관계.
Prof. Seewhy Lee Presents
PADS Logic 회로도.
[ 강남구 청담동 “이동수에프엔지” ].
Fitting / Matrix / Excel
그래프의 용어 알고리즘 수업자료 김정현.
그래프와 트리 (Graphs and Trees)
문자열 컴퓨터시뮬레이션학과 2015년 봄학기 담당교수 : 이형원 E304호,
14강. 세션 세션이란? 세션 문법 Lecturer Kim Myoung-Ho Nickname 블스
객체기반 SW설계 팀활동지 4.
수학10-나 1학년 2학기 Ⅳ.삼각함수 4. 삼각방정식과 삼각부등식(9/12) 삼각함수 수업계획 수업활동.
지도교수 : 안미정 교수님 사이버 경찰학과 김영훈
01 로그의 정의 ⑴ 일 때, 양수 에 대하여 을 만족시키는 실수 는 오직 하나 존재한다. 이때 를
STS 에서 웹 서버 설치 방법.
1. 선분 등분하기 (1) 주어진 선분 수직 2등분 하기 ① 주어진 선분 AB를 그린다. ② 점 A를 중심으로 선분AB보다
P 직선상에서 속력이 일정한 운동.
CHAP 10 : 그래프.
에어 PHP 입문.
문서 클러스터링 일본언어문화학과 서동진.
Flow Diagram IV While.
Homework #5 (1/3) 다음을 수행한 후, 결과 파일들을 출력하여 제출한다.
12 그리드 시스템.
Homework #3 (1/3) 다음을 수행한 후, 결과 파일들을 출력하여 제출한다.
컴퓨터공학과 손민정 Computer Graphics Lab 이승용 교수님
Energy Band (고체속의 전자구조)에 대해서 쉬운 얘기를 한 후에 Bloch state 로 다시 돌아 가겠습니다.
수치해석 ch3 환경공학과 김지숙.
1장 C 언어의 개요 C 언어의 역사와 기원 C 언어의 특징 프로그램 과정 C 프로그램 구조 C 프로그램 예제.
07. DB 설계 명지대학교 ICT 융합대학 김정호.
김선균 컴퓨터 프로그래밍 기초 - 12th : 문자열 - 김선균
29장. 템플릿과 STL 01_ 템플릿 02_ STL.
교착 상태 해결 : 교착 상태 탐지 교착 상태 탐지(Deadlock Detection)
Report #2 (기한: 3/16) 데이터 구조 과목의 수강생이 50명이라고 가정한다. 이 학생(학번은 2016????으로 표현됨)들의 중간 시험(0~100), 기말 시험(0~100) 성적을 성적 파일에 작성하라(프로그램을 통해서 또는 수작업으로). 성적 파일을 읽어들여서.
7 생성자 함수.
1. 실습 시간에 수행한 avd 생성 및 실행, adb shell 접속 및 명령어 수행 결과를 제출한다.
Presentation transcript:

Social Network Analysis 우영상

목차목차 1.Network of Terms 2.Network of Tweets 3.Two-Mode Network

Social Network Analysis igraph 패키지를 이용하여 일반적인 Social Network 상에 서 발생하는 용어를 분석한다. 같은 Tweet 상에서 발생하는 용어들이 형성하는 Network 을 파악한다. Network 상에서 용어들이 어떻게 공유되는지 파악하기 위한 그래프를 그린다. 용어와 Tweet 으로 구성된 Two-Mode Network Graph 를 그린다.

Network of Terms 동시에 등록되는 Tweet 을 기반으로하여 Tweet 에 생성되 는 용어들의 연관관계를 Network 으로 표현. 용어들의 관계를 adjacency matrix 표현. 자주 생성되는 용어들의 관계를 그래프로 표현.

Network of Terms adjacency matrix 을 구하기 Boolean matrix 로 변환. – termDocMatrix[termDocMatrix>=1] <- 1 adjacency matrix 을 구한다. – termMatrix <- termDocMatrix %*% t(termDocMatrix) Adjacency Matrix 를 통해서 igraph 를 만든다. – g <- graph.adjacency(termMatrix, weighted=T, mode = "undirected") Loop 을 제거한다. – g <- simplify(g)

Network of Terms layout – 그래프를 그리기 위한 Coordinate 을 제공 – termDocMatrix[termDocMatrix>=1] <- 1 Fruchterman and Reingold Algorithm 을 통해서 Graph 생성 layout1 <- layout.fruchterman.reingold(g) kamada.kawai 알고리즘으로 Graph 생성. – plot(g, layout=layout.kamada.kawai) – Loop 을 제거한다. – g <- simplify(g)

Network of Terms 각각의 Vertex 의 Degree 에 따라서 Font 사이즈를 조정할 수 있다. V() 와 E() 을 통해서 Vertex 와 Edge 의 속성을 변경할 수 있다. – V(g)$label.cex <- 2.2 * V(g)$degree / max(V(g)$degree) +.2 V(g)$label.color <- rgb(0,0,.2,.8) V(g)$frame.color <- NA egam <- (log(E(g)$weight)+.4) / max(log(E(g)$weight)+.4) E(g)$color <- rgb(.5,.5,0,egam) E(g)$width <- egam plot(g, layout=layout1)

Network of Terms

Network of Tweet 기존 Network of Terms 에서 공통적으로 있는 단어를 배 제하고 Network 을 형성함으로서 간단하게 공통적인 단 어와 함께 연관되는 단어들의 찾을 수 있다.

Network of Tweet termDocMatrix 의 Terms Column 에서 r, data, mining 단어의 index 를 추출한다. – idx <- which(dimnames(termDocMatrix)$Terms %in% c("r","data","mining")) r, data, mining 단어를 삭제한다. – M <-termDocMatrix[-idx,] Adjacency Matrix 를 생성한다. – tweetMatrix <- t(M) %*% M tweetMatrix 에서 igraph 를 생성한다. – g <- graph.adjacency(tweetMatrix, weighted=T, mode = "undirected")

Network of Tweet Vertex 의 Degree 를 Bar Graph 로 표현한다 – barplot(table(V(g)$degree))

Network of Tweet Vertex 의 Degree 에 따라서 그 색을 달리 하여 그래프를 그린다. Tweet ID 가 고립된 Vertex 의 집합과 빈도수가 많은 20 개의 그래프를 그린다. 나머지 Vertex 는 Tweeter ID 만 출력하게 된다. 각 Edge 의 색은 그 Edge 의 weight 에 따라 Alpha 값이 바뀐다. idx <- V(g)$degree == 0 V(g)$label.color[idx] <- rgb(0,0,.3,.7) V(g)$label[idx] <-paste(V(g)$name[idx], substr(df$text[idx],1,20), sep=": ") egam <- (log(E(g)$weight)+.2)/ max(log(E(g)$weight)+.2) E(g)$color <- rgb(.5,.5, 0, egam) E(g)$width <- egam set.seed(3152) layout2 <- layout.fruchterman.reingold(g) plot(g, layout = layout2)

Network of Tweet

delete.vertices 를 통해서 초승달 모양으로 고립된 Vertex 를 삭제한다. g2 <- delete.vertices(g, V(g)[degree(g)==0]) plot(g2, layout=layout.fruchterman.reingold) Degree 가 낮은 Edge 를 삭제함으로서 graph 를 좀더 간단 하게 만든다. g3 <- delete.edges(g, E(g)[E(g)$weight <= 1]) g3 <- delete.vertices(g3, V(g3)[degree(g3) == 0]) plot(g3, layout=layout.fruchterman.reingold)

Network of Tweet

Two-Mode Network Tweet 과 Terms 이 두 가지 타입으로 이뤄진 Two-mode Network 을 만든다. Two-Mode Network 서로 다른 두 개의 Node Set 을 일정한 기준의 묶는다.

Two-Mode Network pipartite igraph 을 생성 mode 는 Edge 의 Direction 을 나타내며, all 은 mutual edge 가 만들어진다. g<- graph.incidence(termDocMatrix, mode = c("all")) nTerms <- nrow(M) r 에 이웃한 모든 Vertex 를 반환받는다 V(g)[nei("r")] “r” 과 “data” 와 “mining” 세 단어가 포함된 자료는 다음과 같이 확인할 수 있다. (rdmVertices <- V(g)[nei("r") & nei("data") & nei("mining")]) df$text[as.numeric(rdmVertices$label)]

Two-Mode Network

Q&A