Presentation is loading. Please wait.

Presentation is loading. Please wait.

텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 연세대학교 문헌정보학과 송민

Similar presentations


Presentation on theme: "텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 연세대학교 문헌정보학과 송민"— Presentation transcript:

1 텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 연세대학교 문헌정보학과 송민 min.song@yonsei.ac.kr

2 1. Background 2. Related Work & Literature Review 3. Technique Method 4. Results 5. Conclusions * 목차 2

3 1. Background 3 인터넷 뉴스의 발달 포털에서 뉴스를 접할 때, 특정 주제를 가진 뉴스를 클릭하도록 유도 처음 접하는 뉴스를 통해 인식변화 가능 : 뉴스의 중요성 점점 부각 언론이 가진 표현의 자유로 다양한 논조를 가진 신문이 존재 비판적으로 뉴스를 선별하고 자유롭게 바라볼 수 있도록 돕는 새로운 툴의 필요성 절감

4 RQ: 다량의 데이터를 사용한다면, 막연하게 알아오던 신문사별 성향 과 논조 및 내용의 차이가 눈으로 확인이 가능한가? RQ1. 신문사별 키워드의 단순 빈도를 분석하면 신문사 간, 분야별 차이 가 있는가? RQ2. 기각 신문사의 주요 키워드를 네트워크로 시각화한다면, 신문사별 로 가지고 있는 논조와 내용이 보수-진보로 구분되던 기존의 분류와는 다르게 분류될 수 있을 것인가? RQ3. 긍정-부정의 논조 판단이 필요한 이슈의 경우, 자동 분류를 시도했 을 때 얼마나 의미 있는 결과가 나오며 앞으로 어떻게 활용할 수 있을 것인가? 1. Background 4 Research Questions

5 비교 대상 동아일보, 한겨레신문, 경향신문 총 6가지 분야 정치, 사회, 경제, 국제, 문화의 5가지 주요 분야 및 사설 분석 각 분야에서 어떤 논조를 가지고 있는지, 신문사들과의 차이는 어떤지, 비슷한 성향을 가지고 있는지를 파악 신문사별로 각 분야에 대한 내용 및 논조를 단순빈도와 Clustering 기 법을 활용하여 분석한 다음, 이와 같은 결과가 신문사별로 어떻게 나누 어지는지를 Classification 기법을 통해 확인 주제에 논조 판단(긍정-부정)이 가능한 경우 다시 Classification 기법을 활용한 분석을 하여 신문사 논조 성향 구별 툴의 가능성을 제시 1. Background 5 The Goal of this study

6 미디어투데이 국정감사자료 기사 분석(2010) 2010년 10월 4일부터 23일까지 전국단위 종합 일간지 10곳의 1면 분석 분석결과: 신문의 이념적인 성향에 따라 정당 편향적으로 하는 경향 1면에서 언급한 기사의 횟수로 파악: 단순한 관련 단어 빈도 측정 2. Related Work & Literature Review 6 한국 신문사들을 대상으로 한 신문방송학과의 연구 정치인이 연구된 사건(김정아, 채백 2008) 호주제 폐지에 대한 논조(이민규, 김수정 2006) 언론 개혁에 관한 기사 담론 분석(정재철 2002) 직접 텍스트를 하나하나 분석하고 코딩하여 연구 결과 도출

7 2. Related Work & Literature Review 7 신문시장의 다양성과 주요 신문들의 보도성향 비교(최현주 2010) 조선일보, 중앙일보, 동아일보, 한겨레신문, 경향신문, 한국일보 정치이념(북한 핵과 대북 지원), 경제적 가치의 배분(종합부동산세 폐지), 사회문화(호주제 폐지)의 세 가지 이슈에 대한 각 신문사의 이념 분석 텍스트 마이닝 기법을 활용한 분류 연구 LED 분야의 특허들을 대상으로 텍스트 마이닝을 통해 중요한 기술정보를 추출한 다음, 키워드 네트워크를 구축하고, 이를 대상으로 커뮤니티 네트워 크 분석을 수행 (최진호 외2011) 미국의 텍스트 마이닝을 활용한 신문사 간의 상반된 패턴 연구 Opinion analysis(Balahur 외 2009), 케냐 선거 성향분석(Pollak 외 2011)

8 연구 방법 3. Technique Method 8 인터넷 뉴스 기사 추출 문서 집합 생성 Lucene Korean과 KLT의 불용어리스트 사용 코사인 유사도 매트릭스, PNNC알고리즘과 MALLET Package 사용 뉴스 추출 전처리 뉴스 분석 단순빈도 분석 Clustering Classification

9 문헌 추출 데이터 출처: KINDS (Korea Integrated News Database System) 주제어 검색을 하여 수집 기간: 2008년 2월~ 2012년 5월까지의 KINDS 소장 인터넷 뉴스 추출된 신문기사의 수: 총 3,026개 데이터 수집: 각 검색어로 검색이 된 각각의 뉴스 URL을 긁어와서 URL 상에 있는 HTML 태그 데이터를 삭제한 후 텍스트만 남김 분류에 영향을 주지 않는 작성일과 작성자, 신문사, 기사 제목은 삭 제하여 저장 9 3. Technique Method

10 문헌 추출 분야별로 신문기사 텍스 트 추출 키워드로 검색한 경우, 해당 키워드가 이슈화 된 시기를 기준으로 한 달 내 외로 수집 경제, 문화, 사설의 경우 검색 기간에 있는 모든 관 련 신문기사 추출 10 3. Data Preprocessing 분야에 따른 검색 내용 1. 사회 검색 일자2008.12.29- 2009-01.29 검색 내용키워드: 4대강 사업 2. 정치 검색 일자2012.04.25- 2012.05.25 검색 내용키워드: 통합진보당 3. 경제 검색 일자2012.04.25- 2012.05.25 검색 내용검색 기간에 있는 모든 경제 관련 뉴스 4. 국제 검색 일자2012.03.15- 2012.04.15 검색 내용키워드: 북한 핵 5. 문화 검색 일자2012.04.25- 2012.05.25 검색 내용검색 기간에 있는 모든 문화 관련 뉴스 6. 사설 검색 일자2012.04.25- 2012.05.25 검색 내용검색 기간에 있는 모든 사설

11 전처리 불필요한 데이터 삭제 및 데이터 형식의 통일 HTML, 스크립트 언어 등을 삭제하고 기사의 순수 텍스트 추출 Lucene Korean을 이용하여 자연어 처리(각 단어는 쉼표로 구분) Java 프로그램을 활용하여 불용어 제거, 형태소 분석 결과 도출 KLT에서 제공하는 불용어 리스트 연동 저장된 뉴스 텍스트를 문단 별로 다시 나누어 파일로 생성 11 3. Date Preprocessing Continued

12 기호처리 신문기사의 특성 상 특정 단어를 나타낼 때 기호 사용 빈번 띄어쓰기 및 기호(‘,’,,“,”,.,(,),■,|,△,▶,▽,○,▼,☞,◇,―,●) 삭제 앞의 불용어처리 및 형태소분석에서 처리되지 못한 단어들 추가 처리 12 전처리 3. Date Preprocessing Continued

13 문서 분류 단순빈도 분석 신문사별 특정 주제 분야에 나온 단어들의 빈도를 분석 다른 신문사와의 비교를 위해 신문사별로 분류하여 비교분석 Clustering 패스파인더 네트워크/ PNNC 알고리즘(이재윤 2006) 를 활용한 단어 네 트워크 분석 13 3. Text Mining Techniques

14 문서 분류 Classification: MALLET Package를 사용 Naive Bayes를 이용하여 학습시키고 분류 정확률(Precision), 재현률(Recall), F-value를 활용한 분류 성능 평가 학습데이터와 테스트데이터의 비율은 70:30이 되는 것이 적당함 (Carlos and Lucio, 2003)을 유념하여 배치 및 결과 분석 14 3. Technique Method 분야학습데이터(문단)의 수테스트데이터(문단)의 수 경제(전반)750150 문화(전반)1400150 국제(북한 핵)350100 정치(통합진보당)15050 사회(4대강 사업)2000150 사설(전반)15050

15 경제 (전반) 4. Results 15 순위 경향신문한겨레신문동아일보 1 시장정부기업 2 삼성전자시장국내 3 정부제품한국 4 관계자삼성전자시장 5 제품회장미국 6 국내가격정부 7 한국미국제품 8 사업서울투자 9 기업국내고객 10 미국대기업상품 신문사별 주요 언급 단어 동아일보: 기업 경향신문: 시장 한겨레: 정부의 경제 논조 및 내용의 차이 검증 전체 평균적으로 0.47 정도의 확률로 올바르게 분류 각 신문사별로 논조 및 내용에 크게 차이가 나지 않음 경제에 관해서는 내용상 신문사 별 특성이 크지 않음을 시사 정확률재현률F-value 경향일보 0.4793390.3866670.428044 한겨레 0.4606740.5466670.5 동아일보 0.4834440.4866670.48505

16 문화 (전반) 4. Results 16 순위 경향신문한겨레신문동아일보 1 사람 2 삶학생작품 3 다산삶서울 4 자신생각한국 5 생각문제학생 6 살자신공연 7 저자공부미국 8 한국감독자신 9 죽영화교수 10 미국아이들저자 신문사별 주요 언급 단어 경향신문: 사람의 삶과 인간 동아일보: 서울 내 공연 정보 한겨레: 학생들의 공부관련 정보 논조 및 내용의 차이 검증 경향신문의 재현률이 0.7 이상, F- value가 0.5이상 -> 논조나 내용상 뚜렷한 특성을 지님을 시사 한겨레의 재현률이 0.18, F-value 가 0.23 -> 한겨레만의 뚜렷한 특 성을 가지고 있지 않음 정확률재현률F-value 경향일보 0.4015150.7066670.512077 한겨레 0.3461540.180.236842 동아일보 0.4259260.3066670.356589

17 문화 (전반) 4. Results 17 경향신문 Clustering 한겨레 Clustering

18 사설 (전반) 4. Results 18 순위 경향신문한겨레신문동아일보 1 대통령정부대통령 2 정부미국통진당 3 검찰대통령북한 4 광우병국민정부 5 미국검찰경선 6 당권파광우병미국 7 의혹국회한국 8 국민비례대표국민 9 당선자 비례대표 10 파이시티경선민주당 신문사별 주요 언급 단어 경향신문과 한겨레: 검찰과 광 우병, 미국을 높은 빈도로 다룸 동아일보: 통합진보당의 사건을 주로 다루며, 북한이나 민주당에 대한 언급 빈도도 다른 두 신문 사에 비해 높았음 논조 및 내용의 차이 검증 동아일보가 0.59로 다소 특성을 지님을 알 수 있지만 전반적으로 높지 않은 분류 성능 보임 정확률재현률F-value 경향일보 0.3846150.50.434783 한겨레 0.5116280.440.473118 동아일보 0.5952380.50.543478

19 국제 (북한 핵실험) 4. Results 19 순위 경향신문한겨레신문동아일보 1 미국 2 대통령 중국 3 로켓중국한국 4 중국합의대통령 5 오바마로켓미사일 6 3호3호 오바마로켓 7 광명성미사일김정은 8 핵실험유엔문제 9 정부위성정상 10 합의장거리서울 신문사별 주요 언급 단어 동아일보가 기사를 가장 많이 다루고 있었음 핵안보정상회의가 개최되는 시 기를 근처로 분석: 세 신문사 모 두 미국, 중국, 대통령 중심 기사 경향신문, 한겨레: 합의 언급 동아일보: 김정은 언급 논조 및 내용의 차이 검증 내용이나 논조 상 큰 특성을 보 이지는 않음 정확률재현률F-value 경향일보 0.4302330.370.397849 한겨레 0.51250.410.455556 동아일보 0.3955220.530.452991

20 정치 (통합진보당) 4. Results 20 순위 경향신문한겨레신문동아일보 1 당선자대표당선자 2 문제투표대표 3 당원 경선 4 후보문제후보 5 사태경선당원 6 사람후보사퇴 7 국회 8 경선부정 9 총선당선자의원 10 검찰국민북한 신문사별 주요 언급 단어 동아일보: 국회, 북한 경향신문: 검찰 한겨레: 국민 논조 및 내용의 차이 검증 정확률: 모두 0.6 이상 특히 경향신문의 정확률은 0.84, F-value는 0.81, 한겨레의 재현률 은 0.8로 매우 높은 분류 성능 내용이나 논조에 있어 세 신문 간 확연한 차이 발견 정확률재현률F-value 경향일보 0.8478260.780.8125 한겨레 0.6557380.80.720721 동아일보 0.6279070.540.580645

21 정치 (통합진보당) 4. Results 21 경향신문 한겨레 동아일보

22 사회 (4대강 사업) 4. Results 22 순위 경향신문한겨레신문동아일보 1 대통령 살리기 2 국민영어낙동강 3 교수일자리지역 4 정책국민일자리 5 대운하녹색 6 이명박 영산강 7 녹색 물 8 정비사업석면자전거 9 경제청와대주민 10 시장건설계획 신문사별 주요 언급 단어 동아일보: 살리기, 낙동강, 일자 리, 녹색, 자전거 등과 같이 4대 강에 대한 긍정적인 단어 사용 경향신문과 한겨레는 주로 대통 령과 4대강을 연결하여 언급 논조 및 내용의 차이 검증 경향신문과 한겨레 두 신문의 논조나 내용이 거의 비슷하여 경 향신문이 한겨레로, 한겨레가 경 향신문으로 분류가 되었음 정확률재현률F-value 경향일보 0.4358970.340.382022 한겨레 0.3493980.580.43609 동아일보 0.6428570.360.461538

23 사회 (4대강 사업) 4. Results 23 경향신문 한겨레 동아일보

24 사회 (4대강 사업) 4. Results 24 4대강 사업에 대한 긍정, 부정적 논조 분류 성능 평가 학습을 시킨 긍정 및 부정적인 문단은 각 신문별로 150개씩 테스트를 한 문단의 수는 각 신문사 당 50개씩 3개의 신문사에 관한 정확률과 재현률, F-value는 모두 0.6이상을 넘겨, 평균 0.7 정도로 다소 신뢰성이 있게 분류되었다고 판단할 수 있음 정확률재현률F-value 경향일보 0.6724140.780.722222 한겨레 0.620.7380950.673913 동아일보 0.6724140.780.722222

25 사회 (4대강 사업) 4. Results 25 4대강 사업의 논조 확인을 위한 데이터 수집 분류기의 성능 긍정적인 것에 대해 올바로 분류가 되는 확률은 F-value 상 72% 정도 부정적으로 분류될 확률은 67%정도 전체적으로 70% 정도의 신뢰도를 가지고 긍정성 및 부정성 확인 검색 일자2012.04.08- 2012.07.08 검색 내용키워드: 4대강 사업 신문기사 수경향: 97개 / 한겨레: 85개 / 동아일보: 47개

26 사회 (4대강 사업) 4. Results 26 4대강 사업에 대한 세 신문사의 논조 분류 4대강 사업에 대해 70%의 확률로 동아일보는 경향신문에 비해 7% 더 긍 정적인 성향을 보이며, 한겨레에 비해서는 3%정도 더 긍정적으로 언급하 는 경향을 보인다고 분석할 수 있음

27 각 신문사별로 특성 발견이 가능한 연구로서의 의의 경제분야 전반이나 사회분야에서의 4대강 사업 관련 신문기사들에서 경향신문과 한겨레는 특정 단어들이 비슷한 순위에 위치하고 있었다면, 동아일보의 경우는 두 신문사와는 다르게 구성되어 있는 경우가 많음 키워드 Clustering에서 타 연구에서는 주로 다루지 않았던 문화 전반에 관한 기사나 정치분야에서의 통합진보당 관련 기사에서 세 신문사들 간의 내용 상 차이가 있음을 발견하였다는 점에서 의의가 있음 신문기사의 키워드들 간 관계를 네트워크 상으로 시각화에 의의 Classification에서는, 약 70%의 확률로 긍정과 부정적 논조가 분류됨 4대강 사업에 대해 경향신문과 한겨레는 부정적, 동아일보는 비교적 긍정적인 논조 사용 5. Conclusions 27

28 한글 뉴스를 텍스트마이닝하여 데이터 분석 한글 뉴스 3,000여 개 기사를 분석 시도에 의의 문단으로 분석을 시도 계량정보학적 분석을 접목시켜 clustering에 활용 학습 기법을 통한 Classification 적용 5. Conclusions 28 한계점 및 제안점 4대강 사업 외에도 논조의 긍정 및 부정성 분류가 가능한 주제 필요 긍정-부정의 두 분류 이외에도 중립의 입장이 필요 Classification의 0.7 정도의 분류 성능: 다양한 분류기 결합 필요 단순빈도를 사용했으나, 추후 연구에서는 가중치 부여도 가능 Uni-gram 이외에 bi-gram이나 tri-gram 등 활용 가능

29 연구의 발전 방향 및 활용 방안 온라인 신문기사의 경우, 신문기사를 접하는 독자들이 기사 내용에 대한 객관성을 유지할 수 있도록 신문기사의 윗부분에 해당 신문사가 가지고 있는 특정 이슈에 대한 긍정성 및 부정성의 정도를 표시해주 는 방향으로 활용 가능 신문기사 논조의 스팩트럼을 작성하여 그래프로 제공 가능 독자가 접하는 신문사와 다른 신문사들의 논조 차이 제시 하나의 주제에 대한 긍정성 및 부정성에 대한 수치를 색상으로 제공 긍정-부정성에 대해 그래프 상에서 상대적인 위치로 표시 객관성을 유지하기 위해 신문기사 주된 이슈의 범위 및 이슈화된 기간, 혹은 검색이 이루어지는 기간을 통일시켜 제시해야 함 5. Conclusions 29

30 후속 연구 : Topic Modeling 을 이용한 신문사 논조에 따른 대선 후보 기사 분석 30  자료 수집 : 한겨레신문, 경향신문, 조선일보, 동아일보 총 네 개의 매체에 대하여 2010 년 11 월 1 일부터 2012 년 10 월 31 일까지의 지면게재기사 후보논조 구분매체기사 수 박근혜 (8,110) 진보 (3,928) 한겨레1,880 경향2,048 보수 (4,182) 조선2,213 동아1,969 문재인 (3,244) 진보 (1,450) 한겨레685 경향765 보수 (1,794) 조선937 동아857 안철수 (4,359) 진보 (2,008) 한겨레960 경향1,048 보수 (2,351) 조선1,304 동아1,047

31 Topic Modeling Technique 31  Dirichlet 확률분포와 그 파라미터를 이용해서, 랜덤 프 로세스에 따라 데이터를 생성하는 관점의 모델. 즉, 문 서의 주제 분포와 각 주제별로 특정 단어를 생성할 확 률을 계산해서, 특정 문서에 분포되어있는 topic 들을 추론하는 기법

32 Topic Modeling 결과 32  초기값으로 10 개의 topic 을 생성. 이중에서 의미있는 7 개 topic 선정  Topic 1. 민생경제정책  Topic 2. 서울시장 보궐선거  Topic 3. 민주통합당  Topic 4. 정수장학회  Topic 5. 과거사  Topic 6. 참여정부  Topic 7. 남북관계

33 Topic 1. 민생경제정책 33 진보지보수지 경제민주화,새누리당, 대기업,박근혜,민주 통합당,일자리,복지 국가,법인세,중소기 업,소득세,김종인,순 환출자,포퓰리즘,양 극화,보편적,위원회, 연구원,개정안,비정 규직 경제민주화,대기업, 새누리당,일자리,박 근혜,연구원,중소기 업,전문가,위원회,우 리나라,소득세,양극 화,싱크탱크,김종인, 비정규직,시스템,법 인세,민주통합당,순 환출자 박근혜

34 Topic 1. 민생경제정책 34 문재인 진보지보수지 경제민주화,일자리,문재 인,대기업,테마주,중소기 업,박근혜,새누리당,민주 통합당,김호기,양극화,이 정우,전문가,대법원,등록 금,순환출자,자영업,김상 조,대법관 경제민주화,일자리,대기 업,박근혜,문재인,중소기 업,새누리당,안철수,전문 가,비정규직,순환출자,양 극화,위원회,우리나라,민 주통합당,에너지,시대정 신,보편적,복지국가

35 Topic 1. 민생경제정책 35 안철수 진보지보수지 민주주의,이명박,안철수, 노동자,민주화,리더십,사 회적,경제적,비정규직,지 도자,복지국가,자본주의, 양극화,신자유주의,공동 체,근본적,진보적,김호기, 이야기 대기업,경제민주화,일자 리,중소기업,위원회,안철 수,우리나라,무소속,양극 화,자본주의,비정규직,동 반성장,사회적,글로벌,전 문가,경쟁력,순환출자,경 제학,고려대

36 * References 36 김정아, 채백, “언론의 정치 성향과 프레임: ‘이해찬 골프’와 ‘최연희 성추행’ 사건의 보도를 중심으로”, 한국언 론정보학보, 41권(2008), 232~267. 미디어투데이. “신문 이념성향 따라 국감보도 ‘정당 편향’”. Accessed 2012.04.12,. 백용규, 서용무, “인터넷 뉴스 기사에 대한 자동 분류 정보 시스템에 관한 연구”. 한국경영정보학회 학술대회 2003년 추계학술대회, 2003년 11월, 한국경영정보학회. 574~580. 이민규, 김수정, “호주제 폐지에 대한 뉴스 프레이밍 비교 연구: 조선일보, 국민일보, 한겨레신문을 중심으로”, 한국언론정보학보, 34권(2006), 132~162. 이재윤, “계량서지적 네트워크 분석을 위한 중심성 척도에 관한 연구”, 한국문헌정보학회지, 40권 3호 (2006a), 191~214. 이재윤, “지적 구조 분석을 위한 새로운 클러스터링 기법에 관한 연구”, 정보관리학회지, 23권 4호(2006b), 215~231. 정영미, 정보검색연구, 구미무역, 서울, 2005. 정제철, “한국언론과 이념 담론”, 한국언론학보, 46권 4호(2002), 314~348. 최진호, 김희수, 임남규, “기술예측을 위한 특허 키워드 네트워크 분석”, 지능정보연구, 17권 4호(2011), 227~240. 최현주, 신문시장의 다양성과 주요 신문들의 보도 성향에 대한 비교 고찰, 한국언론학회, 2010.

37 * References 37 Carlos H. Caldas, and Lucio Soibelman, “Automating hierarchical document classification for construction management information systems,” Journal of Automation in Construction, Vol.12(2003), 395~406 Pollak, Senja, Roel Coesemans, Walter Daelemans and Nada Lavra č, “Detecting Contrast Patterns in Newspaper Articles by Combining Discourse Analysis and Text Mining,” Pragmatics, Vol.21, No.4(2011), 647~683. Balahur, A., and R. Steinberger, “Rethinking sentiment analysis in the news: From theory to practice and back,” In Proceedings of the 1st Workshop on Opinion Mining and Sentiment Analysis, Satellite to CAEPIA 2009, (2009).

38 감사합니다 38

39 39 1. 박근혜 1) 진보 민생경제정책00.1396713472경제민주화새누리당대기업박근혜민주통합당일자리복지국가법인세중소기업소득세김종인순환출자포퓰리즘양극화보편적위원회연구원개정안비정규직 미디어10.085438610트위터박근혜프로그램인터넷미디어아파트드라마인터뷰이야기서비스네트워크김어준조중동사용자시청률시청자룸살롱스타일김용민 새누리당(당대표/대선후보경선)20.4047226825새누리당박근혜원내대표최고위원지도부이명박비상대책위원회비대위이재오위원회전당대회비대위원김문수쇄신파홍준표황우여이한구정몽준당대표 선거여론조사30.2510526598이명박민주통합당문재인박근혜안철수지지율새누리당단일화여론조사대통령노무현손학규포인트지지층이사장유권자서울대융합과학기술대학원김두관서울시장 새누리당(총선)40.1121713680새누리당박근혜대변인선대위위원회당선자정치쇄신선관위기자회견여의도후보자비서실비상대책위원회대법관브리핑대통령현영희현기환국회의원 과거사50.1025915239대통령박정희박근혜아버지인혁당쿠데타과거사김대중새누리당대한민국민주화전두환대법원김영삼민주주의피해자지도자노무현장준하 정수장학회60.0554910756정수장학회이사장문화방송부산일보박근혜김지태저축은행최필립새누리당박정희김재철위원회언론사방문진박지만민주통합당테마주기자회견이사회 서울시장선거70.2148716733새누리당민주통합당진보당서울시장지역구비례대표박근혜무상급식보궐선거국회의원최고위원투표율주민투표나경원오세훈유권자한명숙수도권박원순 이명박정부정책80.2495617256이명박새누리당청와대대통령박근혜민주통합당민간인비상대책위원회불법사찰후보자노무현청문회이상득해군기지저축은행비서관대변인위원회남북관계 ? 90.2547320971민주주의대통령박근혜노동자리더십민주화이야기사회적이명박등록금대한민국지도자노무현비정규직경제적국회의원전태일우리나라목소리 2) 보수 ? 00.1777917851민주통합당새누리당박근혜진보당대변인선대위문재인노무현박지원위원회선진당청와대최고위원이해찬원내대표정치쇄신한명숙해군기지민간인 과거사10.2174218208대통령박근혜박정희노무현새누리당아버지대한민국김대중민주주의리더십민주화청와대지도자과거사국회의원김영삼인터뷰쿠데타이야기 ? 20.1624811974박근혜트위터프로그램인터넷경기도올림픽서울대메시지대학생위원회사무실안철수네트워크서비스김문수동영상공무원여의도이야기 민생경제정책30.1672813883경제민주화대기업새누리당일자리박근혜연구원중소기업전문가위원회우리나라소득세양극화싱크탱크김종인비정규직시스템법인세민주통합당순환출자 서울시장선거40.090578870새누리당서울시장무상급식주민투표보궐선거민주통합당박근혜최고위원오세훈나경원서울시등록금박원순투표율포퓰리즘반값등록금유권자서울시민홍준표 ? 50.1241812505새누리당지역구당선자비례대표박근혜이명박국회의원무소속불출마비상대책위원회위원회민주통합당후보자수도권선거구후원금여론조사대변인백지화 새누리당60.4368135593새누리당이명박박근혜원내대표최고위원지도부청와대비상대책위원회비대위이재오전당대회당대표대통령비대위원위원회정몽준소장파황우여김문수 선거여론조사70.2551527772이명박새누리당민주통합당박근혜지지율문재인안철수여론조사포인트단일화유권자리서치손학규이사장노무현지지층서울대융합과학기술대학원수도권대통령 정수장학회80.058426672정수장학회이사장테마주박근혜저축은행박지만부산일보투자자새누리당문재인최필립상한가이명박컴퍼니김지태안철수연구소구제역아가방연구원 남북관계90.067816904김정일한반도연평도정상회담이명박천안함탈북자대통령남북관계러시아박근혜미사일김일성통일부대화록대사관조문단김정은정상회의


Download ppt "텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 연세대학교 문헌정보학과 송민"

Similar presentations


Ads by Google