Sentiment Analysis 유재명.

Slides:



Advertisements
Similar presentations
©2004 by South-Western/Thomson Learning 1 베이커리소비자 개인소비가치에 따른 유기농제품의 소비태도가 구매 후 만족도에 미치는 영향 이 윤 희이 윤 희 지도교수 : 진양호 교수님.
Advertisements

작품을 통해 살펴본 전통사회와 현대사회의 갈등 인문학부 손명학 공학계열 김능배 사회체육 김영수 현대사회와 사회학.
폭력. 폭력이란 무엇인가 우상의 눈물 물리적인 폭력 ( 최기표 ) VS 지능적인 폭력 ( 임형우, 담임선생님 )
 오산대학교 Page 1 주요 재무비율의 비교 ( 比較 ) 와 보완 ( 補完 ) 주요 재무비율의 비교 ( 比較 ) 와 보완 ( 補完 )
사회복지시설의 예산·회계에 대한 이해 태화복지재단 사 무 총 장 유 영 덕. Ⅰ. 회계의 의의.
1 박 2 일 !!! 인천마장초등학교 유수아. 1 박 2 일 멤버 인기순 위 1 위 이승기 2 위 엄태웅 3 위 은지원 4 위 김종민, 이수근 ※인터넷에서 본것이기 때문에 사람에따라 서 다를 수 있다. ※
당신의 조직에 ‘이기는 습관’을 심어라! 동사형 조직 프로 지독한 사관학교 프로세스 마케팅적 집요한 사고 실행력 규범이 있는
청소년범죄와 사회유해환경 박석돈 교수.
석관중앙교회 5남전도회 석 관 중 앙 교 회 회원 소식 통권 05-04호 발행일 : 2005년 04월 회 장 : 장진호 집사
숲과 인간과의 관계 강사 : 왕 미 영 소속 : 포항 생명의 숲.
한국경제교육협회 일반인 표준 경제 개념 9. 인플레이션과 실업
지역사회복지론 1조. 요양보호시설에 대해서 황성국 임재형 이동영
- 예∙결산 및 기본재산 운영 신뢰도 제고를 위한 실태점검, 결산지원사업 -
좋은 강의 국제관계학과 정연식.
박근혜 2년? 행복하셨습니까? 박근혜 2년은 이다 살의를 느끼게 한 세월 멈춰버린 대한민국 답답한 이년.
Regularization 과적합(overfitting) 문제 Machine Learning.
01. 과업의 개요 공간적ㆍ시간적 범위 내용적 범위 과업의 기대효과
Machine Learning to Deep Learning_2
학교교육제도 이해하기 천안청룡초등학교 교사 임 병 현.
2014학년도 중학교 교육과정 편성시 유의사항 울산광역시교육청 교육과정운영과 한 상 철.
14주차 1교시 강화계획 [학습목표] 1. 강화계획의 정의를 안다 [학습내용] 1. 단순한 강화계획 2. 간헐적 강화 3. 복합 계획 4. 선택과 대응법칙 [사전학습] 강화계획이 일어날 수 있는 사례를 생각해본다.
숲과 인간과의 관계 강사 : 왕 미 영 소속 : 포항 생명의 숲.
국제기업환경과 글로벌기업의 성공스토리 국제기업환경론 2017년 2학기.
연장근로와 야간·휴일근로 김영호 노무사 나눔 노사관계연구소 소장 연세대 일반대학원 박사 수료 고려사이버대 법학과 외래교수
I 문학의 개념과 역할 1. 문학의 개념 (1) 언어 예술로서의 문학 (2) 소통 활동으로서의 문학
학교폭력과 청소년 - 영원히 씻을 수 없는 상처가 된다.
REC 가격예측 분석 발표자: 김주철.
Chapter 5. Q-LEARNING & DEEP SARSA
4. 목적론적 윤리와 의무론적 윤리 01. 경험주의와 이성주의 01. 경험주의와 이성주의 02. 결과론적 윤리와 공리주의
공 지 사 항 5월 14일 그룹웨어시스템을 오픈합니다. ☞ 그룹웨어를 사용하기 위해서는 페이지 3에 있는 그룹웨어설치방법에 따라 시스템을 설치하여야 합니다. 5월 13일(저녁)에 최종 설치파일을 업로드할 예정이니 14일 출근하시면 설치를 진행해 주십시오. 이미 기존에 설치하여.
Python Network Data Science Lab Seunghun Lee, KangHee Lee
머신 러닝 2 ㈜ 퀀트랩.
Machine Learning to Deep Learning
개항기 조선과 동아시아 박 범 한국역사입문Ⅱ.
壽齊天.
훈련 시작을 위한 준비의 날.
뉴로 컴퓨터 개론 제 6 장.
배수공법 6조 김은아 김해김씨 목경파 박성진 무안박씨 노성파
입소문이 강한 기업만들기 하나인치과병원.
정품 라이센스.
대구의 부도심 대구의 주요축 동대구 부도심 4조 강민석 / 박성균 / 최은지/ 황재현/김예지.
제2편 수사의 과정 제1장 수사의 진행 절차 제2장 수사의 진행 방법.
기업회생 절차.
2. 윤리학의 원리와 적용 가. 상대주의와 절대주의.
Ⅲ. 세계의 자연환경 -열대기후와 주민생활.
강의 프레젠테이션 현대 사회와 미디어 12강. 미디어 문화.
기술 진화와 진보.
사도행전 13장 22절 말씀 –아멘 다 윗 을 왕 으 로 세 우 시 고 증 언 하 여 이 르 시 되 내 가 이 새 의 아 들
화덕갈비 전문점 돈 소리                     철저한 프로의식의 길   불필요한 자존심을 버릴 것   자기자본 60% 이하는 하지 말 것
평생 저축해도 강남 아파트 못산다 학 과 : 회계학과 1학년 B반 과 목 : 회계학원론 담당교수: 박성환 교수님
북스타트.
경찰행정과 세미나 결과를 공개해야한다. VS 비공개로 해야한다. 경찰의 근무성적평정 제도.
에듀팟-자기소개서작성.
K Nearest Neighbor.
교육기부 진로체험기관 인증제와 지역 센터 운영 방안 한국직업능력개발원 김승보.
Linear Model.
2. 청소년 문제와 청소년 건전한 청소년 문화의 정립 (3) [ ] 나상균.
텍스트 분석 ㈜ 퀀트랩.
교육훈련 기획 및 운영실무 교육훈련 기획 및 운영실무 교육훈련 기획 및 운영실무.
근골격계 질환 어떻게 싸울 것인가 한국노동안전보건연구소(준) 동아대학교병원 산업의학과 김 윤 규.
3. 불교 윤리 사상 01. 불교 사상의 연원과 전개 01. 불교 사상의 연원과 전개 02. 불교 사상의 특징
영상으로 읽는 한국사 02 삼국은 서로를 한 ‘민족’으로 생각했나? - 삼국통일의 의미-.
삶을 풍요롭게 만드는 의사소통.
‘미국의 평생교육’ 배은혜, 최정화.
시민으로서의 권리와 의무 사회(일반사회) 중학교 2학년 2학기 Ⅶ. 사회생활과 법규범
Progress Seminar 선석규.
노인복지론 제 9회 노인 교육 김인철 윤재홍 이영훈.
제2부 제9장 건강장애아동 특수교육학 개론.
인하대학교 평생교육사 6기 A반 2조 : 김은주,김지연,김혜원 박경애,박광숙,여혜정
Presentation transcript:

Sentiment Analysis 유재명

감정 분석 회귀분석/분류분석의 일종 문장의 감정(sentiment)을 예측 점수  회귀분석 긍/부정  분류분석

감정 분석의 방법 사전 기반 기계학습 기반

선형회귀분석을 이용한 사전 개발 회귀계수 > 0: 긍정 단어 회귀계수 < 0: 부정 단어 문제점: 단어가 너무 많음

과적합 overfitting 데이터를 지나치게 많이 설명하는 것 데이터 = 패턴 + 잡음 새로운 데이터를 잘 설명하지 못하게 됨 복잡한 모형일 수록 과적합이 잘 일어남

텍스트 분석에서 과적합 텍스트 분석에서 단어 = 변수 단어 많음  변수 많음  모형 복잡

정규화 Regularization 오차 = 실제값 – 예측값 OLS는 (오차2)만을 최소화 정규화는 (오차2 + 정규화 항)을 최소화

정규화 Regularization Lasso (L1): 회귀계수의 절댓값의 합 Ridge (L2): 회귀계수의 제곱의 합 어느 쪽이나 회귀계수가 작아짐 극단적인 예측이 줄어듦

Lasso vs. Ridge

Lasso vs. Ridge Lasso Ridge 회귀계수를 0으로 만드는 경향이 있음 사전을 만들 때 유용 회귀계수를 전반적으로 줄임 대체로 새로운 데이터의 예측력이 좋음

Elastic Net 오차2 + Lasso + Ridge Lasso와 Ridge를 모두 사용

선형모형의 장점과 한계 회귀계수의 해석이 쉬움 긍/부정 단어를 찾을 수 있음 과적합 우려가 적음 예측력 제한

선형모형의 장점과 한계 예측만 더 잘하고 싶다면 다른 모형 사용 SVM Random Forest XGBoost Deep Learning

감정분석 = 회귀분석 종속변수가 ‘감정’일 뿐… 다른 변수도 통계적으로는 동일