Download presentation
Presentation is loading. Please wait.
1
Latent Semantic Analysis
유재명
2
잠재 변수(latent variable)
종교 시설이 많은 도시가 범죄도 많다
3
잠재 변수(latent variable)
종교 시설이 많은 도시가 범죄도 많다 가설1: 종교 범죄 가설2: 범죄 종교
4
잠재 변수(latent variable)
종교 시설이 많은 도시가 범죄도 많다 가설1: 종교 범죄 가설2: 범죄 종교 가설3: (제3의 변수) 종교 범죄
5
잠재 변수(latent variable)
종교 시설이 많은 도시가 범죄도 많다 가설1: 종교 범죄 가설2: 범죄 종교 가설3: 인구 종교 범죄
6
잠재 의미 분석 의미 단어
7
차원 축소
8
차원 축소
9
차원 축소
10
Term-Document Matrix 문서1: 버락 오바마 문서2: 오바마 대통령 문서3: 미국 대통령 문서1 문서2 문서3
오바마 미국 대통령
11
차원 축소 문서1: 버락 오바마 문서2: 오바마 대통령 문서3: 미국 대통령 문서1 문서2 문서3 버락 오바마 미국 대통령 1
12
차원 축소를 하는 이유 문서들이 단어가 아닌 의미상으로 재배치 동음이의어, 오탈자 등이 (어느 정도) 처리됨
문서에 존재하는 noise가 줄어 더 잘 분류됨
13
코사인 유사도(Cosine similarity)
14
코사인 유사도(Cosine similarity)
15
코사인 유사도(Cosine similarity)
Similar presentations