Latent Semantic Analysis 유재명
잠재 변수(latent variable) 종교 시설이 많은 도시가 범죄도 많다
잠재 변수(latent variable) 종교 시설이 많은 도시가 범죄도 많다 가설1: 종교 범죄 가설2: 범죄 종교
잠재 변수(latent variable) 종교 시설이 많은 도시가 범죄도 많다 가설1: 종교 범죄 가설2: 범죄 종교 가설3: (제3의 변수) 종교 범죄
잠재 변수(latent variable) 종교 시설이 많은 도시가 범죄도 많다 가설1: 종교 범죄 가설2: 범죄 종교 가설3: 인구 종교 범죄
잠재 의미 분석 의미 단어
차원 축소
차원 축소
차원 축소
Term-Document Matrix 문서1: 버락 오바마 문서2: 오바마 대통령 문서3: 미국 대통령 문서1 문서2 문서3 오바마 미국 대통령
차원 축소 문서1: 버락 오바마 문서2: 오바마 대통령 문서3: 미국 대통령 문서1 문서2 문서3 버락 오바마 미국 대통령 1
차원 축소를 하는 이유 문서들이 단어가 아닌 의미상으로 재배치 동음이의어, 오탈자 등이 (어느 정도) 처리됨 문서에 존재하는 noise가 줄어 더 잘 분류됨
코사인 유사도(Cosine similarity)
코사인 유사도(Cosine similarity)
코사인 유사도(Cosine similarity)