빅데이터 연구회 6주차 발표 주제 : 서포트 벡터 머신 2011150139 통계학과 서태석
서포트 벡터 머신 SVM( Support Vector Machine) 초평면 최대 마진 소프트 마진 커널 방법
SVM Support Vector Machine 속성 값에 따라 다차원 공간의 예제를 여러 가지 점 간의 경계를 정의하는 초평면 또는 초평면들의 집합으로 구성 분류와 수치 예측을 포함한 거의 대부분의 학습 태스크에 쓰인다. 최대 마진 분류기
초평면(MMH) Maximum Margin Hyperplane 유사한 데이터를 그룹 선형경계 그룹을 나누는 이상적인 직선
최대 마진 직선과 데이터 사이의 거리가 최대. 선형적 데이터 -컨벡스 홀 (convex hull) 마진 : 초평면과 서포트벡터 사이의 거리. 이것이 가장 큰 것이 일반화 오류가 작다.
소프트 마진 비선형적인 구별 방안에 있는 코끼리 (Modern Family) 여유변수 (slack variable) 비용 값(cost value) 벌칙 점(penalty)
커널 방법 Kernel Trick 데이터에 부가적인 차원을 추가 벡터 간 내적 계산 아예 다른 Space로 Mapping 실제로 데이터를 고차원으로 변환하는 대신 고차원에서 벡터 간 내적 계산을 했을 때와 같은 값을 반환하는 함수들을 사용한다. 즉 데이터를 고차원으로 옮긴 듯한 효과만 발생시키며, 계산비용증가를 막을 수 있다
비선형 커널 SVM