Download presentation
Presentation is loading. Please wait.
1
빅데이터 연구회 6주차 발표 주제 : 서포트 벡터 머신 통계학과 서태석
2
서포트 벡터 머신 SVM( Support Vector Machine) 초평면 최대 마진 소프트 마진 커널 방법
3
SVM Support Vector Machine 속성 값에 따라 다차원 공간의 예제를 여러 가지 점 간의 경계를 정의하는
초평면 또는 초평면들의 집합으로 구성 분류와 수치 예측을 포함한 거의 대부분의 학습 태스크에 쓰인다. 최대 마진 분류기
4
초평면(MMH) Maximum Margin Hyperplane 유사한 데이터를 그룹 선형경계 그룹을 나누는 이상적인 직선
5
최대 마진 직선과 데이터 사이의 거리가 최대. 선형적 데이터 -컨벡스 홀 (convex hull)
마진 : 초평면과 서포트벡터 사이의 거리. 이것이 가장 큰 것이 일반화 오류가 작다.
6
소프트 마진 비선형적인 구별 방안에 있는 코끼리 (Modern Family) 여유변수 (slack variable)
비용 값(cost value) 벌칙 점(penalty)
8
커널 방법 Kernel Trick 데이터에 부가적인 차원을 추가 벡터 간 내적 계산 아예 다른 Space로 Mapping
실제로 데이터를 고차원으로 변환하는 대신 고차원에서 벡터 간 내적 계산을 했을 때와 같은 값을 반환하는 함수들을 사용한다. 즉 데이터를 고차원으로 옮긴 듯한 효과만 발생시키며, 계산비용증가를 막을 수 있다
9
비선형 커널 SVM
Similar presentations