5 장. SVM 오일석, 패턴인식, 교보문고, 2008. © 오일석, 전북대학교 컴퓨터공학.

Slides:



Advertisements
Similar presentations
1. 도형의 연결 상태 2. 꼭지점과 변으로 이루어진 도형 Ⅷ. 도형의 관찰 도형의 연결상태 연결상태가 같은 도형 단일폐곡선의 성질 연결상태가 같은 입체도형 뫼비우스의 띠.
Advertisements

수치해석 (Numerical Analysis) 보간법 (Interpolation). Page 2 보간법 (Interpolation) In this chapter … 보간법이란 ? 통계적 혹은 실험적으로 구해진 데이터들 (x i ) 로부터, 주어진 데이터를 만족하는 근사.
Add Your Text 5. 지수함수와 로그함수 1. 지수함수 2. 로그함수 · 지수함수와 그 그래프 · 지수방정식과 지수부등식 · 로그 함수와 그 그래프 · 로그방정식과 로그부등식.
컴퓨터와 인터넷.
재료수치해석 HW # 박재혁.
Report #5 - due: 4/13 다음 10*5의 희소 행렬 A, B를 고려하라.
(Numerical Analysis of Nonlinear Equation)
공차 및 끼워맞춤.
11장. 최적화 알고리즘 오일석, 패턴인식, 교보문고, © 오일석, 전북대학교 컴퓨터공학.
수치해석 6장 예제문제 환경공학과 천대길.
질의 사항 Yield Criteria (1) 소재가 평면응력상태에 놓였을 때(σ3=0), 최대전단응력조건과 전단변형에너지 조건은σ1 – σ2 평면에서 각각 어떤 식으로 표시되는가? (2) σ1 =σ2인 등이축인장에서 σ = Kεn로 주어지는 재료의 네킹시 변형율을 구하라.
제Ⅲ부 상미분 방정식의 근사해법과 유한요소해석
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
Error Detection and Correction
23장. 구조체와 사용자 정의 자료형 2.
2007 1학기 11 프로젝트 기초 실습.
Tail-recursive Function, High-order Function
Chapter 07. 기본 함수 익히기.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
1 장. 소개 오일석, 패턴인식, 교보문고, © 오일석, 전북대학교 컴퓨터공학.
11장. 1차원 배열.
일차방정식의 풀이 일차방정식의 풀이 순서 ① 괄호가 있으면 괄호를 먼저 푼다.
제4장 제어 시스템의 성능.
별의 밝기와 거리[2] 밝다고 가까운 별은 아니야! 빛의 밝기와 거리와의 관계 별의 밝기 결정.
9장. 특징 선택 오일석, 패턴인식, 교보문고, © 오일석, 전북대학교 컴퓨터공학.
Ⅲ. 이 차 방 정 식 1. 이차방정식과 그 풀이 2. 근 의 공 식.
빅데이터 연구회 6주차 발표 주제 : 서포트 벡터 머신 통계학과 서태석.
프로그래밍 개요
벡터의 공간 이문현.
자료구조: CHAP 7 트리 –review 순천향대학교 컴퓨터공학과 하 상 호.
수학 토론 대회 -도형의 세가지 무게중심 안다흰 임수빈.
3 장. 확률 분포 추정 오일석, 패턴인식, 교보문고,
Term Projects 다음에 주어진 2개중에서 한 개를 선택하여 문제를 해결하시오. 기한: 중간 보고서: 5/30 (5)
Metal Forming CAE Lab., Gyeongsang National University
컴퓨터 프로그래밍 기초 - 10th : 포인터 및 구조체 -
4장 기하학적 객체와 변환 - 기하 1장 – 그래픽스 시스템과 모델 2장 – 그래픽스 프로그래밍 3장 – 입력과 상호작용
고체역학 2 - 기말고사 1. 단면이 정사각형이고 한번의 길이가 a 일 때, 최대굽힘응력과 최대전단응력의 비를 구하라(10).
8장. spss statistics 20의 데이터 변환
삼각형에서 평행선에 의하여 생기는 선분의 길이의 비
컴퓨터 프로그래밍 기초 - 8th : 함수와 변수 / 배열 -
1. 2진 시스템.
미분방정식.
수학10-나 1학년 2학기 Ⅳ.삼각함수 4. 삼각방정식과 삼각부등식(9/12) 삼각함수 수업계획 수업활동.
Excel 일차 강사 : 박영민.
01 로그의 정의 ⑴ 일 때, 양수 에 대하여 을 만족시키는 실수 는 오직 하나 존재한다. 이때 를
수학10-나 1학년 2학기 Ⅱ.부등식의 영역 2. 연립부등식의 영역 (3/5) 부등식 영역 수업계획 수업활동.
수학10-나 1학년 2학기 Ⅱ.부등식의 영역 1. 부등식의 영역(2/5) 부등식 영역 수업계획 수업활동.
알고리즘 알고리즘이란 무엇인가?.
에어 PHP 입문.
4장. 데이터 표현 방식의 이해. 4장. 데이터 표현 방식의 이해 4-1 컴퓨터의 데이터 표현 진법에 대한 이해 n 진수 표현 방식 : n개의 문자를 이용해서 데이터를 표현 그림 4-1.
수학10-나 1학년 2학기 Ⅳ.삼각함수 3. 삼각함수의 그래프( 8 / 12 ) 삼각함수 수업계획 수업활동.
Chapter 1 단위, 물리량, 벡터.
Support Vector Machine
원의 방정식 원의 방정식 x축, y축에 접하는 원의 방정식 두 원의 위치 관계 공통접선 원과 직선의 위치 관계
Chapter 1 단위, 물리량, 벡터.
1. 접선의 방정식 2010년 설악산.
쉽게 배우는 알고리즘 2장. 점화식과 점근적 복잡도 분석
상관계수.
컴퓨터공학과 손민정 Computer Graphics Lab 이승용 교수님
문장제 쉽게 풀기 -최소공배수 응용 문제.
제 3장. Regular Languages 와 Regular Grammars
수치해석 ch3 환경공학과 김지숙.
9장. spss statistics 20의 데이터 변수계산
수학10-나 1학년 2학기 Ⅱ.부등식의 영역 3. 부등식의 영역에서 최대, 최소(5/5) 부등식 영역 수업계획 수업활동.
수학 2 학년 1 학기 문자와 식 > 미지수가 2개인 연립방정식 ( 1 / 1 ) 연립일차방정식의 해.
3 장. 확률 분포 추정 오일석, 패턴인식, 교보문고,
수학 2 학년 1 학기 문자와 식 > 부 등 식 ( 1 / 2 ) 일차부등식의 풀이.
수학 2 학년 1 학기 문자와 식 > 미지수가 2개인 연립방정식 ( 3 / 4 ) 대입법으로 풀기.
컴퓨터는 어떻게 덧셈, 뺄셈을 할까? 2011년 10월 5일 정동욱.
: 3차원에서 입자의 운동 방정식 제일 간단한 경우는 위치만의 함수 : 시간, 위치, 위치의 시간미분 의 함수
Presentation transcript:

5 장. SVM 오일석, 패턴인식, 교보문고, 2008. © 오일석, 전북대학교 컴퓨터공학

들어가는 말 SVM의 차별성 SVM 포털 기존 분류기는 ‘오류율을 최소화’ SVM은 ‘여백을margin 최대화’하여 일반화 능력의 극대화 꾀함 SVM 포털 2019-04-19

5.1 발상 분류기의 일반화 능력 중요한 문제 ②보다 ③이 여백이 더 크다. 즉 ③이 ②보다 일반화 능력이 뛰어나다. 신경망은 초기값 ①에서 시작하여 ②를 찾았다면 거기서 멈춘다. 왜? SVM은 ③을 찾는다. 중요한 문제 여백이라는 개념을 어떻게 공식화할 것인가? 여백을 최대로 하는 결정 초평면을 어떻게 찾을 것인가? 2019-04-19

5.2 선형 SVM 이진 분류를 위한 결정 초평면과 그것의 수학적 특성 2019-04-19

5.2 선형 SVM 예제 5.1 아래는 모두 같은 직선 점 x=(2,4)T에서 직선까지 거리 2019-04-19

5.2.1 선형 분리 가능한 상황 w (직선의 방향)가 주어진 상황에서, ‘두 부류에 대해 직선으로부터 가장 가까운 샘플까지의 거리가 같게 되는’ b를 결정 (①과 ②는 그렇게 얻은 직선) 여백은 그런 직선에서 가장 가까운 샘플까지 거리의 두 배로 정의함 가장 가까운 샘플을 서포트 벡터라 부름 2019-04-19

5.2.1 선형 분리 가능한 상황 이제 문제를 공식화해 보자. 그림 5.3에서 ①과 ②는 어느 것이 최적에 가까운가? ①보다 나은 것이 있나? 전형적인 최적화 문제임 2019-04-19

5.2.1 선형 분리 가능한 상황 여백은 아래와 같이 공식화 이제 문제를 조건부 최적화 문제로 공식화 훈련 집합 X={(x1,t1),…,(xN,tN)} 2019-04-19

5.2.1 선형 분리 가능한 상황 (5.5)를 간단한 형태로 변형하면, 문제의 특성 해의 유일성 (5.6)은 볼록이므로 해는 유일하다. 따라서 구한 해는 전역 최적 점을 보장한다. 문제의 난이도 N개의 선형 부등식을 조건으로 가진 2차 함수의 최적화 문제 조건부 최적화 문제는 라그랑제 승수로 푼다. (11.2.3 절) 2019-04-19

5.2.1 선형 분리 가능한 상황 라그랑제 승수 방법 목적 함수와 조건을 하나의 식 (즉 라그랑제 함수 L)으로 만들고, KKT조건을 이용하여 라그랑제 함수를을 최적화하는 해를 구한다. (αi는 라그랑제 승수) KKT 조건이란? 2019-04-19

5.2.1 선형 분리 가능한 상황 (5.7)의 KKT 조건 (5.11)에 의하면 모든 샘플이 αi=0 또는 ti(wTxi+b)-1=0이어야 함. αi≠0인 샘플이 서포트 벡터임 (5.8)에 의하면, 라그랑제 승수 αi 알면 w 구할 수 있음 (결정 초평면을 구한 셈) 이제부터 ‘w 구하는 대신 라그랑제 승수 구하는’ 문제로 관심 전환 (5.11)로 b 구할 수 있음 2019-04-19

5.2.1 선형 분리 가능한 상황 문제의 볼록 성질을 이용하여 풀기 쉬운 형태로 변환 볼록 성질을 만족하는 조건부 최적화 문제는 Wolfe 듀얼로 변형할 수 있다. (5.6)을 Wolfe 듀얼로 바꾸어 쓰면, 부등식 조건이 등식 조건이 되어 풀기에 유리함 2019-04-19

5.2.1 선형 분리 가능한 상황 간단한 수식 정리를 하면, 흥미로운 특성들 2차 함수의 최대화 문제임 w와 b가 사라졌다. (α를 찾는 문제가 되었다.) 특징 벡터 xi가 내적 형태로 나타난다. (비선형으로 확장하는 발판) 목적 함수의 두번째 ∑항은 N2개의 항을 갖는다. (여전히 풀기 어려운 문제) 2019-04-19

5.2.1 선형 분리 가능한 상황 지금까지 한 일을 정리하면, 2019-04-19

5.2.1 선형 분리 가능한 상황 예제 5.2: 두 개 샘플을 가진 경우의 문제 (5.13)의 풀이 훈련집합 (5.13)은 실제 값을 대입하면, 2019-04-19

5.2.1 선형 분리 가능한 상황 예제 5.2: 두 개 샘플을 가진 경우의 문제 (5.13)의 풀이 정리하여 풀면, (1/4,1/4)T에서 최대값을 가짐 (5.8)로 w, (5.11)로 b를 구하면 결국 결정 직선은 2019-04-19

5.2.1 선형 분리 가능한 상황 예제 5.3: 세 개 샘플을 가진 경우의 문제 (5.13)의 풀이 훈련집합 (5.13)에 실제 값을 대입하면, 이 문제를 어떻게 풀 것인가? 2019-04-19

5.2.1 선형 분리 가능한 상황 예제 5.3: 세 개 샘플을 가진 경우의 문제 (5.13)의 풀이 네 가지 경우로 나누어 분석적 풀이 ① α1=0, α2≠0, α3≠0 ② α1≠0, α2=0, α3≠0 ③ α1≠0, α2≠0, α3=0 ④ α1≠0, α2≠0, α3≠0 ① ② ④ 는 모순이므로 버림. 왜 모순? ③ α1≠0, α2≠0, α3=0인 경우를 풀면, 등식 조건으로부터 α1=α2이므로 (5.8)과 (5.11)로 w와 b를 구하면 결정 직선은 결국 α1=1/4, α2=1/4, α3=0 2019-04-19

5.2.2 선형 분리 불가능한 상황 선형 분리 불가능한 상황 샘플 (x,t)의 세 가지 상황 2019-04-19

5.2.2 선형 분리 불가능한 상황 슬랙 변수 ξ를 도입하여 하나의 식으로 쓰면, 2019-04-19

5.2.2 선형 분리 불가능한 상황 문제 공식화 길항tradeoff 관계를 갖는 두 가지 목적을 동시에 달성 목적 함수를 다시 쓰면 첫번째 항은 목적 1, 두번째 항은 목적 2 2019-04-19

5.2.2 선형 분리 불가능한 상황 문제 공식화 2019-04-19

5.2.2 선형 분리 불가능한 상황 라그랑제 승수로 풀어보면, 라그랑제 함수 KKT 조건 2019-04-19

5.2.2 선형 분리 불가능한 상황 라그랑제 승수로 풀어보면, Wolfe 듀얼로 변형 2019-04-19

5.2.2 선형 분리 불가능한 상황 라그랑제 승수로 풀어보면, (5.26)을 정리하면 (5.13)과 같다! 한 가지만 빼고. 0≤αi가 0≤αi≤C로 바뀜 2019-04-19

5.2.2 선형 분리 불가능한 상황 예제 5.4: 세 개 샘플을 가진 경우의 문제 (5.27)의 풀이 훈련집합 (선형 분리 가능한가?) (5.27)에 실제 값을 대입하면, 이 문제를 어떻게 풀 것인가? 2019-04-19

5.2.2 선형 분리 불가능한 상황 예제 5.4: 세 개 샘플을 가진 경우의 문제 (5.27)의 풀이 네 가지 경우로 나누어 분석적 풀이 ① α1=0, α2≠0, α3≠0 ② α1≠0, α2=0, α3≠0 ③ α1≠0, α2≠0, α3=0 ④ α1≠0, α2≠0, α3≠0 ① α1=0, α2≠0, α3≠0인 경우를 풀면, 등식 조건으로부터 α2=α3이므로 w와 b를, 그리고 결정 직선 그림에서 직선 ① x1은 오분류됨 결국 α1=0, α2=2, α3=2 2019-04-19

5.2.2 선형 분리 불가능한 상황 예제 5.4: 세 개 샘플을 가진 경우의 문제 (5.27)의 풀이 ② α1≠0, α2=0, α3≠0인 경우는 모순. 왜? ③ α1≠0, α2≠0, α3=0인 경우를 풀면, 등식 조건으로부터 α1=α2이므로 w와 b를, 그리고 결정 직선 그림에서 직선 ③ x3은 오분류됨 결국 α1=1/4, α2=1/4, α3=0 2019-04-19

5.2.2 선형 분리 불가능한 상황 예제 5.4: 세 개 샘플을 가진 경우의 문제 (5.27)의 풀이 ④ α1≠0, α2≠0, α3≠0인 경우를 풀면, α1=α2-α3를 대입한 후, 를 풀면 그림에서 직선 ④ 세 개의 샘플 모두 서포트 벡터 C에 따른 유효성 C<2이면 ③만 유효 2≤C<6.5이면 ①③만 유효 6.5≤C이면 모두 유효 무엇을 의미하는가? 결국 α1=3/2, α2=13/2, α3=5 2019-04-19

2019-04-19

5.3 비선형 SVM 비선형 SVM으로 확장 어려울 듯 보이지만 의외로 간단 커널의 활약 커널 적용이 가능한 이유는 (5.27)에서 ‘특징 벡터가 내적 형태로만’ 나타나기 때문 2019-04-19

5.3.1 커널 대치 더 높은 차원으로 매핑하여 선형 분리 불가능을 가능으로 만들 수 있다. 예제 5.5 원래 공간 매핑 함수 매핑 결과 2019-04-19

5.3.1 커널 대치 공간 매핑 SVM이 사용하는 커널 함수 예제 5.6 커널 함수의 성질 커널 함수 증명 2019-04-19

5.3.1 커널 대치 커널 대치 (커널 트릭) 어떤 수식이 벡터 내적을 포함할 때, 그 내적을 커널 함수로 대치하여 계산하는 기법 실제 계산은 L 공간에서 K()의 계산으로 이루어짐 고차원 공간 H에서 작업하는 효과 적용 예, Fisher LD의 커널 LD로의 확장, PCA를 커널 PCA로 확장 SVM에 적용 가능 (5.13)과 (5.27)에 벡터 내적만 나타나기 때문 실제 계산은 L에서 이루어지지만 분류는 선형 분류에 유리한 H에서 수행 꾀를 부려 차원의 저주를 피한 셈 2019-04-19

5.3.2 커널 대치를 이용한 비선형 SVM 커널 대치를 이용한 비선형 SVM 선형 분류가 부적절하면 L 대신 H 공간에서 분류 (그림 5.8) (5.13)과 (5.27)의 목적 함수를 바꾸어 씀 2019-04-19

5.3.2 커널 대치를 이용한 비선형 SVM SVM 이 사용하는 대표적인 커널들 커널 함수에 대응하는 매핑 함수는 몰라도 된다. 단지 존재한다는 사실만 알면 된다. 왜? 2019-04-19

5.4.1 학습 SVM 학습이란? 비선형 SVM을 위한 조건부 최적화 문제 (커널 트릭 적용) (5.1)의 w와 b를 구하는 과정 라그랑제 승수 α를 구하면 된다. 비선형 SVM에서는 아래 (5.35)를 풀어 α를 구함 비선형 SVM을 위한 조건부 최적화 문제 (커널 트릭 적용) 2019-04-19

5.4.1 학습 (5.35)를 어떻게 풀 것인가? 예를 들어, CENPARMI 숫자 DB의 경우 N=4000이다. 따라서 목적 함수는 8002000개의 2차 항을 가지 매우 복잡한 식 수치적 방법 대표적 알고리즘 SMO Cutting-plane 2019-04-19

5.4.2 인식 인식은 어떻게 할 것인가? 선형 SVM 라그랑제 승수 α로 w 구하기 서포트 벡터만 필요 2019-04-19

5.4.2 인식 비선형 SVM w 를 미리 구해놓을 수 없다. 인식 시간은 서포트 벡터의 개수에 비례 2019-04-19

5.4.3 M 부류 SVM M 부류 SVM으로 확장 이제까지는 이진 SVM 1대 M-1 방법 dj(x)는 부류 ωj를 위한 분류기 (ωj 샘플과 나머지 샘플을 분류함) 1대1 방법 모든 부류 쌍에 대해 이진 분류기 만듦 M(M-1)/2개의 이진 분류기 필요) 인식 결과를 가지고 투표 1대 M-1 방법을 많이 사용 2019-04-19

5.5 SVM의 특성 여백이라는 간단한 아이디어로 breakthrough 이룩함 SVM의 특성 사용자 설정 매개 변수가 적다. 커널 종류와 커널에 따른 매개 변수 (5.15)에서 목적 1 과 목적 2의 가중치 C 최적 커널을 자동 설정하는 방법 없음 실험에 의한 휴리스틱한 선택 일반화 능력 뛰어남 구현이 까다로움 OSS 활용 SVMlight LIBSVM 2019-04-19