빅데이터 연구회 6주차 발표 주제 : 서포트 벡터 머신 2011150139 통계학과 서태석.

Slides:



Advertisements
Similar presentations
빅 데이터의 정의와 특징 빅 데이터의 이용사례 빅 데이터의 문제점 or 한계점 빅 데이터의 전망.
Advertisements

R 프로그래밍 담당교수명 : 서 영 민 연 락 처 :
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
알고리즘 기본 개념 정렬 알고리즘 탐색 알고리즘 알고리즘 복잡도.
컴퓨터와 인터넷.
MS SQL Server 학기, 소프트웨어 설계 및 실험 ( Ⅰ )
의사 결정 트리(decision tree)
16 분석함수 분석 함수의 개념 분석 함수의 종류 계층적 질의문.
(Classification – Advanced Techniques)
신호처리 실험 (Signal Processing Lab)
(Numerical Analysis of Nonlinear Equation)
A CRM Consulting case with Point of Sales Data
Excel 일차 강사 : 박영민.
수치해석 6장 예제문제 환경공학과 천대길.
10장 랜덤 디지털 신호처리 1.
윤성우의 열혈 C 프로그래밍 윤성우 저 열혈강의 C 프로그래밍 개정판 Chapter 12. 포인터의 이해.
Vector Bubble 충돌 검출 게임 설계 3조 강준순, 김훈석, 복현태.
07 그룹 함수 그룹 함수의 개념 그룹 함수의 종류 데이터 그룹 생성 HAVING 절.
SqlParameter 클래스 선문 비트 18기 발표자 : 박성한.
컴퓨터 프로그래밍 기초 #02 : printf(), scanf()
Error Detection and Correction
컴퓨터과학 전공탐색 배상원.
6장. printf와 scanf 함수에 대한 고찰
Chapter 07. 기본 함수 익히기.
제 10장 주성분 분석(PCA) 주성분 분석(PCA)이란? 여러 개의 양적변수들 사이의 분산-공분산 관계를
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
1 장. 소개 오일석, 패턴인식, 교보문고, © 오일석, 전북대학교 컴퓨터공학.
3차원 객체 모델링.
C#.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
C 프로그래밍 C언어 (CSE2035) (Chap11. Derived types-enumerated, structure, and union) (1-1) Sungwook Kim Sogang University Seoul, Korea Tel:
Method & library.
자바 5.0 프로그래밍.
영진직업전문학교 (금) TensorFlow & 머신러닝.
벡터의 공간 이문현.
패턴인식 개론 Ch.12 선형 판별 분석법 (LDA).
Term Projects 다음에 주어진 2개중에서 한 개를 선택하여 문제를 해결하시오. 기한: 중간 보고서: 5/30 (5)
연산자 (Operator).
4장 기하학적 객체와 변환 - 기하 1장 – 그래픽스 시스템과 모델 2장 – 그래픽스 프로그래밍 3장 – 입력과 상호작용
BIC 사례 1 연관규칙과 분류모형을 결합한 상품 추천 시스템: G 인터넷 쇼핑몰 사례
삼각형에서 평행선에 의하여 생기는 선분의 길이의 비
5 장. SVM 오일석, 패턴인식, 교보문고, © 오일석, 전북대학교 컴퓨터공학.
데이터마이닝, 빅데이터, 데이터과학: 정의 데이터마이닝(data mining)
5강. 배열 배열이란? 배열의 문법 변수와 같이 이해하는 배열의 메모리 구조의 이해 레퍼런스의 이해 다차원 배열
2014년 가을학기 손시운 지도 교수: 문양세 교수님 데이터 프레임 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
네트워크 환경 구축과 이미지 전송 호스트/타겟 통신 직렬 통신을 이용한 이미지 전송 수퍼 데몬 BOOTP 환경 구축
Keller: Stats for Mgmt & Econ, 7th Ed 회귀모형의 정형화 Model Building
Week 3-2: 데이터분포 3_2장_1(백분율:Percentile)에서 동영상 1,2
자동제어공학 3. 물리적 시스템의 상태방정식 정 우 용.
수학10-나 1학년 2학기 Ⅱ.부등식의 영역 1. 부등식의 영역(2/5) 부등식 영역 수업계획 수업활동.
에어 PHP 입문.
Excel 일차 강사 : 박영민.
Word2Vec.
Word Embedding.
Support Vector Machine
Network 실습 경영과학응용.
Part 2 개념적 데이터 모델 Copyright © 2006 by Ehan Publishing Co. All rights reserved.
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
K Nearest Neighbor.
수치해석 (Numerical Analysis)
Week 4: 다변수(2변수) 데이터분석 5장_1(산포도: scatter plot) 동영상 1,2,3,4,5
텍스트 분석 ㈜ 퀀트랩.
RPTree 코드분석 (월) Dblab 김태훈.
2014년 가을학기 손시운 지도 교수: 문양세 교수님 행렬과 배열 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
9장. spss statistics 20의 데이터 변수계산
WISE OLAP.
: 3차원에서 입자의 운동 방정식 제일 간단한 경우는 위치만의 함수 : 시간, 위치, 위치의 시간미분 의 함수
Visual Basic .NET 기초문법.
Lecture #6 제 4 장. 기하학적 객체와 변환 (1).
제 2 회 보건의료 빅데이터 사이언티스트 인증 프로그램 일 시 : (월) – 04.04(금) (5일간)
Presentation transcript:

빅데이터 연구회 6주차 발표 주제 : 서포트 벡터 머신 2011150139 통계학과 서태석

서포트 벡터 머신 SVM( Support Vector Machine) 초평면 최대 마진 소프트 마진 커널 방법

SVM Support Vector Machine 속성 값에 따라 다차원 공간의 예제를 여러 가지 점 간의 경계를 정의하는 초평면 또는 초평면들의 집합으로 구성 분류와 수치 예측을 포함한 거의 대부분의 학습 태스크에 쓰인다. 최대 마진 분류기

초평면(MMH) Maximum Margin Hyperplane 유사한 데이터를 그룹 선형경계 그룹을 나누는 이상적인 직선

최대 마진 직선과 데이터 사이의 거리가 최대. 선형적 데이터 -컨벡스 홀 (convex hull) 마진 : 초평면과 서포트벡터 사이의 거리. 이것이 가장 큰 것이 일반화 오류가 작다.

소프트 마진 비선형적인 구별 방안에 있는 코끼리 (Modern Family) 여유변수 (slack variable) 비용 값(cost value) 벌칙 점(penalty)

커널 방법 Kernel Trick 데이터에 부가적인 차원을 추가 벡터 간 내적 계산 아예 다른 Space로 Mapping 실제로 데이터를 고차원으로 변환하는 대신 고차원에서 벡터 간 내적 계산을 했을 때와 같은  값을 반환하는 함수들을 사용한다.    즉 데이터를 고차원으로 옮긴 듯한 효과만 발생시키며, 계산비용증가를 막을 수 있다

비선형 커널 SVM