9장. 특징 선택 오일석, 패턴인식, 교보문고, 2008. © 오일석, 전북대학교 컴퓨터공학.

Slides:



Advertisements
Similar presentations
DNA Solution of the Hitting Set Problem 전기컴퓨터공학부 문승현, 김진.
Advertisements

Chapter 8. TEXT CLUSTERING 서울시립대 전자전기컴퓨터공학과 데이터마이닝 연구실 G 노준호.
알고리즘 기본 개념 정렬 알고리즘 탐색 알고리즘 알고리즘 복잡도.
이진 나무 구조 강윤섭 2008년 5월 23일.
컴퓨터와 인터넷.
전자파 연구실 Fast Beamforming of Electronically Steerable Parasitic Array Radiator Antennas: Theory and Experiment 세미나 자료 발표자 : 이동현 1.
Project Management(인력관리)
9장. C 언어의 핵심! 함수. 9장. C 언어의 핵심! 함수 9-1 함수의 정의와 선언 main 함수 다시 보기 : 함수의 기본 형태 { } 그림 9-1.
11장. 최적화 알고리즘 오일석, 패턴인식, 교보문고, © 오일석, 전북대학교 컴퓨터공학.
Report #2 - Solution 문제 #1: 다음과 같이 프로그램을 작성하라.
10장 랜덤 디지털 신호처리 1.
MySQL 및 Workbench 설치 데이터 베이스.
경영사례 및 영업협상 방법론.
Vector Bubble 충돌 검출 게임 설계 3조 강준순, 김훈석, 복현태.
CHAP 2:순환 순천향대학교 컴퓨터공학과.
Chapter 02 순환 (Recursion).
오일석, C와 ALPS, 장. C로 풍덩 © 오일석, 전북대학교 컴퓨터공학.
컴퓨터과학 전공탐색 배상원.
매듭 이론 Lord Kelvin , Tait ( ), C.N. Little
CAS (Computer Algebra System) 소개
602 LAB FDTD 를 이용한 Acoustic Simulation 지도: 이형원 교수님 차진형.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
내열금속재료 항공기 내열 재료 H조 전성표.
1 장. 소개 오일석, 패턴인식, 교보문고, © 오일석, 전북대학교 컴퓨터공학.
빅데이터 연구회 6주차 발표 주제 : 서포트 벡터 머신 통계학과 서태석.
프로그래밍 개요
플랫폼의 개념 클럭, 버스, 대역폭의 의미 64비트 PC
Bakery Algorithm Lamport’s 람포트의 제과점 알고리즘 Designed by 이기헌
SEOUL NATIONAL UNIVERSITY OF SCIENCE & TECHNOLOGY
군집 분석.
자료구조: CHAP 7 트리 –review 순천향대학교 컴퓨터공학과 하 상 호.
4장 직접 광 도파로 Integrated Optics (집적광학) 정의 : 기판위에 광소자와 회로망을 제작하는 기술
제 10 장 의사결정이란 의사결정은 선택이다.
3 장. 확률 분포 추정 오일석, 패턴인식, 교보문고,
Association between two measurement variables Correlation
MCL을 이용한 이동로봇 위치추정의 구현 ( Mobile robot localization using monte carlo localization ) 한양대학교 전자전기전공 이용학.
시뮬레이션 기반 가상 보조기구 알고리즘 최적화
3D 프린팅 프로그래밍 01 – 기본 명령어 강사: 김영준 목원대학교 겸임교수.
젠트리피케이션에 대한 인식 분석 경영학부 최은지 경영학부 이창현
10장. 군집화 오일석, 패턴인식, 교보문고, © 오일석, 전북대학교 컴퓨터공학.
Decision Tree & Ensemble methods
P 등속 직선 운동 생각열기 – 자동차를 타고 고속도로를 달릴 때, 속력계 바늘이 일정한 눈금을 가리키며 움직이지 않을 때가 있다. 이 때 자동차의 속력은 어떠할까? ( 속력이 일정하다 .)
5 장. SVM 오일석, 패턴인식, 교보문고, © 오일석, 전북대학교 컴퓨터공학.
실물관리의 한계 실물 관리의 한계점에 대한 실례(보이지 않는 것,정량화 될 수 없는 것)
20강 패턴을 통한 객체지향 언어의 이해 - II - 난이도 있는 패턴 예제 - I Lecturer Kim Myoung-Ho
보고서 #7 (기한: 6/2) 2개의 스택, stk1, stk2를 이용하여 큐를 구현하라.
8장. 조건에 따른 흐름의 분기. 8장. 조건에 따른 흐름의 분기 8-1 흐름의 분기가 필요한 이유 상황에 따른 프로그램의 유연성 부여 그림 8-1.
강의 소개 컴퓨터시뮬레이션학과 2017년 봄학기 담당교수 : 이형원 E304호,
Thevenin & Norton 등가회로 1등 : 임승훈 - Report 05 - 완소 3조 2등 : 박서연
VHDL를 이용한 DES 설계 정보통신컴퓨터공학부 5조 김인옥, 백미숙
CAS (Computer Algebra System) 소개
Boiler Waste Heat Recycling System
알고리즘 알고리즘이란 무엇인가?.
김정숙 (고려대학교 2014년) 국어국문학과 한국어학 석사 1기 이 드미뜨리
클러스터 시스템에서 효과적인 미디어 트랜스코딩 부하분산 정책
C 프로그래밍은 매우 도전적인 작업이다. 도전의 이면에 철저한 준비와 체계적인 노력
쉽게 배우는 알고리즘 2장. 점화식과 점근적 복잡도 분석
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
발표자 : 이지연 Programming Systems Lab.
상관계수.
컴퓨터공학과 손민정 Computer Graphics Lab 이승용 교수님
9장. 특징 선택 오일석, 패턴인식, 교보문고, © 오일석, 전북대학교 컴퓨터공학.
2 장. 베이시언 결정 이론 오일석, 패턴인식, 교보문고,
29장. 템플릿과 STL 01_ 템플릿 02_ STL.
3 장. 확률 분포 추정 오일석, 패턴인식, 교보문고,
서로 다른 세대 간에 소통과 공존은 가능할까? (2차시)
아날로그 신호를 디지털 신호로 변환하는 A/D 변환기 A/D 변환 시 고려하여 할 샘플링 주파수 D/A 변환기
교착 상태 해결 : 교착 상태 탐지 교착 상태 탐지(Deadlock Detection)
문제의 답안 잘 생각해 보시기 바랍니다..
C++ Espresso 제15장 STL 알고리즘.
Presentation transcript:

9장. 특징 선택 오일석, 패턴인식, 교보문고, 2008. © 오일석, 전북대학교 컴퓨터공학

들어가는 말 특징 선택 원래 특징 벡터 xorg=(x1,x2,…,xD)에서 쓸모없거나 중복성이 강한 특징을 찾아 제거하는 작업 차원을 낮추어 주므로 계산 속도 향상 그리고 일반화 능력 증대 효과 2019-02-22

부류내 분산은 작고 부류간 분산은 크게 해줄수록 좋은 특징 벡터 9.1 특징의 분별력 9.1.1 직관적 이해 부류내 분산과 부류간 분산 부류내 분산within-class variance: 같은 부류에 속하는 샘플이 얼마나 퍼져있는지 척도 부류간 분산between-class variance: 서로 다른 부류의 분포가 얼마나 떨어져 있는지 척도 부류내 분산은 작고 부류간 분산은 크게 해줄수록 좋은 특징 벡터 2019-02-22

9.1.1 직관적 이해 2019-02-22

9.1.2 분별력 측정 다이버전스 훈련 샘플의 거리 분류기 성능 2019-02-22

9.1.2 분별력 측정 다이버전스 거리 측정은 어떻게 하나? KL 다이버전스 활용 (부록 A) 확률 분포 간의 거리를 이용 (거리를 멀게 해주는 특징일수록 좋다.) 거리 측정은 어떻게 하나? KL 다이버전스 활용 (부록 A) 현실적 문제: 확률 분포를 알 때 적용 가능 확률 추정이 안고 있는 차원의 저주 같은 문제를 이어받는다. 2 부류 M 부류 2019-02-22

9.1.2 분별력 측정 훈련 샘플의 거리 훈련 집합에 있는 샘플을 가지고 직접 측정 (현실 적용이 쉽다.) xik는 부류 ωi의 k 번째 샘플 dist(xik, xjm)은 두 샘플 간의 거리 2019-02-22

9.1.2 분별력 측정 2019-02-22

9.1.2 분별력 측정 분류기 성능 2019-02-22

9.2 특징 선택 문제의 이해 간단한 두 가지 예 실제 상황에서는 이런 직관을 사용하기 힘들다. 개와 고양이를 분류하는데 눈의 개수와 같은 특징은 쓸모 없다. 그림 9.5: 두 특징은 매우 높은 중복성  하나만 있어도 된다. 실제 상황에서는 이런 직관을 사용하기 힘들다. 효과적인 알고리즘이 필요하다. 2019-02-22

9.2 특징 선택 문제의 이해 특징 선택 문제 조합적 최적화 문제 Θ(2d)의 계산 복잡도. 방대한 탐색 공간 2019-02-22

9.2 특징 선택 문제의 이해 임의 탐색 알고리즘 아무 생각 없이 여기 저기 뒤져보는 순진한 알고리즘 2019-02-22

9.2 특징 선택 문제의 이해 개별 특징 평가 알고리즘 특징들 간의 상관 관계를 전혀 고려하지 않음 특징의 중복성 (그림 9.5)을 무시 2019-02-22

9.3 전역 탐색 알고리즘 2019-02-22

낱낱 탐색 알고리즘exhaustive search algorithm 9.3 전역 탐색 알고리즘 낱낱 탐색 알고리즘exhaustive search algorithm 모든 해를 다 살피는 매우 우직한 알고리즘 (d가 큰 경우 비현실적) 2019-02-22

한정 분기 알고리즘branch and bound algorithm 9.3 전역 탐색 알고리즘 한정 분기 알고리즘branch and bound algorithm 탐색 과정에서 가능성 없는 영역을 배제하여 계산 효율 얻음 단조성 조건을 만족하는 경우에 적용 가능 2019-02-22

9.3 전역 탐색 알고리즘 2019-02-22

9.4 순차 탐색 알고리즘 2019-02-22

SFS 알고리즘sequential forward search algorithm 9.4 순차 탐색 알고리즘 SFS 알고리즘sequential forward search algorithm 한번에 하나씩 특징을 추가해 나가는 방식 2019-02-22

9.4 순차 탐색 알고리즘 2019-02-22

PTA 알고리즘plus-p-take-away-q algorithm 9.4 순차 탐색 알고리즘 PTA 알고리즘plus-p-take-away-q algorithm p 개의 특징을 추가하고 r 개를 제거하는 연산을 반복 2019-02-22

모든 순차 탐색 알고리즘은 욕심greedy 알고리즘이다. 이를 극복하기 위한 통계적 탐색 알고리즘 9.5 통계적 탐색 연산을 가진 알고리즘 모든 순차 탐색 알고리즘은 욕심greedy 알고리즘이다. 전역 최적점이 아니라 지역 최적점에 빠질 가능성 이를 극복하기 위한 통계적 탐색 알고리즘 시뮬레이티드 어닐링 유전 알고리즘 11장에서 자세히 다룸 2019-02-22