6 장. 질적 분류 오일석, 패턴인식, 교보문고, 2008. © 오일석, 전북대학교 컴퓨터공학.

Slides:

Advertisements

Similar presentations

지 식 경 제 부 지 식 서 비 스 과. 목 차목 차 목 차목 차 서비스산업의 국민경제적 중요성 Ⅰ Ⅰ 글로벌 기업의 서비스화 전략 Ⅱ Ⅱ 국내 서비스산업의 성장 잠재력 Ⅲ Ⅲ 지식서비스산업 정책방향 Ⅳ Ⅳ 지식서비스산업 발전전략 Ⅴ Ⅴ.

Advertisements

폭력. 폭력이란 무엇인가 우상의 눈물 물리적인 폭력 ( 최기표 ) VS 지능적인 폭력 ( 임형우, 담임선생님 )

세상을 바라보는 새로운 시각 FRACTAL 경영학과 강다 원. 목차  프랙탈의 개념  프랙탈의 유래  프랙탈의 특징  프랙탈 동영상  프랙탈의 예  인간이 만든 프랙탈  프랙탈의 응용  프랙탈의 의의.

2009 년 & 4/4 분기 건 설 정 보 실건 설 정 보 실. 2 목 차 1. 국민경제에서 건설업의 위치 1) 산업별 경제성장률 ) 산업별 경제성장 기여도 ) GDP 중 건설업 생산비중

교수님 영상 제 2 장 관세법 일반 제 1 절 통칙 제 2 절 법 해석의 원칙 등 제 3 절 기한과 기간 제 4 절 서류의 송달 등 제 5 절 관세의 부과 및 징수 제 6 절 납세의무의 소멸 등.

0 동일제지에 투자하고픈 이유  골판지업종은 과점화 추세 및 공장가동율 93% 이상으로 가격경쟁 지양 가능성  내년에는 농산물 포장화로 매출 확대 가능성  동일제지 기업군은 골판지 분야에서 거대 세력화 및 점유율 점차 증대  영업이익율 동종업종내 최고  탁월한.

음란물에 대하여. 인터넷 음란물의 의미 돈벌이를 위해 단지 성적 욕망을 불러 일으키기 위한 음란한 인터넷 상의 사 진, 동영상, 만화 등을 말한다.

1 박 2 일 !!! 인천마장초등학교 유수아. 1 박 2 일 멤버 인기순 위 1 위 이승기 2 위 엄태웅 3 위 은지원 4 위 김종민, 이수근 ※인터넷에서 본것이기 때문에 사람에따라 서 다를 수 있다. ※

아이핑 소개 (탁구대회) 아이핑 담당 신동일 네이버(다음)에서 아이핑검색 아이핑 소개 (탁구대회) 담당 신동일 아이핑.

석관중앙교회 5남전도회 석 관 중 앙 교 회 회원 소식 통권 05-04호 발행일 : 2005년 04월 회 장 : 장진호 집사

일 시 : (목) 장 소 : 1층 도서관 대 상 : 3학년 4반 (36명) 지도교사 : 박 병 진

지역사회복지론 1조. 요양보호시설에 대해서 황성국 임재형 이동영

연구활동종사자 교육ㆍ훈련 수강방법 사무처 안전관리실

좋은 강의 국제관계학과 정연식.

1. PC 에서 회원가입 1. 회원가입 버튼 클릭 클릭.

14주차 1교시 강화계획 [학습목표] 1. 강화계획의 정의를 안다 [학습내용] 1. 단순한 강화계획 2. 간헐적 강화 3. 복합 계획 4. 선택과 대응법칙 [사전학습] 강화계획이 일어날 수 있는 사례를 생각해본다.

금창호(한국지방행정연구원, 자치행정연구실장)

연장근로와 야간·휴일근로 김영호 노무사 나눔 노사관계연구소 소장 연세대 일반대학원 박사 수료 고려사이버대 법학과 외래교수

I 문학의 개념과 역할 1. 문학의 개념 (1) 언어 예술로서의 문학 (2) 소통 활동으로서의 문학

김승연(사회복지학 박사, 서울복지시민연대 사회행동위원장)

4. 목적론적 윤리와 의무론적 윤리 01. 경험주의와 이성주의 01. 경험주의와 이성주의 02. 결과론적 윤리와 공리주의

집념과 고집 : 한라산 등반 사고 골 절 탈 진 2016 염 좌 탈골 사망 조난

제주닷컴 매뉴얼 (실시간 예약시스템) 2013년 10월.

초등학생이 pc방을 가도 되는가? 등마 초등학교 5학년 4반 김근아.

Ⅲ-3. 생명의 연속성 5. 유전적 다양성과 현대의 진화

[ 포털 사이트 연관검색어/자동완성 등록 서비스 ]

공인인증서 신청 및 발급 제일 먼저 은행에 직접 방문하여 인터넷뱅킹 신청.

개항기 조선과 동아시아 박 범 한국역사입문Ⅱ.

1. 하나투어 프로모션 페이지 수정사항 정리 – 리오타노 이태리 세미극세사 차렵이불_그레이

개인정보처리와 개인정보보호 2017년 2월.

기존 REC거래시스템 회원사의 신재생 통합포털 회원가입 설명서.

■ 화성공장 산학인턴 버스 노선 확인 안내 문의 전화 : 안내페이지 접속 1

건양대학교 OPIc 평가 신청 매뉴얼 (

돌연변이 생물교재론 양현주.

대구의 부도심 대구의 주요축 동대구 부도심 4조 강민석 / 박성균 / 최은지/ 황재현/김예지.

기업회생 절차.

2. 윤리학의 원리와 적용 가. 상대주의와 절대주의.

중국은 평평하지 않다 차이와 격차 알아야 중국 사업 성공한다

인터넷은 새로운 민주주의를 만들었는가? 2011년 11월 30일 정동욱.

비담 MOS 시뮬레이션 사용 절차 1 – 개별 사용 유형

강의 프레젠테이션 현대 사회와 미디어 12강. 미디어 문화.

기술 진화와 진보.

사도행전 13장 22절 말씀 –아멘 다 윗 을 왕 으 로 세 우 시 고 증 언 하 여 이 르 시 되 내 가 이 새 의 아 들

◈ 본 PPT자료는 날짜와 원장님의 원명, 성함으로 바꿔서 사용하실 수 있는 자료입니다.

건축물 에너지 절약계획서 시스템 사용자 지침서

인천경제자유구역 영종지구 영종하늘도시 개발사업

감리실무사례발표 공 사 명 : 하수처리장 과업분야: 품질관리 과업주제: 시설물 검측 기준 설정

경찰행정과 세미나 결과를 공개해야한다. VS 비공개로 해야한다. 경찰의 근무성적평정 제도.

6 장. 질적 분류 오일석, 패턴인식, 교보문고, © 오일석, 전북대학교 컴퓨터공학.

K Nearest Neighbor.

교육행정 및 경영 제13장 교육재정 (화) 안 봉 직.

원시 지구에서 단백질과 핵산은 어떻게 만들어졌는가?

다가올 미래는 신흥시장의 시대.

포이에마장애인보호작업장 시설소개서.

매물장 로그인 직원을 미리 생성하시면 직원 ID로 로그인 가능.

100세 시대, 스마트 헬스케어와 미래직업 (3) 고령화 사회에 필요한 웨어러블.

일반대학원 사용자 매뉴얼(학생)

영상으로 읽는 한국사 02 삼국은 서로를 한 ‘민족’으로 생각했나? - 삼국통일의 의미-.

삶을 풍요롭게 만드는 의사소통.

1. 하나투어 프로모션 페이지 수정사항 정리 – 인따르시아 여행용 파우치 5p (핑크)

1. 하나투어 프로모션 페이지 수정사항 정리 – [트래블이지] 비비드접이식가방 NO.1278

코딩교육, 어떻게 해야 할까 이천양정여자고등학교 김가연 안선영.

창조론과 진화론 사상독서스쿨 아가피아 스쿨 5반.

◈ 본 PPT자료는 날짜와 원장님의 원명, 성함으로 바꿔서 사용하실 수 있는 자료입니다.

관리자 페이지에서 관리자 승인 1. 정기권 신규고객 1. 로그인 화면 2. 차량등록여부 확인 3. 개인정보 활용 동의

◈ 본 PPT자료는 날짜와 원장님의 원명, 성함으로 바꿔서 사용하실 수 있는 자료입니다.

농식품 명품화 전략 발표자: 신 순 철 휴리넷 경영전략 연구소 소장 농식품 마케팅대학 브랜드 지도 교수

주제 : 원핵에서 진핵으로, 단세포에서 다세포로

Presentation transcript:

6 장. 질적 분류 오일석, 패턴인식, 교보문고, 2008. © 오일석, 전북대학교 컴퓨터공학

들어가는 말 세상에는 참으로 많은 데이터가 있다. 계량 데이터 점수, 매출액, GDP, BOD, 속도, 마찰계수, 토끼 개체수 등 거리 개념 있다. 5는 31보다 크다. 5는 10보다 7에 가깝다. 비계량 데이터 직업, 행정 구역, 혈액형, 성씨, PC 브랜드 등 거리 개념 없다. ‘O형은 B형보다 A형에 가깝다’는 성립 안한다. 2018-12-01

들어가는 말 6장은 비계량 데이터의 분류를 다룸 질적 분류기 결정 트리 (6.1절) 스트링 인식기 (6.3절) 2018-12-01

6.1.1 원리 결정 트리의 원리 몇 가지 고려 사항 스무고개와 개념이 비슷 최적 기준에 따라 자동으로 질문을 만들어야 함 2018-12-01

6.1.1 원리 결정 트리의 표현 트리 또는 이진 트리 사용 이진 트리의 구현 2018-12-01

6.1.2 노드에서의 질문 결정 트리의 노드 노드의 분기 질문 xi=α? 어떻게 만들 것인가? d 개의 특징이 있고 그들이 평균 n 개의 값을 가진다면 dn 개의 후보 질문 그들 중 어느 것을 취해야 가장 유리한가? 2018-12-01

6.1.2 노드에서의 질문 유리한 정도의 판단 기준은? 불순도 측정 기준 XTleft와 XTright가 동질일 수록 좋다. 엔트로피 지니 불순도 오분류 불순도 노드 T에서 ωi가 발생할 확률은 2018-12-01

6.1.2 노드에서의 질문 예제 6.1 불순도 측정 2018-12-01

6.1.2 노드에서의 질문 노드에서 질문 선택 불순도 감소량 또는 투잉 기준이 최대인 질문을 취함 불순도 감소량 투잉 기준 2018-12-01

6.1.2 노드에서의 질문 노드에서 질문 생성 비계량인 경우 xi=α? 계량인 경우 xi<α? 이산 이산 값에 따라 α를 결정 연속 실수 범위를 구간화 하여 α 결정 또는 샘플의 값 분포를 보고 두 값의 가운데를 α로 결정 2018-12-01

6.1.2 노드에서의 질문 예제 6.2 후보 질문 생성 표 6.1에서 x3의 값의 분포를 조사하면, 2018-12-01

6.1.2 노드에서의 질문 예제 6.3 불순도 감소량 2018-12-01

6.1.3 학습 알고리즘 결정 트리 학습 알고리즘 언제 멈출 것인가? 과적합 vs. 설익은 수렴 잎 노드의 부류 할당 2018-12-01

6.1.4 특성 결정 트리의 특성 특징 값에 대한 제약이 적다. 계량, 비계량, 혼합 특징을 모두 다룰 수 있다. 특징 전처리 불필요 분류 결과가 ‘해석 가능’하다. 인식 작업이 매우 빠르다. 가지치기 사전 가지치기 사후 가지치기 불안정성 결정 트리 학습은 욕심 알고리즘 손실 특징을 다루기 쉽다. 대리 분기 2018-12-01

6.2 CART, ID3, 그리고 C4.5 대표적인 결정 트리 시스템 비교 어느 것이 좋은가? 패턴 인식의 일반적인 질문 “어느 것이 다른 것을 지배하지 못하고 어느 것이 다른 것에 지배되지도 않는다.” 2018-12-01

2018-12-01

6.3 스트링 인식기 특징 벡터가 가변 길이의 스트링으로 표현되는 응용 스트링의 거리 계산 방법 필요 궤적을 동서남북 {E, W, S, N}으로 표현하는 경우 DNA {A, G, C, T} 온라인 글자의 체인 코드 표현 스트링의 거리 계산 방법 필요 거리 정의하면 k-NN이나 군집화 등에 적용 가능 거리 정의하더라도 SVM, 신경망에는 적용 불가능 왜? 2018-12-01

6.3.1 교정 거리 스트링 간의 거리를 어떻게 정의할까? 교정 거리edit distance 예) 해밍 거리가 적절한가? 삽입, 삭제, 대치 등의 연산 비용에 따라 측정하는 거리 Levenshtein 거리와 그것의 여러 변종들 2018-12-01

6.3.2 Levenshtein 거리 표기 Levenshtein 거리가 사용하는 세 가지 연산 테스트 샘플 x=x1x2…xc, 기준 샘플 y=y1y2…yr 삽입과 삭제 비용이 다른 경우 x를 y로 변환하는 비용과 y를 x로 변환하는 비용이 다르다. Levenshtein 거리가 사용하는 세 가지 연산 예) x=revgniaton, y=recognition 2018-12-01

6.3.2 Levenshtein 거리 Levenshtein 거리 계산은 최적화 문제이다. 동적 프로그래밍 최소 비용의 변환을 찾아라. 동적 프로그래밍 기법 적용 동적 프로그래밍 2차원 배열 D에 그때까지의 최적 거리 기록해 나감 D[j][i]는 x1x2…xi를 y1y2..yj로 변환하는데 드는 최소 비용을 가짐 D[r][c]가 답을 가짐 2018-12-01

6.3.2 Levenshtein 거리 Levenshtein 거리 계산 알고리즘 초기화, 전방 계산, 역 추적의 세 단계 2018-12-01

6.3.2 Levenshtein 거리 세 단계 전방 계산이 사용하는 세가지 연산 초기화: 배열 생성 전방 계산: 순환식에 따라 거리 채워 나감 역 추적: 교정 연산 목록 찾음 전방 계산이 사용하는 세가지 연산 2018-12-01

6.3.2 Levenshtein 거리 최적 원리에 따른 순환식 2018-12-01

6.3.2 Levenshtein 거리 예제 6.5 Levenshtein 거리 계산 x=revgniaton, y=recognition 몇 가지 계산 예 2018-12-01

6.3.2 Levenshtein 거리 몇 가지 특성 교정 연산마다 비용을 다르게 할 수 있다. 삽입과 삭제 비용이 같으면 대칭이다. 대치만 사용하면 해밍 거리가 되고, 삽입과 삭제만 사용하면 최장 공통 부분 스트링 문제가 된다. 계산 복잡도 Θ(rc) 2018-12-01

6.3.3 Damerau-Levenshtein 거리 교환 연산 추가 예) x=pattren, y=pattern은 교환 연산 하나로 x를 y로 교정 철자 교정 등에 유용 2018-12-01

6.3.3 Damerau-Levenshtein 거리 전방 계산 2018-12-01

6.3.3 Damerau-Levenshtein 거리 역 추적 2018-12-01