K Nearest Neighbor.

Slides:



Advertisements
Similar presentations
수학 7- 가 문자와 식 > 일차방정식의 풀이 > 교과서 p.111 일차방정식의 활용 수업계획수업활동.
Advertisements

3 학년 문제가 남느냐, 내가 남느냐 1. ( 아씨방 일곱 동무 ) 아씨의 방에는 바느질을 위한 친구가 몇 명이 있었나요 ? 정답은 ? 일곱.
신도초 김민희.  어렸을 때 많이 불었던 비눗방울을 다시 불 어보자 너무 빨리 사라지는 게 아쉬워서, 무 슨 방법이 있으면 오랫동안 비눗방울이 남 아있을 수도 있을 것 같다는 생각이 좋아서 연구를 시작하였다.
폭력. 폭력이란 무엇인가 우상의 눈물 물리적인 폭력 ( 최기표 ) VS 지능적인 폭력 ( 임형우, 담임선생님 )
객혈의 원인과 치료 국립목포병원 흉부외과 김 대 연 2010 년 9 월 28 일. 국립목포병원 대기중의 공기를 호흡하여 기도를 통하여 기관지를 거쳐 폐포에 이르게 하여 모세혈관을 통하여 산소는 흡수하고 이산화 탄소는 배출하는 가스교환의 과정을 거치게 된다. 이러한 일련의.
언어의 자서전 소단원 (1) 단원. 언어의 특성 기호성 자의성 사회성 규칙성 창조성 역사성.
지도교사 : 김은이 선생님 연현초등학교 5 학년 조인해 연현초등학교 5 학년 최지원 우리는 항상 먹기 싫은 쓴 약을 먹을 때 달콤한 주스 나 탄산음료와 함께 마시면 쓴 약을 쉽게 먹을 수 있 을 텐데, 사람들은 감기약, 두통약, 영양제등과 같은 알약을 먹을 때 너무나.
2008 년 7 월 24 일 신문기사 자동 분류 시스템 한국과학기술정보연구원 최성필 목차 문서분류시스템의 예시와 정의 자동문서분류시스템의 구조 문서분류 모델 및 알고리즘의 종류 문서분류 모델 별 정확도 실험결과 실험결과에 대한 단상 세 가지 분류모델.
1 박 2 일 !!! 인천마장초등학교 유수아. 1 박 2 일 멤버 인기순 위 1 위 이승기 2 위 엄태웅 3 위 은지원 4 위 김종민, 이수근 ※인터넷에서 본것이기 때문에 사람에따라 서 다를 수 있다. ※
빛을 가장 잘 받는 색깔은? 물메초등학교 6학년 홍민선.
석관중앙교회 5남전도회 석 관 중 앙 교 회 회원 소식 통권 05-04호 발행일 : 2005년 04월 회 장 : 장진호 집사
팀명 : 정효가현팀 팀원 : 김효진, 이가현, 이정민
지역사회복지론 1조. 요양보호시설에 대해서 황성국 임재형 이동영
4월 임신*출산부 영양관리.
Neural Network - Perceptron
빈 그릇 희망 캠페인 그릇을 비우면 자연이 깨끗해 집니다.
비뇨계통.
연장근로와 야간·휴일근로 김영호 노무사 나눔 노사관계연구소 소장 연세대 일반대학원 박사 수료 고려사이버대 법학과 외래교수
데이터 마이닝을 이용한 분류 분석.
I 문학의 개념과 역할 1. 문학의 개념 (1) 언어 예술로서의 문학 (2) 소통 활동으로서의 문학
추석특집: 특별프로 대한민국 NO.1 약사를 찾아서 약사와 함께하는 인터뷰 추석 뉴스.
분류 (Classification) 2014년 가을학기 강원대학교 컴퓨터과학전공 문양세.
해야 할일 (To-Do List)  해결내용
신청하시기 전에 꼭 읽어 주세요! 기준인원 40명으로 짜여진 단가입니다. 기준미달 시 1인 단가가 상승합니다.
경제활동인구조사 1997년 실업률 조사의 설계 표본추출방법 가중치 부여 표준오차 편의
4. 목적론적 윤리와 의무론적 윤리 01. 경험주의와 이성주의 01. 경험주의와 이성주의 02. 결과론적 윤리와 공리주의
제4장 자연언어처리, 인공지능, 기계학습.
(Statistical Modeling)
with 신 동 면 교수님 임지영 장영태 조재영 황선희 황예빈
Technological Forecasting & social change(2014)
머신 러닝 2 ㈜ 퀀트랩.
개항기 조선과 동아시아 박 범 한국역사입문Ⅱ.
(신)비취가인천비방진연3종기획1 182,000 ▶ 91,000 (신)비취가인 천비방 진연수
패턴인식 개론 Ch.10 비모수 밀도 추정법.
소금물과 물의 부력 차이 실험 작성자 - 백민준.
인공지능 소개 및 1장.
사과는 왜 갈변 할까? 조장: 31017유수빈 조원:31024이지은.
대구의 부도심 대구의 주요축 동대구 부도심 4조 강민석 / 박성균 / 최은지/ 황재현/김예지.
시간을 거스르는 환유의 비밀 ‘환유 2014’ Beauty. 컨텐츠개발팀.
표집 제8장.
Sentiment Analysis 유재명.
2. 윤리학의 원리와 적용 가. 상대주의와 절대주의.
0801 Workshop.
표면장력에 대한 탐구 조원: 이정민, 장 예서, 김연우, 최현준.
추정의 이론.
온도는 반응 속도에 어떤 영향을 미칠까? 과학 1 학년 1 학기
어떤 금속이 열전도가 빠른지 찾기 평택여자중학교 김수민.
강의 프레젠테이션 현대 사회와 미디어 12강. 미디어 문화.
기술 진화와 진보.
사도행전 13장 22절 말씀 –아멘 다 윗 을 왕 으 로 세 우 시 고 증 언 하 여 이 르 시 되 내 가 이 새 의 아 들
과학 1 학년 2 학기 생명> 04.태아의 발생 과정은 어떻게 진행될까?[ 4 / 6 ] 수정과 착상 수업계획 수업활동.
<2013 과학탐구 보고서> 우유와 발효유가 일정온도에서 만나면?
후원단체 참여제안서.
6-2. 전해질과 비전해질 구별해 보기 학습 주제 < 생각열기 >
경찰행정과 세미나 결과를 공개해야한다. VS 비공개로 해야한다. 경찰의 근무성적평정 제도.
< 차 시 정 보 > 정보통신윤리교육 콘텐츠 과제명 학년군 3~4학년 학년 4학년 내용요소
P 보일의 법칙 - 생각열기 – 기포가 수면으로 올라가면 크기는 어떻게 될까?
Linear Model.
Ⅱ. 물질의 특성 물질의 끓는점.
수학 2 학년 1 학기 문자와 식 > 부 등 식 ( 2 / 2 ) 부등식의 성질 이용 풀기.
(Ⅰ) 독서와 언어의 본질 언어의 본질 1 2 [고등 국어] – 독서와 문법 독서의 본질 (1) 독서의 특성
신경망 (Neural Networks) (Lecture Note #23)
농도가 달라지면 반응속도는 어떻게 변할까? 과학 1 학년 1 학기
영상으로 읽는 한국사 02 삼국은 서로를 한 ‘민족’으로 생각했나? - 삼국통일의 의미-.
후 스파 바디 에센스 오일 왕후의 궁중 목욕비방을 담아 비단결 바디피부를 만들리라_ 세요설부(細腰雪膚)의 조건_
삶을 풍요롭게 만드는 의사소통.
Aggregated K-nearest neighbor queries for High – dimensional data Eojin Yun, Dept. of Computer Science and Engineering, POSTECH. Motivation 만약.
Python 라이브러리 딥러닝 강의소개 정성훈 연락처 : 이메일 :
아프타성 구내염- 환자 교육용.
Presentation transcript:

K Nearest Neighbor

ML의 주요 기법 KNN Linear Model SVM Kernel Trick Decision Tree Ensemble

K Nearest Neighbor X의 값으로 Y를 예측할 때 기존 데이터에서 X가 가장 비슷한 데이터(NN) k개를 찾는다 local method의 일종

N = 30 K = 1

N = 30 K = 5

N = 1,000 K = 100

True Model vs. kNN

kNN의 장점 간단하고 직관적 특별한 수학적/통계적 가정이 필요 없음 모형 적합 과정이 필요 X 전체 데이터가 많고(N  ∞), 이웃이 많고(k  ∞), 이웃이 전체 의 일부라면(k/N  0) 정확도 높음

knn의 단점 과적합(overfitting)의 위험성이 큼 주변부로 가면 왜곡되는 경향 거리를 계산하는 비용이 큼 이산 변수의 거리

Bias-Variance 문제 𝑀𝑆𝐸 =𝐸 𝑦− 𝑦 2 =𝐸 𝑦 2 −2 𝑦 𝑦+ 𝑦 2 = 𝑦 2 −2𝑦𝐸( 𝑦 )+𝐸 𝑦 2 = 𝑦 2 −2𝑦𝐸 𝑦 + 𝐸 𝑦 2 +𝐸 𝑦 2 − 𝐸 𝑦 2 = (𝑦−𝐸 𝑦 ) 2 +𝑉𝑎𝑟 𝑦 = 𝐵𝑖𝑎𝑠( 𝑦 ) 2 +𝑉𝑎𝑟 𝑦

Bias-Variance 문제 오차(Error) = 편향(Bias)2 + 분산(Var)

차원의 저주 길이 10인 선에서 가운데 9가 차지하는 비율  90% 10x10인 사각형에서 가운데 9x9인 사각형의 비율  81% 10x10x10인 정육면체에서 가운데 9x9x9…의 비율  약 73% 차원이 커질 수록 껍질이 두꺼워진다

NN과 차원의 저주 중심부에 데이터가 적어짐 주변부에는 데이터가 많아짐 중심부에서는 이웃끼리 멀어짐  분산 증가  오차 증가 주변부에는 데이터가 많아짐 NN은 주변부에서 왜곡  편향 증가  오차 증가