Aggregated K-nearest neighbor queries for High – dimensional data Eojin Yun, 20021227 Dept. of Computer Science and Engineering, POSTECH. Motivation 만약.

Slides:



Advertisements
Similar presentations
Computer Science and Engineering. 컴퓨터는 미래 지식 사회의 핵심 요인  지식 사회의 도래 : 매 50 년 마다 큰 기술, 사회적 변화 발생.
Advertisements

김수연 Capstone Design Realization Cost Reduction through Deep Artificial Neural Network Analysis.
수학 7- 가 문자와 식 > 일차방정식의 풀이 > 교과서 p.111 일차방정식의 활용 수업계획수업활동.
3 학년 문제가 남느냐, 내가 남느냐 1. ( 아씨방 일곱 동무 ) 아씨의 방에는 바느질을 위한 친구가 몇 명이 있었나요 ? 정답은 ? 일곱.
대구주식투자연구소 12 월 첫째주. 목 차 월 첫째주 예상 시황 정리. 2. 관심종목 정리 3. 관심종목 분석 4. 정리.
언어의 자서전 소단원 (1) 단원. 언어의 특성 기호성 자의성 사회성 규칙성 창조성 역사성.
년 사업계획서 SK 노동조합 2 민주적이고 자주적인 노동조합운영 체계화 간부와 조합원의 일상적 결합으로 현장조직력 강화 집행간부, 대의원의 간부역량강화 고용안정 및 2002 임단투 승리 부당노동행위 근절 연대사업강화 및 노동악법저지 노동자정치 세력화 사업.
2008 년 7 월 24 일 신문기사 자동 분류 시스템 한국과학기술정보연구원 최성필 목차 문서분류시스템의 예시와 정의 자동문서분류시스템의 구조 문서분류 모델 및 알고리즘의 종류 문서분류 모델 별 정확도 실험결과 실험결과에 대한 단상 세 가지 분류모델.
장애인 노동권 문제 제 3 차 세미나 – 윤정인, 추석.
단체교섭 보고 ※ 본교섭 ※ 실무교섭 구 분 날 짜 비 고 상견례 1월19일 단협 시작 본교섭
『1교1사 자매 결연』으로 기업사랑 학교사랑 운동 전개
장원인의 친절세상 만들기 밝고 따뜻한 장원인.
아이트래킹을 이용한 피아노 연주 시스템 2011 졸업과제 최종 발표 Outlier Team
1. 던전 디자인 개요_1 1. ‘던전’ 룬스톤은 던전 한 층에도 여러 개가 존재하며, 각 룬스톤 마다 영향을 미치는 범위가 설정되어 있다. 룬스톤이 영향을 주는 범위에 일정시간 사용자가 위치해 있게 되면 사용자 캐릭터는 ‘유령화’ 되어 버리기 때문에, 사용자는.
인터넷교육 사업계획서. 인터넷교육 사업계획서 목 차 1. ㈜ △△△ 사업의 개요 11. 회사가 주최하는 교육 및 행사 12. 사업자 원천징수 2. ㈜ △△△ 사업의 특징 목 차 1. ㈜ △△△ 사업의 개요 2. ㈜ △△△ 사업의 특징 3. ㈜ △△△
Ⅰ. 과정 실시 개요 목 적 특 징 통찰.창조력, 전략력, 논리력의 핵심 사고력과 Basic 기법을 습득
융합인재교육(STEAM) 체험프로그램 운영을 통한 탐구능력 신장 2012년 과학교육시범교육지원청 선도학교 영해중학교.
실습 – MODi Eunok Paek Dept. of Computer Science & Engineering
Neural Network - Perceptron
TSP 알고리즘 구현 서왕덕.
알아야 번다 5일선 키스기법 - 매수 3단계.
3강 내 계좌 원금 회복 프로젝트 토마토투자클럽 황 윤 석.
M원 탐색트리.
성공취업! 지금부터… 면접편.
해야 할일 (To-Do List)  해결내용
SDS Professional 평가 및 보상체계
알고리즘(Algorithm)  알고리즘 개요 (효율, 분석, 차수) Part 1 강원대학교 컴퓨터과학전공 문양세.
DBMS실습(I) 데이터베이스 기본개념 2015년 1학기 동서울대학교 컴퓨터소프트웨어과.
쉽게 배우는 알고리즘 6장. 해시 테이블Hash Table.
(Statistical Modeling)
On the computation of multidimensional Aggregates
공간비용채산제 어떻게 준비할 것인가? 기획연구분과 송복섭.
6장. 물리적 데이터베이스 설계 물리적 데이터베이스 설계
- Make Processes Manageable -
7. 자극과 반응 7-2. 신경계 3. 여러 가지 반응.
Chapter 10. 파일 시스템 인터페이스(File System Interface)
파일 시스템 인터페이스(File System Interface)
01 데이터베이스 개론 데이터베이스의 등장 배경 데이터베이스의 발전 과정 데이터베이스의 정의 데이터베이스의 특징
교육수료증 재발급 사유서 SK하이닉스 이천안전팀 업체 명 : 담당자 (인) 업 체 명 : 이 름 : 서명
Lab Application Management
자료구조(SCSC) Data Structures
세일즈분석/분석CRM을 위한 데이터마이닝 활용방안
전자계약 시스템 사용자 매뉴얼 구매팀.
제 10 장 의사결정이란.
정보 추출기술 (Data Mining Techniques ) : An Overview
SDS Professional 평가 및 보상체계
알고리즘(Algorithm)  알고리즘 개요 (효율, 분석, 차수) Part 년 봄학기
2005년도 법학부 학술 세미나 기본 기획(안)
장원인의 친절세상 만들기 밝고 따뜻한 장원인.
연구책임자용 충남대학교 생명윤리위원회 홈페이지 연구 책임자&담당자 매뉴얼 Date version 1.0.
7장. 해시 테이블Hash Table.
목적을 갖고 살아요!.
본선대회 일정안내.
Dal Ta Nyan.
0801 Workshop.
How I Approach Tuning a SQL Statement
Data Warehouse 구축 (설계 위주)
나비는 두 꽃 중에서 어느 꽃으로 날아 갈까요? 한 장미꽃은 향기가 나고 한 장미꽃은 악취가 납니다 두 개의 장미꽃이 있습니다
Tabular 관리툴 Tabular Manager
알고리즘(Algorithm) 유비쿼터스 컴퓨팅학과 교수 송 창근
알고리즘 강의 슬라이드 2 분할정복 제 2 장 분할정복 도경구역, 알고리즘, 사이텍미디어, 1999.
직장생활 예절 ① - 인사 1.내가 먼저 [인사의 5point] 2.상대방의 눈을 보고 미소지으며 3.상대방에 맞춰서
(제작자: 임현수)모둠:임현수,유시연,유한민
후원단체 참여제안서.
K Nearest Neighbor.
수학 2 학년 1 학기 문자와 식 > 부 등 식 ( 2 / 2 ) 부등식의 성질 이용 풀기.
(Ⅰ) 독서와 언어의 본질 언어의 본질 1 2 [고등 국어] – 독서와 문법 독서의 본질 (1) 독서의 특성
▶서류관리 프로그램 1. 로그인….2 2. 서류등록 … 서류도착 서류스티커발행
오늘의 관심주 오늘의 관심종목 외인/기관 순매수 특징주 코스피 상해종합 다우존스 S&P500 16/02/23(화) 외국인 기관
프로젝트 실행 오류와 해결.
Presentation transcript:

Aggregated K-nearest neighbor queries for High – dimensional data Eojin Yun, 20021227 Dept. of Computer Science and Engineering, POSTECH. Motivation 만약 당신이 온라인 쇼핑몰을 운영함에 있어 서 고객이 원하는 Wish List들을 정확하고 신속하게 관리, 추천할 수 있다면 어떨까? 가능하기만 하다면 그 보다 좋은 일은 없지 않을까? 언뜻 불가능해 보이는 이 과업에 대한 청사진을 나는 이번 과제 연구를 통해서 제시하 고자 한다. Problem Statement 어떠한 상품을 단순히 Cool! Or Bad로 이분하는 것은 불가능하다 -> 오히려 각각의 상품은 개인의 성향에 따라 수많은 기준으로 분류 된다. 만약 이러한 기준을 일반화해 각각의 속성에 적용할 수 있다면? -> 그 각각의 속성은 일정한 숫자로 나타내어질 수 있을 것이고 그 기준을 하나의 축으로 생각한다면 하나의 상품은 하나의 High dimensional data 로 나타낼 수 있다. 그 동안 사용자가 구매한 물품(Query)을 토대로 그것과 비슷한 상품(비슷한 좌표의 K-nearest neighbor)를 얻을 수 있다. 그렇게 얻어진 각각의 Query에 대한 KNN의 Aggregation을 통해 최종적인 Wish List(Aggregated K-nearest neighbor)를 얻을 수 있다. ISSUES ON PROBLEM 어떻게 하면 정확하고 효율적으로 K-nearest neighbor를 구할 수 있는가? 그렇게 만들어진 각각의 Query에 대한 KNN을 어떻게 Aggregation할 것인가? SCHEME ANALYSIS Threshold Algorithm Idistance Indexing Data set p_i : (x0,x1, …, xd-1) Reference set O_i : (x0,x1, …, xd-1) Partition I * c+dist(p,Oi) Samsung SDI POSCO SK Telecom KEPCO Reference point를 기준으로 data set을 partition으로 분류 나누어진 파티션은 reference point까지의 거리에 따라 1차원 공간으로 B+ tree KNN Search ThresHold Performance List의 개수와 object의 개수와 상관 없이 TA알고리즘은 constant에 가까운 효율을 보장한다. 그러나 RA를 위한 Hash table making time은 리스트의 개수가 늘어날수록 크게 증가한다.