Database Summarization Using Fuzzy ISA Hierarchies

Slides:



Advertisements
Similar presentations
Wisdom21 Management Consulting 창조적 회의.
Advertisements

목 차 목적 및 수행개요 SLA Index 개괄 - 1. SLA Index Labor Relations
ER Schema (추가)
Chapter 7: Entity-Relationship 모델
Hamming Code 이근용. 2 Error Control Error Detection Parity Check CRC Check Error Correction Hamming Code.
Sequence Control -Introduction-
C++ Tutorial 1 서강대학교 데이터베이스 연구실.
Compiler Lecture Note, Inroduction to FL theory
2017 법인관련 개정세법 곽장미 세무사.
Chaper 2 ~ chaper 3 허승현 제어시스템 설계.
질의어와 SQL 기본 SQL 고급 SQL 데이타의 수정 데이타 정의 언어 내장 SQL
Mesh Saliency 김 종 현.
REINFORCEMENT LEARNING
DBMS실습(I) 데이터베이스 기본개념 2015년 1학기 동서울대학교 컴퓨터소프트웨어과.
Information Technology
Discrete Math II Howon Kim
12. 데이터베이스 설계.
On the computation of multidimensional Aggregates
SSAS 변화된 구조와 사용자 분석 화면 구현 우철웅 기술이사 BI 사업부 인브레인.
MySQL 기본 사용법.
Linux/UNIX Programming
Data Modeling Database 활용을 위한 기초 이론 Database의 개요 Data Modeling
BSC 기법에 의한 성과지표설정방법 강사 : 오영환(달란트HR컨설팅 대표/경영학박사)
ER-Win 사용 방법.
2장. 관계 데이터 모델과 제약조건 관계 데이터 모델은 지금까지 제안된 데이터 모델들 중에서 가장 개념이 단순한 데이터 모델의 하나 IBM 연구소에 근무하던 E.F. Codd가 1970년에 관계 데이터 모델을 제안함 관계 데이터 모델을 최초로 구현한 가장 중요한 관계 DBMS.
제 5장. Context-Free Languages
소프트웨어시스템 실험 Software Systems Lab. 데이터베이스 기초
이산수학(Discrete Mathematics) 수학적 귀납법 (Mathematical Induction)
제 5장 퍼지이론 (Fuzzy theory) Slide 1 (of 48).
스마트폰 사용자(Smartphone User)의 스마트폰 지속사용의도에 미치는 인간 욕구(Human Needs)에 관한 연구
Information Retrieval (Chapter 5: 질의연산)
Discrete Math II Howon Kim
계수와 응용 (Counting and Its Applications)
5. 관계대수와 관계해석 관계자료 연산(operation)
Parallel software Lab. 박 창 규
그림으로 배우는 컴퓨터구조 전찬주 / 엄재민, 황지순, 정나래, 신정윤, 이하나.
제4장 유닉스 쉘 숙명여대 창병모 2011 가을.
정보처리기사 8조 신원철 양진원 유민호 이기목 김다연 윤현경 임수빈 조현진.
2015. 인문소양교육.
2002년도 대한토목학회 학술발표회 Semi-active Fuzzy control for Seismic Response Reduction Using MR Damper K-M Choi1), H-J Jung1) J-H Lee2) and I-W Lee1) 1) Department.
4. 관계 데이터베이스 (Relational Database)- 7, 8장
2장. 관계 데이터 모델과 제약조건 관계 데이터 모델은 지금까지 제안된 데이터 모델들 중에서 가장 개념이 단순한 데이터 모델의 하나 IBM 연구소에 근무하던 E.F. Codd가 1970년에 관계 데이터 모델을 제안함 관계 데이터 모델을 최초로 구현한 가장 중요한 관계 DBMS.
정보 추출기술 (Data Mining Techniques ) : An Overview
리눅스: Lecture 1 강의개요 중앙대학교 컴퓨터공학부 손 봉 수 교수.
Introduction to Programming Language
Discrete Math II Howon Kim
Introduction to Smart Phone Security
The Practice of KM operations
문제 다음의 서술적 언어로 표현된 요구사항을 DFD로 완성하시오
4. 관계 데이터 모델.
퍼지 이론 (Fuzzy Theory) 컴퓨터를 인간에 가깝게 하는 일의 어려움 Zadeh의 퍼지 집합
한국상장 외국기업 Market 확대를 위한 논의
요한계시록 (2) 요한계시록의 7가지 중점사항 Rev 2-0.
시스템 분석 및 설계 글로컬 IT 학과 김정기.
Chapter 4 변수 및 바인딩.
Discrete Math II Howon Kim
소프트웨어 형상관리: 목차 변경 및 형상관리의 기초 개념 형상항목 확인 및 버전관리 변경관리 감사 및 감사보고 99_11
2010년 연말정산 교육자료 센터운영팀 인사파트
제 8장 데이터베이스.
이산수학(Discrete Mathematics)
Chapter 30 Creating Web Audio Files
창 병 모 숙명여대 전산학과 자바 언어를 위한 CFA 창 병 모 숙명여대 전산학과
1. 관계 데이터 모델 (1) 관계 데이터 모델 정의 ① 논리적인 데이터 모델에서 데이터간의 관계를 기본키(primary key) 와 이를 참조하는 외래키(foreign key)로 표현하는 데이터 모델 ② 개체 집합에 대한 속성 관계를 표현하기 위해 개체를 테이블(table)
이산수학(Discrete Mathematics)
이산수학(Discrete Mathematics) 수열과 합 (Sequences and Summations)
ER-관계 사상에 의한 관계 데이터베이스 설계
품사 분류의 기준과 실제.
Chapter 3. 집합론.
우수사원 연수 제안서 2-1. 항공, 호텔, 식사, 차량 세부 안내 (지역순서대로 작성 발리-싱가포르-괌)
엔티티-관계(ER) 모델을 사용한 데이터 모델링
Presentation transcript:

Database Summarization Using Fuzzy ISA Hierarchies 전산학과 이도헌 박사 논문 발표 : 신명근

Table of Content 1. Introduction 2. Generalized tuples & Support Degree 3. Fuzzy Domain Knowledge 4. Summary Discovery Process 5. Example 6. Conclusion

Introduction Database Summary Database Summarization 임의의 database에서 찾아야 할 지식(knowledge) 사용자가 이해할 수 있는 정보의 요약(essence) Database Summarization A task that reduces a large number of actual database tuples into a relatively small number of generalized descriptions. i.e., generalized tuples

Example of Databse Summary Program usage log in UNIX Database Summary Program User 사용시간 Generalized tuple : < editor, 프로그래머, 자정근처 > 설명 : editor 프로그램을 프로그래머들 이 자정 근처에 많이 사용한다. vi 류형규 23:30 emacs 장준영 23:55 vi 이근우 00:30

Fuzzy ISA Hierarchy Crisp ISA Hierarchy Fuzzy ISA Hierarchy All programs All programs editor Documentation editor documentation 0.1 0.3 emacs vi word emacs vi word

Comparison of Crisp and Fuzzy ISA Hierarchies Computer Uasge Log Using Crisp ISA Hierarchies - emacs : 120 records - vi : 680 records - word : 25 records Editor usage = 120 + 680 = 800 Documentation usage = 120 + 680 + 25 = 825 Using Fuzzy ISA Hierarchies Editor usage = 120 + 680 = 800 Documentation usage = 120*0.1 + 680*0.3 + 25 = 241

Fuzzy set primer A fuzzy set f on a domain D is defined by its membership function uf(x), which assign a fraction number between 0 and 1. 예, On domain < emacs, vi, word > documentaion = { 0.1, 0.3, 1.0 } f1 is called a subset of f2 and denoted f1 ⊆ f2, iff ∀x ∈ D, uf1(x) ≤ uf2(x). w denotes a special fuzzy set such that ∀x ∈ D, uf(x) = 1

Definition: Generalized tuple An m-ary tuple <f1, ..., fm> on an attribute scheme (A1, ..., Am), where fj’s are suzzy sets and Aj’s are attributes

Example of Generalized Tuple Generalized Tuples <vi, 류형규> <emacs, 장준영> <editor, 프로그래머> Program User vi 류형규 emacs 장준영 Database의 모든 튜플은 generalized tuple이고, 두 개 이상 튜플의 특성을 총괄적으로 표현하는 것도 Generalized Tuple이다.

Definition : Support Degree The support degree of a generalized tuple g = <f1, ..., fm> with respect to a given collection of database tuples C whose attribute scheme is (A1, ..., Am), is defined as SD(g|C) = [∑ti ∈ C [uf1(ti.A1), ..., ufm(ti.Am)]]/|C| wehre  is a t-norm operator, usually MIN. ufj(ti.Aj) denotes the membership degree of an attribute Aj of a tuple ti withrespect to a fuzzy set fj. |C| denotes the cardinality of the collection C 

Support Degree Support Degree는 해당 generalized tuple을 지지하는 튜플의 비율이다. 일정 threshold 값 이상의 Support Degree를 가지는 Generalized tuples을 qualified generalized tuples 라고 한다. Database Summarization == qualified generalized tuples를 찾는 것

Example of Support Degree Program User Support <documentation, 사무원> vi 사무원1 (0.3, 1.0) = 0.3 word 사무원2 (1.0, 1.0) = 1.0 vi 류형규 (0.3, 0.0) = 0.0 SD(<documentation, 사무원> | C) = [ (0.3, 1.0) + (1.0, 1.0) ] / 3 = (0.3 + 1.0) / 3 = 0.43 = 43 %  is a t-norm operator, 보통 MIN 을 사용

Fuzzy Set Hierarchy Fuzzy ISA Hierarchy ==> Fuzzy Set Hierarchy Fuzzy ISA hierarchy to be used directly. All programs All programs 변환 editor Documentation editor documentation 0.1 0.3 emacs vi word emacs vi word

Summary Discovery Process

Example Collection & Fuzzy Set Hierarchies

Example(1/3) 1. Initail start < -, - > 2. Specialization <engineering, -> <business, -> <game, -> <-, developer> <-, marketer> 0.833 0.24 0.09 0.833 0.411 3. Support Degree 계산 (t = 0.4)

Example(2/3) The 2’nd specialization of The 1’st specialization of generalized tuples The 1’st specialization of the root generalized tuple

The 3’rd specialization of Example(3/3) The 3’rd specialization of generalized tuple The final heiearchy of generalized tuples

결론 Proposed an Interactive top-down summary discovery process. Which utilizes fuzzy ISA hierarchies as the domain knowledge. Defined generalized tuples as a representational form of a database summary.

Future Work Fuzzy ISA Hierarchy 대신에 KAH를 이용한 database summarization 방법을 찾을 수 있다. KAH에 Fuzzy ISA Hierarchy의 개념을 응용한다.