Chapter 15 aggregates 서울시립대학교 인공지능연구실 홍성학.

Slides:



Advertisements
Similar presentations
Web Based Data Warehouse Query Tool 이화여자대학교 2002 년 컴퓨터학과 졸업프로젝트 14 조.
Advertisements

Chapter 2. Text Patterns 2.1 ~ 2.3 서울시립대 전자전기컴퓨터공학과 데이터마이닝 연구실 G 노준호.
1 SQL 정보보호학과 양 계 탁. 2 SQL 개요 SQL 개요 3 Database u 연관된 데이터들의 집합 u 데이터를 쉽게 관리하는 프로그램 종 류종 류 관계형 데이터베이스 객체지향형 데이터베이스 계층형 데이터베이스 네트워크 데이터베이스 데이터를 2 차원적인 테.
Chapter 8. TEXT CLUSTERING 서울시립대 전자전기컴퓨터공학과 데이터마이닝 연구실 G 노준호.
2.1 In-Memory Computing 디스크 기반 데이터베이스에서 인메모리 기반 데이터베이스로 BW시스템 전환
Database Summarization Using Fuzzy ISA Hierarchies
DB2 Information Management DB2 UDB CLP Command Summary.
Ch. 16 Design and Business Intelligence
DRIMS-Cloud 소개.
IT Application Development Dept. Financial Team May 24, 2005
삼성 SDS 멀티캠퍼스 데이터웨어하우스, OLAP, 데이터 마이닝 삼성 SDS 멀티캠퍼스
Chapter 7 데이터웨어하우징 의사결정지원시스템.
SAP QUERY SAP R/3 4.6C.
질의어와 SQL 기본 SQL 고급 SQL 데이타의 수정 데이타 정의 언어 내장 SQL
관계 대수와 SQL.
INI STEEL 성과관리시스템 구축을 위한 SAP 제안설명회
Chapter 5 SQL: 확장된 질의, 주장, 트리거, 뷰.
제 5 장 인덱스 생성 및 관리.
4장. 관계 대수와 SQL SQL 관계 데이터 모델에서 지원되는 두 가지 정형적인 언어
SQL 개요 SQL 개요 - SQL은 현재 DBMS 시장에서 관계 DBMS가 압도적인 우위를 차지하는 데 중요한 요인의 하나
Internet Control Message Protocol (ICMP)
MySQL performance Xhark 김재홍.
Information Technology
Toad for Oracle 설치 방법.
Star Schema Ch14. Derived Schemas
MySQL 및 Workbench 설치 데이터 베이스.
Enterprise Data Warehouse
12. 데이터베이스 설계.
Excel OLAP Reporting / OWC를 이용한
Your Best Financial Guide
데이터 베이스 란? 데이터 베이스 기능 데이터 베이스 관리 시스템 정보시스템의 구성 관게형 데이터 베이스
오라클 데이터베이스 성능 튜닝.
데이터 웨어하우스 목차 1.데이터 웨어하우스 개발방법론 2슬라이드~13슬라이드
데이터웨어하우스(DW)
데이터 웨어 하우스 이병규 김기훈.
SQL Server 2000, SQL Server 2005 비교 자료
On the computation of multidimensional Aggregates
마케팅 분석 시스템 개발 방법론 2004년 5월 27일 ㈜비아이솔루션 김환태
SSAS 변화된 구조와 사용자 분석 화면 구현 우철웅 기술이사 BI 사업부 인브레인.
웹 로그 데이터를 이용한 다차원 질의 분석 데이터베이스 연구실 석사 3학기 김 백 선.
MySQL 기본 사용법.
Chapter 05 데이터베이스 프로그래밍.
Data Modeling Database 활용을 위한 기초 이론 Database의 개요 Data Modeling
6장. 물리적 데이터베이스 설계 물리적 데이터베이스 설계
4.2 SQL 개요 SQL 개요 SQL은 IBM 연구소에서 1974년에 System R이라는 관계 DBMS 시제품을 연구할 때 관계 대수와 관계 해석을 기반으로, 집단 함수, 그룹화, 갱신 연산 등을 추가하여 개발된 언어 1986년에 ANSI(미국 표준 기구)에서 SQL.
ER-Win 사용 방법.
2장. 관계 데이터 모델과 제약조건 관계 데이터 모델은 지금까지 제안된 데이터 모델들 중에서 가장 개념이 단순한 데이터 모델의 하나 IBM 연구소에 근무하던 E.F. Codd가 1970년에 관계 데이터 모델을 제안함 관계 데이터 모델을 최초로 구현한 가장 중요한 관계 DBMS.
소프트웨어시스템 실험 Software Systems Lab. 데이터베이스 기초
Dept. of CSE, Ewha Womans Univ.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
01 데이터베이스 개론 데이터베이스의 등장 배경 데이터베이스의 발전 과정 데이터베이스의 정의 데이터베이스의 특징
강사: 이종인 다우 교육원 전임강사 / 온디멘드 수석 컨설턴트 / FMG 수석 컨설턴트
웹 어플리케이션 보안 2016년 2학기 3. Mongo db.
정보처리기사 8조 신원철 양진원 유민호 이기목 김다연 윤현경 임수빈 조현진.
제 8 장 객체지향 데이타베이스와 데이타베이스의 새로운 응용 분야
ER-Win 4.0 Database Modeling Ⅰ. Logical Design
View(뷰) 1 가상 테이블(Virtual Relation)
The Data Warehouse Toolkit, 3rd Edition CH.10 Financial Services
Database 중고차 매매 DB 비즈니스IT 윤동섭.
학습목표 학습목표 본 장은 데이터베이스를 구성하는 개체, 속성, 관계 등을 다룬다. 특별히 데이터베이스의 구조를 테이블에 기초하여 조직하는 관계 데이터 모델은 개체(entity)와 관계(relationship) 들이 테이블의 집합 형태로 되어 간단하고 이해하기 쉬우며.
시스템 분석 및 설계 글로컬 IT 학과 김정기.
06. SQL 명지대학교 ICT 융합대학 김정호.
Chapter 5. Conformed Dimension
Data Warehouse 구축 (설계 위주)
Tabular 관리툴 Tabular Manager
1. 관계 데이터 모델 (1) 관계 데이터 모델 정의 ① 논리적인 데이터 모델에서 데이터간의 관계를 기본키(primary key) 와 이를 참조하는 외래키(foreign key)로 표현하는 데이터 모델 ② 개체 집합에 대한 속성 관계를 표현하기 위해 개체를 테이블(table)
제 9 장 ICMP 9.1 메시지 유형 9.2 메시지 형식 9.3 오류 보고 9.4 질의 9.5 검사합 9.6 ICMP 설계
ER-관계 사상에 의한 관계 데이터베이스 설계
Aggregated K-nearest neighbor queries for High – dimensional data Eojin Yun, Dept. of Computer Science and Engineering, POSTECH. Motivation 만약.
Presentation transcript:

Chapter 15 aggregates 서울시립대학교 인공지능연구실 홍성학

Index Aggregates Fundamentals of Aggregates Summarizing Base Data Using Aggregates Loading Aggregates Cubes as Aggregates Making Aggregates Invisible Aggregate Navigation Aggregate Generation Alternative Summary Designs Transformative Summaries May Also Be Useful Single Table Designs Should Be Avoided

Aggregates Data warehouse 의 performance 를 향상 시키기 위한 가장 강력한 방법 Aggregate schema는 Summarizing data 를 통해 data warehouse의 performance 향상 Original schema 와 일관된 query result 제공

Fundamentals of Aggregates Summarizing Base Data Storage of Pre-summarized Data in an Aggregate Pre-summarized 된 dimensional aggregate를 통해 query performance 를 향상 Reading data, sorting, join, sum 등의 소요 시간을 줄임 Describing the Aggregate Fact table 의 grain 을 통해 aggregate schema 를 describing Conformance Aggregate star 를 구성할 때, base star 의 attribute, name, business meaning 과 같은 structure 와 content 를 공유하여 구성  Aggregate table 은 original schema 와 같은 query result 제공  Query 작성 시 일정한 형식으로 접근 가능 Delivering Benefit Aggregate schema 는 query 를 최적화 하기 위한 grain 을 완전히 충족시키지 않아도 됨 Single aggregate 는 모든 query 에 대해 performance benefit 을 주지 않기 때문에 multiple aggregate 를 구성하여 사용

Fundamentals of Aggregates Summarizing Base Data

Fundamentals of Aggregates Using Aggregates Writing Queries Aggregate star 와 base star 의 Conformance 를 통해 매우 비슷한 Structure 와 Content 를 가지고 있기 때문에 Query 작성 시 비슷한 방법을 가지고 접근 가능

Fundamentals of Aggregates Using Aggregates Determining Which Star to Query Aggregates 를 사용할 때, Query 작성 시 어떤 Star 를 선택할 지 정해야 함 절절한 Star 를 정하기 위해서 어떤 정보가 필요하고, 어떤 Star 가 어떤 정보를 제공하는지를 이해하는 것이 필요 Novice developer, End user, ad hoc user 는 적절한 Star 를 고르기 어려움 Eg. First quarter of 2009.

Fundamentals of Aggregates Using Aggregates Determining Which Star to Query End user 와 novice developer 는 aggregates star 에 대한 access 권한을 experienced developer 에게 제공하여 query 에 대한 알맞은 star 선택을 피함  특정 aggregate 를 사용하여 hard-coded 되었기 때문에 모든 상황에서 optimal 하지는 않음

Fundamentals of Aggregates Loading Aggregates Source of an Aggregates Aggregates 에 사용할 Query 를 간단히 하기 위해서 Dimension table 에 conformed roll-up 필요 Base dimension table 을 먼저 load 하고 conformed roll-up Fact table 도 마찬가지 원리로 base fact table 을 먼저 load 한 뒤 aggregate

Fundamentals of Aggregates Loading Aggregates Type1 Changes Base data 와 aggregate 가 순차적으로 load 될 때, type 1 change 가 발생하면 aggregates 를 완전히 다시 load 해야 할 수 있음 Order fact table 에서 product manager 가 변경 될 경우 :

Fundamentals of Aggregates Loading Aggregates Type1 Changes Product manager 의 변경으로 인해 aggregate table 의 이전 order summarize 를 조정해야 함 4단계 load 를 할 경우 4단계에 도달할 때까지 변경 사항을 알지 못할 수 있음 1단계에서 변경이 발생할 경우 이 사실을 공지 또한, 이전 product manager 에 대한 주문을 차감해야 함 1단계에서 업데이트 되었으므로 dimension table 에서 찾을 수 없음 Base schema 가 update 될 경우 aggregate 를 drop 후 re-create Type 2 Change 사용

Fundamentals of Aggregates Cubes as Aggregates Cubes Summarizing Cubes Cube 는 high-performance data structure 이기 때문에 summarizing 을 해도 performance 에 큰 향상이 없음 Dimension 이 늘어날수록 cube 는 점점 더 커지기 때문에 summarizing 을 통해 이를 해결 가능 Cubes Summarizing Stars Star 의 scale 에 대한 장점과 Cube 의 performance 에 대한 장점 활용 Star 에 granular data, detail data 를 저장 Star 를 바탕으로 summarize data 를 Cube 에 저장하여 사용

Making Aggregates Invisible user 는 soft ware tool 을 통해 위 두가지를 자동으로 제공 받음

Making Aggregates Invisible Aggregate Navigation Report 를 위한 Query 에 대해 어떤 Star 를 사용할지 결정 Aggregate navigation function 은 자동으로 적절한 aggregate 에 대한 Query로 redirecting  Query 를 작성하는 사람은 aggregate 의 존재와 aggregate 가 적절한지 확인 할 필요가 없음

Making Aggregates Invisible Aggregate Navigation 자동으로 query 를 rewrite 하기위해 필요한 정보 Aggregate star 의 해당 Base star 와 level of detail 각 fact table 이 포함하는 row 의 개수 Other Benefits Changing Aggregates at will Aggregates 가 추가되거나 삭제 될 경우 aggregate navigator 가 알 수 있음 Placing Aggregates Online and Offline Aggregates 를 rebuild or refresh 할 때 잠시 offline 상태로 두어 stop working 방지 Offline 상태 일 경우 directing 을 취소 / Online 상태 일 경우 다시 redirecting Heterogeneous Databases 다양한 종류의 database , 다양한 언어의 SQL 사용 가능 Heterogeneous Front Ends 다양한 종류의 front-end 제공 가능

Making Aggregates Invisible Aggregate Generation 자동으로 aggregates 를 generate, maintain Aggregate generation tool 은 concept of facts, dimensions, surrogate keys, natural keys, slow change 에 대해 이해하여 aggregates or cube 를 생성 보통의 tools 는 aggregation 할 수 있는 구체화된 query table 제공 충분한 information 이 있으면 DBMS 에서 자동으로 maintain 되는 aggregates or cube 생성 가능

Making Aggregates Invisible Aggregate Generation Hierarchies and Aggregates 많은 tools 은 dimension table 의 hierarchies 를 통해 aggregates table or cube 를 generate Dimension hierarchies 가 명시적인 방법으로 표현되면 aggregate 는 포함 될 주위에 원을 그리는 것으로 정의 할 수 있음 Cube 를 generate 할 때는 추가적으로 subset of attributes 에 대한 information 필요 eg. Brand code, brand name, brand manager in brand level

Alternative Summary Designs Transformative Summaries May Also Be Useful Snapshot, accumulating snapshot 과 같은 transform dimensional structure 는 특정 report 를 더 쉽게 만들 수 있음 Derived star 또한 original data set 을 summarize 하지만 aggregate schema 를 고려하지 않음 Original table 을 summarize 하는 것이 아니고 structure 가 달라지기 때문에 aggregates X  eg. Greater than $500 = order_dollars -> high_value_order_dallors

Alternative Summary Designs Single Table Designs Should Be Avoided Single Table 에 detail data 와 summarized data 를 함께 저장하는 것은 problem 야기 Eg1. Null value -> special row Eg2. double count -> constraining the level column in every query