SSAS 변화된 구조와 사용자 분석 화면 구현 우철웅 기술이사 BI 사업부 인브레인
Agenda Attribute Relation 구성과 최적화 (13:00~13:50) 34회 세미나 진행한 SSAS의 내용 리뷰 SQL Server BI 구성 요소 소개 SSAS의 강화된 기능 차원 아키텍처 큐브 아키텍처 큐브 저장소 디자인과 Real Time 을 위한 구성(14:00~14:50) UDM과 Cache와의 관계 Proactive Caching 활용 저장소 디자인 Real Time OLAP을 위한 구성 사용자 화면 작성을 위한 도구 소개(15:10~16:50) MS BI 플렛폼 사용자 계층별 작업 흐름도 Excel과 Excel Service 활용 PPS Monitoring
Attribute Relation 구성과 최적화 SQL Server의 BI 구성 요소 소개 SSAS의 강화된 기능 차원 아키텍처 큐브 아키텍처
Integrate Analyze Report BI Layer별 구성 요소 데이터 추출 데이터 변환 및 크린징 데이터 적재 계층화된 Work Flow 다양한 Source 연동지원 통합차원 모델 분석이 용이한 다차원 큐브 뷰 제공 효율적인 Real Time OLAP 지원 확장된 데이터 마이닝 알고리즘 제공 리포팅 배포 및 조회 큐브에 쿼리 가능 사용자가 직접 리포팅 작성 가능한 Reporting Builder 제공
General Architecture DB DB Legacy System DW Server AS Server SQL Server 2005 (Reporting Service) Sharepoint Portal 2007 (Excel Service) Windows 2003 AS Server App Server SSIS ODS ODS DB Legacy System DW 공통집계 DM Application 3th Party Tool (DynaSight ProClarity DynaSight Business Obeject..) View Cube IIS SQL Server 2005 (Analysis Service) DM DM DM DM DB Windows 2003 SQL Server 2005 Windows 2003 Reporting Page Reporting Builder Excel Service Web Page Excel 2007 ※ SSIS : SQL Server 2005 Integration Service ※ Legacy DB는 사용 RDBMS와 SAP, SAP BW, IBM 호스트 등 모두 가능
구성요소 소개 - SSIS 기업용 ETL 플랫폼 고 성능 대규모 안정성 및 신뢰성 동급 최고 사용성 풍부한 개발 환경 SQL 2005 Integration Services 뛰어난 ETL 성능 기업용 ETL 플랫폼 고 성능 대규모 안정성 및 신뢰성 동급 최고 사용성 풍부한 개발 환경 소스 제어 데이터 및 control flow의 시각적 디버깅 다양한 변환기능을 기본적으로 제공 높은 확장성 사용자 작업 사용자 계수 사용자 변환 사용자 데이터 소스
Unified Dimension Model 구성요소 소개 - SSAS EDW SQL 2005 Analysis Services 향상된 OLAP 및 데이터 마이닝 성능 Unified Dimension Model 분석 애플리케이션을 위한 메타 데이터 층 속성과 계산에 대한 실 데이터 단일 버전 제공 집계 엔진을 통한 향상된 분석 능력 향상된 Business Intelligence Key Performance Indicators 웹 서비스를 통해 오픈 인터페이스 제공 plus… Logistic Regression Linear Regression Text Mining Decision Trees Clustering Time Series Naïve Bayes Sequence Clustering Association Neural Net Introduced in SQL Server 2000
SQL 2005 BI의 강화된 기능 SSAS SSIS SSRS 통합 차원 모델(UDM : Unified Dimensional Model), KPI 등 스크립트 지원으로 버전 관리 가능 SSIS 제어 흐름(Control Flow)과 데이터 흐름(Data Flow) 분리 작업 단위를 묶을 수 있는 컨테이너 추가 편리하게 사용할 수 있는 많은 항목 및 작업 추가됨 SSRS Cube를 원시 자료로 활용한 리포트 작성 가능 Reporting Builder For, Foreach, 시퀀스 컨테이너 SAP .Net Connection Suite
SSAS 향상된 기능 사용자 환경 서버 큐브 차원 관련 데이터 마이닝 개발 관련 관리 Business Intelligence Development Studio로 개발 SQL Server Management Studio로 관리 서버 스크립팅 지원으로 버전 관리 가능 다중 인스턴스 만들기, 세션 지원 등 큐브 KPI(핵심 성과 지표), 큐브 뷰, 다중 팩트 테이블 지원 등 차원 관련 특성 기반 구조, 다대다 차원 지원, 참조 차원 등 Unknown Member 설정으로 크린징 없이 누락 자료 포함 가능 데이터 마이닝 새 알고리즘, 향상된 마이닝 모델 및 시각화 등 개발 관련 DSO(Decision Support Object)AMO(Analysis Management Object) 개체 모델 .NET CLR 이용 Function 추가 가능 관리 개발 및 SQL Server 프로파일러 통합 등
SSIS 향상된 기능 SSRS 향상된 기능 SSIS 및 SSRS 향상된 기능 개발면 관리면 기능면 디자인면 제어 흐름과 데이터 흐름을 구별하는 새 아키텍처 새로 추가된 여러 가지 작업, 데이터 원본, 데이터 대상, 변환 디버깅 기능 사용자 지정 개발을 위한 확장 가능한 API 제공 관리면 새 패키지 저장소 및 관리 도구 새 모니터링 및 문제 해결 도구, 배포 옵션 강화된 보안 기능, 레거시 지원 등 SSRS 향상된 기능 기능면 인쇄 기능, 대화식 정렬 기능, 다중값 매개 변수, 고정 테이블 머리글, SharePoint 웹 파트 보고서 검색 및 보기 디자인면 모델 디자이너 작성 프로젝트 추가 모델 기반 Drag Drop 기능을 지원하는 보고서 작성기 Analysis Service 쿼리 디자이너
AS 2005 차원의 넓어진 범위. 한 부모당 64K 멤버에 대한 제약은 없어짐 차원의 확장된 범위 및 용량 AS 2005 차원의 넓어진 범위. RDBMS의 모든 컬럼은 차원의 특성(attribute)이 될 수 있음 모든 특성은 AS2K의 가상 차원과 유사 리포트에서 가장 낮은 레벨의 상세 정보 수용 가능 invoice number, sales number 등 한 부모당 64K 멤버에 대한 제약은 없어짐 특성 계층엔 모든 멤버가 들어가야 하므로
특성(Attribute)은 엔티티 내의 모든 속성을 포함 가능 차원은 특성을 근간으로 함 완벽한 비즈니스 엔티티 표현 가능 조직, 고객, 제품, 채널 등 특성(Attribute)은 엔티티 내의 모든 속성을 포함 가능 기본적으로 각각의 특성은 자체의 계층 및 수준을 가짐 한 레벨(Single Level) 제품명, 제품사이즈, 제품컬러, 제품단가 등 계층(Hierarchies)은 특성간의 네비게이션 편리 제공 계층 및 수준은 드릴다운 경로를 정의하기 위해 제품대분류-제품중분류-제품
Attribute Relationship 차원 아키텍처 팩트와 유사한 구조(Start Schema)로 저장됨 차원의 특성들과 함께 Fact를 가진 큐브와 같은 형태로 취급됨 대량 차원에 대한 쿼리를 위한 효과적인 저장 지원 Products 차원 특성 계층 다중 수준 계층 Category Product Cate Category Subcategory Product Color Size Color Size Color Product Subcategory Size Natural Hierarchy User Hierarchy Attribute Relationship Key Attribute
SSAS 차원
Multi Fact Table 차원 용도 큐브 뷰(Perspective) 파티션(Partition) 큐브 아키텍처 여러 팩트 테이블을 포함한 하나의 통합된 큐브로 구성 차원 용도 차원과 특성 관계를 통한 유연한 모델링 가능 큐브 뷰(Perspective) 큐브 뷰를 통한 사용자 조회 단위를 손쉽게 설정 가능 파티션(Partition) 파티션에 대한 여러 가지 집계 옵션을 통한 물리적인 저장소 및 캐싱 옵션 조정 가능
AS2K SSAS AS2K vs SSAS 구조 비교 Dimension Cube Measure Virtual Cube 각각의 독립 차원 차원에 종속적인 가상 차원 Dimension Cube Measure Virtual Cube One Fact table AS2K Dimension Cube Measure Virtual Cube Dimension Cube Measure 특성 키 중심으로 관리 키 종속적인 계층들 생성 Dimension Group Perspective Attribute Hierarchy SSAS Design Time Objects facilitate UI design of multiple packages Business Intelligent Portal – 버거킹 Cube User Hierarchy Multi Fact table Perspective Measure Group One Fact Table
SSAS 주요 개체 관계 차원 측정값 그룹 계산 KPIs 작업 측정값 그룹(Measure Group) 차원 키 특성 차원 용도 특성 관계 차원 용도 측정값 그룹(Measure Group) 파티션 차원 키 특성 특성 계층(Attribute Hierarchy) 속성(Attribute) 측정값 다중 수준 계층(Multi Level Hierarchy) 계산 KPIs 작업 큐브 뷰(Perspective) ※ 차원 용도 : 차원과 측정값 그룹과의 관계 설정
차원의 변화 2000 AS 2005 SSAS [제품].[제품대분류A] [제품].[제품].[제품대분류A] 제품 분류 제품 18년 11월 28일 10시 19분 48초 차원의 변화 2000 AS 2005 SSAS 제품 분류 제품 제품 대분류 제품 중분류 제품 소분류 제품 (Key) 제품 분류 제품 대분류 제품 대분류 제품 중분류 제품 소분류 제품만 제품 중분류 제품 제품 소분류 제품 제품 컬러 제품 대분류 제품 중분류 제품 소분류 제품 제품 대분류 제품 중분류 제품 소분류 제품 사이즈 특성 사이즈 컬러사이즈 사이즈 컬러 사이즈 컬러 계층 및 수준 컬러 [제품].[제품대분류A] [제품].[제품].[제품대분류A] © 2005 Microsoft Corporation. All rights reserved. This presentation is for informational purposes only. Microsoft makes no warranties, express or implied, in this summary.
큐브의 변화 2005 SSAS 2000 AS 매출 큐브 매출 목표 매출 목표 년월일 년월 거래처 제품 매출액 년월 거래처 18년 11월 28일 10시 19분 48초 큐브의 변화 2000 AS 2005 SSAS 매출 큐브 매출 목표 매출 목표 년월일 년월 거래처 제품 매출액 년월 거래처 목표액 년월일 년월 거래처 제품 매출액 년월 거래처 목표액 큐브 가상큐브 측정치 그룹 가상큐브 목표 매출 목표 매출 년월 거래처 목표액 매출액 년월 거래처 목표액 매출액 가상큐브 큐브 뷰 © 2005 Microsoft Corporation. All rights reserved. This presentation is for informational purposes only. Microsoft makes no warranties, express or implied, in this summary.
SSAS 큐브
논리적인 관계 정의를 통해 유연한 큐브 구성 가능 관계 정의 유형 측정값 그룹에 대한 큐브 차원 관계 정의 논리적인 관계 정의를 통해 유연한 큐브 구성 가능 관계 정의 유형 일반(Regular) 차원 테이블은 팩트 테이블에 직접 조인됨 팩트(Fact) 팩트 테이블을 차원 테이블로 사용 참조(Reference) 차원 테이블은 중간 테이블에 조인되고 중간 테이블은 다시 팩트 테이블에 조인 다대다(ManyToMany) 차원 테이블에 조인할 중간 팩트 테이블을 지정하여 차원과 측정값 그룹 간의 관계를 정의
관계 정의 구성 일반(Regular) 팩트(Fact) 참조(Reference) 다대다(ManyToMany)
차원에 많은 특성 계층과 다중 수준 계층을 포함하더라도 저장소가 커지거나 집계 속도가 떨어지지 않음 차원 내 관계 설정 최적화 차원에 많은 특성 계층과 다중 수준 계층을 포함하더라도 저장소가 커지거나 집계 속도가 떨어지지 않음 고정적으로 최적화되어 저장되기를 원한다면 RelationshipType을 Rigid로 설정, 기본은 Flexible 최적화를 위해서 1:1 관계인 경우는 Cardinality를 One으로 설정, 기본은 Many 경로 최적화를 위해 특성간 종속적인 관계에 있는 경우에는 정확한 Parent 관계 설정으로 Natural Hierarchy형태가 될 수 있도록 유도
Unrestricted나 Default의 경우 SSAS 설정 포인트 큐브 차원 All 멤버 집계 설정 최적화 차원의 All Member에 대해 집계가 되기를 필요로 한다면 AllMemberAggregionUsage를 Full로 Full : 집계 생성시 항상 포함 None : 집계 생성시 포함시키지 않음 Unrestricted : Analysis Services가 집계 설계 시 해당 특성 차원 포함을 고려 Default : Unrestricted와 동일 큐브 특성 집계 설정 최적화 자주 조회 되는 특성에 대해 집계에 포함하고 싶다면 큐브 내 AggregationUsage을 Full로 설정 유형은 위의 옵션과 동일 Unrestricted나 Default의 경우 집계 정도에 따라 집계 엔진이 포함 여부 고려하여 판단
SSAS 설계 포인트 설계 과정 차원 정의 같이 분석해야 하는 측정치 그룹 그룹핑 특성 키를 중심으로 Granularity가 다른 경우를 위해서 별도의 차원 정의 필요치 않음, 세분성 특성으로 연결 관계 조정 가능 같이 분석해야 하는 측정치 그룹 그룹핑 차원과 측정치 그룹 간 사용 Matrix 표 작성 같이 묶어야 하는 측정치 그룹들에 대한 별도 표기 큐브 성능을 위한 Granularity 조정을 위한 비정규화 팩트 매출 목표비 실적을 위해 매출 원시 Fact를 매출 목표와 근접한 Granularity 테이블 비정규화와 연계 이런 Granularity를 낮춘 측정치 그룹은 다수의 다른 측정치 그룹과 연계할 때 재사용 용이
Granularity에 따른 Cube 단위 SSAS 설계 포인트 Granularity에 따른 Cube 단위 Granularity 높은 경우 관련된 적은 측정치 그룹 목적에 따른 최소한의 차원 포함 예)매출 상세 분석 큐브 : 제품 매출, 일별 재고 Granularity 낮은 경우 연관된 많은 측정치 그룹 포함 최대한의 차원 포함 예) 월별 조직별 큐브 : 매출, 수금채권, 재고, 매출이익, 손익, 비용, 인센티브, 인원 등