데이터웨어하우스 2007.06
Click here to add header PowerPoint Template_Sub Click here to add header Click to add text to your presentation
제 3장 데이터웨어하우스
개념 기업의 내부 및 외부의 데이터 (internal data)를 주제별로 통합하여(subject-oriented), 여러 측면에서 (multi-dimensional) 분석을 가능케 하는 통합 시스템 이다. “Central Repository of Enterprise Data”
전산분야의 현 주소 (문제의식) 정보시스템 As a Cost Center Profit Cener 2. (해결방안) 데이터웨어하우스는 정보시스템이 조직 경쟁력 강화를 위한 도구 로 진화하도록 현업에서 필요한 정보를 쉽게 이용하도록 도와 주는 시스템 출현배경 Hardware의 발전과 가격하락 (CPU, Memory, Parallel Processing, …) DB 기술의 발전 (대용량, Cluster File System, …) DW 도구의 발전: ETL (Extraction/Translation/Loading), Multi-dimensional Cube model, OLAP 분석도구
OLTP(DB)와 OLAP(DW, DSS)의 비교
데이터웨어하우스의 특징 주제지향성(개체중심) <=> 업무처리 중심 통합성 <=> 일관성 없이 데이터 중복 관리 시계열성(일, 월, 분기, 년 등) ; 즉, 월/년 등 기간과 관련을 가짐. 비 휘발성(일기 전용) <=> 갱신작업 독립성; 기업의 운영시스템과는 분리되어 있다.. 주제 중심적 ; 기존 DB와 근본적으로 구분. Read-only; OLTP와 달리 삭제, 변경 등이 일어 나지 않음.
데이터 웨어하우징 데이터의 수집/처리~활용에 이르는 일련의 프로세스 데이터의 추출, 변환, 정제, 통합 단계 정보도출 단계 정보활용 단계 데이터의 추가, 갱신, 삭제
데이터 웨어하우스와 데이터마트 데이터마트는 비교적 작은 규모의 데이터 웨어하우스이다.따라서 데이터 마트는 데이터 웨어하우스의 일부분이다. 특정 사용자가 관심을 갖는 데이터를 대상으로 한다. 따라서 구분기준 : 사용자의 기능 또는 제공범위 데이터저장범위에 따른 구분 예: (1) DW (Data Warehouse) : 전사적 데이터베이스 (2) 데이터 마트 : 인사 (HR) 데이터베이스
활용 실시간 기업 (RTE: Real-time Enterprise) 복잡한 분석 경영 의사 결정 (EIS, SIS, …) 실시간 분석 실시간 레포팅 복잡한 분석 다차원 분석 경영 의사 결정 (EIS, SIS, …) 부문별 EUC 영업관리팀: Sophisticated Custom Applications 생산관리팀: Data Mining 고객관리팀: Multi-Dimensional Analysis
구축 비용 세부 실행방법에 따라 큰 차이가 있음. 평균 기간: 6개월~1년 비용: 10억원 내외
기본 구성도 기간계 업무 정보계 업무
구성요소 Source Data DW 플랫폼 클라이언트 관리 도구 파일 DB DBMS Storage 서버 OLAP 도구 Web 브라우저 관리 도구 Meta Data SMS
오픈소스 데이터웨어하우스 Pentaho provides a full spectrum of open source Business Intelligence (BI) capabilities including reporting, analysis, dashboards, data mining, data integration, and a BI platform. www.pentaho.org