데이터 웨어 하우스 04606035 이병규 04606003 김기훈
데이터 웨어 하우스 목 차 ★ 데이터 웨어하우스 Ⅰ. 개 요 1. 출현 2. 정의 3. 필요성 4. 구축시 고려사항 Ⅱ. 기법 및 도구 1. 데이터 모델링 기술 2. 데이터베이스 시스템 요건 Ⅲ. 데이터웨어 하우스 모델링 1. 모델링 2. 프로세스 모델링 Ⅳ. 데이터웨어 하우스 적용방안 1. 데이터웨어 하우스 구축 방향 2. 전개방향
데이터 웨어 하우스 Ⅰ. 개요 경쟁력 향상을 위해서 신속하고 정확한 의사결정을 할 수 있도록 지원해주는 시스템 데이터 웨어하우스는 단순한 데이터의 저장고가 아니라 관계형 데이터베이스를 근간으로 많은 데어터를 다차원적으로 신속하게 분석하여 의사결정에 도움을 주기 위한 시스템이다.
데이터 웨어 하우스 Ⅰ. 개요-출현 새로운 요청을 충족시킴으로써 효율적인 조직경영을 지원하고 사용자의 관점에 따라 새로운 형태의 데이터베이스를 구축하여 경영에 활용하기 위한 새로운 개념의 데이터베이스로 등장한 데이터웨어하우스는 이제까지 저장되고 관리되어 오던 조직의 데이터베이스에서 경영 의사결정을 지원하고 사용자의 업무처리 지원을 위하여 구축하는 종합요약정보 및 분석정보들의 집합체라 할 수 있다
데이터 웨어 하우스 Ⅰ. 개요-정의 방대한 자료처리를 위하여 새로운 정보기술의 적용이 필요하게 되었다. 이러한 요구를수용하기 위하여 등장한 데이터웨어하우징은 정보시스템에 의하여 구축된 개별적인데이터베이스로부터 정보를 분석하고 경영활동을 지원하기 위한 데이터의 구축 및 체계적인 관리를 통하여 필요시 경영활동에 유용한 정보를 제공하기 위한 일련의 정보처리기술을 말한다.
데이터 웨어 하우스 Ⅰ. 개요-필요성 경영효율화를 위하여 조직의 업무 처리 과정에서 쌓여가고 있는 방대한 규모의 데이터들에 대한 가치의 중요성을 인식하고 이에 대한 철저한 분석 및 통합으로 사용자에게 보다 고급의 정보를 제공해야 할 필요성이 대두
데이터 웨어 하우스 Ⅰ. 개요-구축시고려사항 가. 데이터웨어하우스 구축요건 1) 업무영역별 사용자관점의 데이터 고객, 영업, 상품 등 업무영역별 사용자의 관심요건에 따라 분류되어 구축됨으로써 업무목적에 따라 적절한 정보를 제공할 수 있어야 한다. 2) 업무별 관련사항을 통합한 데이터 데이터웨어하우스는 조직내의 각종 업무처리 단위별로 구축된 데이터를 전사적 차원에서 서로 연계되는 부분을 통합한 내용으로 구성하여 하나의 독립된 데이터를 표현되어야 한다. 3) 경영활동 기간별 데이터 조직의 의사결정지원을 위해서는 특정시점만의 자료가 아닌 관심대상 기간의 데이터변동, 즉 경영활동에 대한 추이분석을 할 수 있는 정보의 형태로 제공될 수 있도록 구축한다. 나. 데이터웨어하우스 정보제공요건 데이터웨어하우스는 구축시점을 제외하고는 갱신이 일어나지 않는 검색전용 데이터베이스로서 사용자에게 적절한 정보의 제공을 위한 검색의 효율성에 관점을 두어 설계되어야 한다
데이터 웨어 하우스 Ⅱ. 데이터웨어하우징의 기법 및 도구 조직경영에 있어서의 정보관리 전략은, 대량의 트랜잭션을 신속하게 처리하는 지금까지의 업무 처리 자동화의 개념을 넘어서서 정보의 분석을 통한 경영의사결정을 지원하기 위한 조직의 정보화로의 변화를 요청 받고 있다. 데이터웨어하우스를 구축하기 위해서는 데이터모델링 기법이 적용되어야 하고 이를 활용하기 위해서는 데이터베이스 기술이 필요하게 된다.
데이터 웨어 하우스 Ⅱ. 데이터웨어하우징의 기법 및 도구 –데이터 모델링 기술 데이터모델링이란 사용자요구에 맞는 정보의 제공을 위하여 데이터를 분석하여 데이터웨어하우스를 구축하는 절차와 방법을 말한다. 데이터모델링 관련 기술에는 사용자에 의하여 정보를 분석하는 OLAP(On-Line Analytical Processing) 기술, 데이터의 소스를 중심으로 이를 사용자의 관점에 따라 여러 측면을 설정하는 차원모델링(Dimension Modeling), 통합데이터를 부서나 팀단위로 보다 특성화하여 구축하는 데이터마트(Data Mart), 대량의 데이터베이스로부터 유용한 정보를 찾아내는 데이터마이닝(Data Mining) 기법들이 적용된다.
데이터 웨어 하우스 Ⅱ. 데이터웨어하우징의 기법 및 도구 –데이터 모델링 기술 1) 온라인분석처리(OLAP: On-Line Analytical Processing) 주문정보같이 다차원 데이터를 실시간 검색과 분석하는 데이터 웨어하우스에서 일반적으로 사용된다. DOLAP : Desktop OLAP 또는 Database OLAP를 뜻한다. 저렴한 가격의 지역적 다차원 분석과 데이터 다운로드의 프리젠테이션을 관계형 또는 다차원 데이터베이스로부터 클라이언트에 행하는 OLAP tool을 말한다. HOLAP : Hybrid OLAP. 다차원 데이터베이스나 RDBMS에 저장되어 있는 데이터를 동시적으로 다차원 분석을 제공할 수 있는 tool을 말한다. MOLAP : Multidimensional [Database] OLAP. ROLAP : Reational On-Line Analytic Processing 특별한 다차원 데이터베이스보다는 관계형 DB를 이용한 OLAP를 말한다.
데이터 웨어 하우스 Ⅱ. 데이터웨어하우징의 기법 및 도구 –데이터 모델링 기술 2) 차원모델링(Dimension Modeling) 데이터웨어하우스의 모델링 방법 중 하나로서 조직의 경영활동의 결과로 추출된 업무처리 사항이 담긴 정보를 설정해 두고 이를 사용자의 요구관점에 따라 발생할 수 있는 다양한 측면의 추출방법에 따라 접근하는 방식으로서 업무단위별로 1개의 사실(Fact) 테이블과 여러 개의 차원(Dimension) 테이블을 구축하여 활용하는 모델링 방법이다. 3) 데이터마트(Data Mart) 한 두 개의 특별한 영역에 중점을 두어 만든 데이터 웨어하우스의 일부라고 할 수 있다. 일반적으로 데이터 마트는 데이터 웨어하우스로부터 추출되어 특별한 사용자 입맛에 맞도록 역정규정화되고 인덱싱된다.
데이터 웨어 하우스 Ⅱ. 데이터웨어하우징의 기법 및 도구 –데이터 모델링 기술 4) 데이터마이닝(Data Mining) 대량 데이터군 내에서 경향과 패턴을 발견해내는 기법(데이터 항목들간의 관계를 발견하기 위해 통계적인 기술을 사용하는 기법)을 말한다. 또한 예측모델들의 구축도 이 데이터 마이닝을 바탕으로 한다. 이 기법은 예외적인 구성들을 찾기 위해 사용하는 OLAP와는 다른 것이다.
데이터 웨어 하우스 Ⅱ. 데이터웨어하우징의 기법 및 도구 -데이터베이스시스템(DBMS:DataBase Management System) 요건 데이터웨어하우스에는 조직의 대량 자료를 찾아내고 이를 별도로 저장소로 구축하여 사용자가 원하는 시점에 신속하게 제공하기 위해 데이터베이스 기술이 필수적이다. 이러한 데이터베이스 시스템의 요건으로서는, 대량의 데이터처리를 위한 고성능 또한 병렬처리, 데이터를 빠르게 조회할 수 있는 인덱싱(Indexing)기능, 차원모델의 검색을 위한 관계형 데이터베이스에서의 조인질의(Join Query) 최적화 및 사용자 관점의 논리적 데이터 뷰(View) 지원기능을 필요로 한다.
데이터 웨어 하우스 Ⅱ. 데이터웨어하우징의 기법 및 도구 -데이터베이스시스템(DBMS:DataBase Management System) 요건 1) 대량의 데이터 처리성능 데이터웨어하우스 구축을 위해서는 대량의 데이터를 보다 빠른 시간 내에 처리해야 하고 이를 위해서는 병렬처리가 필요하게 된다. 또는 각 처리 서버별로 분산하여 처리한 후 통합하는 방법 등도 고려해야 한다. 또한 데이터웨어하우스 조회시점에서도 대량의 데이터들이 여러 가지 다양한 기능을 통하여 제공되어야 하기 때문에 데이터베이스 시스템은 이러한 처리 성능을 충족할 수 있어야 한다. 2) 효율적인 인덱싱(Indexing) 기능 데이터웨어하우스는 대량의 데이터를 추출하여 구축되고 이렇게 구축된 데이터는 보다 빠른 속도로 사용자에게 제공되어야 하는데 자료에 대한 검색시 인덱스의 관리가 필요하다. 인덱싱은 데이터를 구축하거나 구축된 데이터를 조회하는 모든 경우에 있어서 처리속도를 보장할 수 있는 수준으로 제공되어야 한다.
데이터 웨어 하우스 Ⅱ. 데이터웨어하우징의 기법 및 도구 -데이터베이스시스템(DBMS:DataBase Management System) 요건 3) 조인질의(Join Query) 최적화 데이터웨어하우스는 스타스키마로 모델링하여 구축되는데 관계형 데이터베이스에 있어서 조인질의의 최적화가 가능해야 한다. 대용량의 데이터베이스로부터 사용자가 원하는 데이터를 차원테이블과 사실테이블을 조인(Join)하여 검색하게 되고 복잡한 요구에 대해서는 더욱 많은 형태의 조인 질의가 발생하므로 데이터베이스시스템은 이러한 질의에 적절하게 처리될 수 있어야 한다. 4) 논리적인 데이터 뷰(View) 제공기능 조직의 의사결정 정보를 여러 개의 테이블로 구성하여 구축된 데이터웨어하우스는 사용자의 관점에서 필요시 논리적인 통합 및 분리를 위한 뷰(View)의 설정이 용이하고 물리적인 테이블의 구조에 영향을 주지 않아야 한다. 5) 기타 기능 조직의 정보처리 환경의 변화에 따라 인터넷 분야로 확장됨에 따라 웹과 연동이 필요하며 다양한 데이터 지원을 위한 멀티미디어정보의 활용 및 그룹웨어와의 연동이 가능해야 한다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링 데이터웨어하우스의 모델링 작업은 조직경영에 있어서 각 계층별 사용자가 요구하는 정보제공 요청에 따라 이를 적절한 도구를 사용하여 구체화시키는 작업이다. 필요한 데이터를 도출하고 이들간의 관계정의를 통하여 데이터웨어하우스로 구축하는 데이터모델링과 이들 데이터웨어하우스에 소요되는 데이터의 내용을 조직의 데이터베이스에서 추출하여 데이터웨어하우스에 적재하고, 적재된 데이터내용을 토대로 하여 경영의사결정 정보를 제공하기 위한 프로세스 모델링 작업을 수행한다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 데이터웨어하우스의 데이터모델링은 사용자 면담 및 조사를 통하여 정보요구에 대한 사항을 정의하고 현재 운영되는 정보시스템의 정보내용을 조사하여 사용자 요구정의사항의 충족요건을 분석한다. 이를 토대로 하여 사용자의 정보요구사항이 포함된 테이블을 정의하고 각각의 테이블간의 관계성 및 사용자관점의 정보뷰(View)를 설정하여 데이터모델을 정의한다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 1)사용자 요구정의 데이터웨어하우스는 조직의 경영의사결정 지원을 위한 업무처리 결과자료의 통합된 데이터베이스
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 1)사용자 요구정의 ⅰ) 사용자 요구조사 데이터웨어하우스는 조직의 경영의사결정 지원을 위한 업무처리 결과자료의 통합된 데이터베이스로서 사 용자의 요구사항에 따라 이를 충족시키기 위한 데이터모델링 작업을 실시한다. 먼저 사용자의 요구사항을 정확하게 파악하기 위하여 경영 각 계층별로 면담 및 조사를 통하여 구체화하는 작업으로서 조직의 경영 목표를 달성할 수 있는 조요지표나 추세분석자료 등에 대하여 사용자 요구조사를 실시한다. ⅱ) 기존 시스템 정보조사 조사된 사용자의 요구사항에 대하여 기존 시스템에서의 데이터를 파악하고 이에 대한 추출은 가능한지 여 부와 데이터의 발생시기, 발생량 및 데이터내용 등 사용자 요구항목 별 기존 시스템의 정보처리 사항을 분 석한다. ⅲ) 사용자 요구사항 정의 사용자의 면담 및 요구사항 조사를 통하여 명세화되고 기존 시스템의 정보항목 파악에 의하여 조사된 내 용을 토대로 하여 조직의 각 계층별 소요되는 정보요구사항을 설정하고 사용자 요구사항을 결정하는 작업 이다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 2) 데이터 상세화 데이터상세화 작업은 사용자 면담 및 조사에 의하여, 그리고 기존 시스템분석에 의하여 도출된 사용자의 요구사항을 데이터모델로 구체화시키는 작업이다. 이는 모델링 도구를 사용하여 데이터모델을 설정하고 각 데이터모델이 구성하고 있는 데이터항목별 상세정의를 통하여 모델을 설정하는 과정이다. 이 과정에서는 사용자와 공동작업 형태로 실시하여 설정된 모델의 검증 및 반복작업을 통하여 모델 최적화 작업을 실시한다. 데이터모델링 도구로는 실체관계도(ERD)와 차원모델(Dimension Model)이 있다.
데이터 웨어 하우스 2) 데이터 상세화 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 가. 데이터모델링 도구 데이터모델을 설정하기 위한 도구로서 조직의 정보를 구성하고 있는 각 실체(Entity)를 도출하고 이들간 의 관계성(Relationship)을 정의한 실체관계도(ERD : Entity Relationship Diagram)와 사용자의 요구정보를 경영자료를 종합한 사실(Fact)테이블과 사용자의 정보요구 관점을 표현한 차원(Dimesion)테이블로 구분하 여 접근하는 차원모델(Dimension Model)을 사용한다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 2) 데이터 상세화 가. 데이터모델링 도구 ⅰ)실체관계도 (ERD : Entity Relationship Diagram) 실체(Entity)는 조직의 경영활동 과정에서 소요되는 독립된 객체로서 고객, 부서, 직원 등을 말하는데 정보화의 개념에서 보면 경영상 필요한 데이터를 보관하고 있는 데이터의 저장소 개념이다. 실체관계도는 이와 같은 조직의 경영상 소요되는 실체들을 추출하고 이들간의 관계성을 표현한 데이터 모델링 도구이다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 2) 데이터 상세화 가. 데이터모델링 도구 ⅰ)실체관계도(ERD : Entity Relationship Diagram) ․실체(Entity)는 조직의 경영활동 과정에서 필요한 독립된 객체로서 도출되며 시스템화 과정에서 정보를 저장하는 단위가 된다. ․관계(Relation)는 각 실체들간의 상호 참조영역을 가진 연관성을 말하는데 이를 통하여 데이터간의 구조를 파악할 수 있다. ․식별자(Key항목)는 실체를 구별할 수 있는 고유의 키 개념으로서 고객실체를 가정했을 때 주민등록번호나 새로운 의미의 고객번호 등이 될 수 있다. ․속성(Attribute)은 실체를 구성하고 있는 데이터 항목으로서 실체를 통하여 얻을 수 있는 정보의 상세 내용이다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 2) 데이터 상세화 가. 데이터모델링 도구 ⅱ)차원모델 (Dimension Model) 차원모델은 대량의 분석데이터 및 사용자관점의 정보요구사항의 수용을 위한 모델링 도구로서 데이터의 구성을 경영실적에 관한 정보를 가지고 있는 사실(Fact)테이블과 이를 활용하기위한 활용 키(Key)의 개념으로서 차원(Dimension)테이블로 구성하고 이 두 개의 테이블을 조인(Join)함으로써 정보를 추출할수 있는 모델이다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 2) 데이터 상세화 가. 데이터모델링 도구 차원모델 (Dimension Model)
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 2) 데이터 상세화 나. 사실(Fact)테이블의 정의 사실(Fact)테이블은 조직의 각 계층별로 조사되고 분석된 사용자 요구정의서를 토대로 하여 이를 충족할 수 있는 모든 데이터 항목을 추출하여 배열하고 차원테이블과 조인(Join)을 위해 사용되는 키(Key)를 결 정한다. 사용자와 공동작업의 형태로 진행하여 모델을 설정하고 반복적인 검토작업을 거쳐서 완성된다. 다. 차원(Dimension)테이블의 정의 사실테이블에서 정보를 추출하여 사용자에게 제공하기 위한 일종의 경로(Path)가 되는 테이블로서 사용자 요구정의서를 토대로 하여 사실테이블에 대한 정보추출 관점에 따라 구성한다. 차원테이블은 사용자가 정 보를 보는 관점이 되므로 사실테이블과 연계하여 질의 최적화(Query Optimization)를 구현할 수 있도록 구성한다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 2) 데이터 상세화 라. 요약테이블의 정의 대량의 사실테이블을 사용자 요구관점에 따라 별도의 집계된 형태로 데이터를 관리함으로써 검색시간의 단축을 목적으로 한 요약테이블을 별도로 정의한다. 마. 각 테이블정의 및 항목 설정 사실테이블과 차원테이블에 대한 생성주기, 사용용도 및 활용계층 등이 포함된 테이블 정의서를 작성하고 각 테이블별 구성하고 있는 항목에 대한 설명 및 데이터 유형 등에 대하여 항목 정의서를 작성하여 검토한 다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 3)데이터모델 검증 데이터웨어하우스의 데이터모델에 대하여 적정성을 검증하는 단계로서 구축하려고 하는 데이터에 대하여 사용자의 모든 요구가 도출되어 정의되었는가와 이를 구성하는 모든 데이터가 기존 운영시스템의 데이터베이스로부터 추출은 가능한가를 검증하는 작업이다. 이러한 과정은 데이터웨어하우스가 적정한 과정을 거쳐서 모델링되었는가에 대한 평가작업으로서 사용자와의 검토 및 협의에 의하여 검증되어진다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-데이터모델링 3)데이터모델 검증 ⅰ)사용자 요구검증 설계된 데이터모델이 사용자요구를 충족시킬 수 있는지를 정보요구사항과 데이터모델을 비교하여 그 적 정성을 검토한다. ⅱ)기존 시스템 항목 추출검증 데이터웨어하우스 모델에 적재(Load)할 원천자료의 검증을 실시하는 작업으로서 운영시스템에서의 모든 항목이 데이터웨어하우스를 지원할 수 있는가에 대하여 추출항목 및 방법에 대하여 검토한다. ⅲ)데이터모델 검토 및 승인 이렇게 하여 설계된 데이터모델에 대하여 사용자와의 검토를 거쳐서 데이터웨어하우스 모델로 설정한다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-프로세스모델링 프로세스 모델링은 사용자 요구분석에 의하여 도출된 데이터모델을 데이터웨어하우스로 구축하기위하여 사실테이블(Fact Table)에 저장하는 처리절차를 명세화하고, 사실테이블(Fact Table)과 차원테이블(Dimension Table)을 조인(Join)하여 처리하는 정보제공에 대한 명세화 작업이다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-프로세스모델링 1) 데이터모델 검토 ⅰ)데이터모델 적정성 검토 1) 데이터모델 검토 ⅰ)데이터모델 적정성 검토 데이터웨어하우스의 사실테이블과 차원테이블이 사용자요구에 맞게 설계되어 이에 대한 저장 및 활용을 위한 프로세스 처리 효율성 측면에서 데이터모델의 적정성을 검토한다. 테이블 저장 및 조인질의(Join Query)처리를 검토하여 테이블의 분류 및 통합을 통하여 재조정 될 수 있다. ⅱ)운영프로세스 분석 데이터웨어하우스를 구성하는 데이터의 원천인 운영시스템의 데이터 발생요건 및 저장주기, 데이터량등 을 분석하여 데이터웨어하우스 구축 미 활용 프로세스 정의를 위한 기초 자료로 활용한다. 기존 운영시스템의 각 데이터항목에 대한 이해와 정의를 통하여 프로세스를 설계한다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-프로세스모델링 2) 데이터 저장처리 명세화 사실테이블의 저장절차를 정의하고 각 항목별 저장처리에 대한 요건 및 운영시스템의 소스(Source)항목 에 대한 처리방법 등에 대하여 명세화하는 작업이다. ⅰ)저장절차 정의 사실테이블을 구축하기 위한 운영시스템의 테이블 정의서와 데이터항목에 대한 정의서를 토대로 사실테 이블로의 매핑(Mapping)단계이다. 사실테이블의 각 항목에 대한 운영시스템의 데이터항목을 입력으로 하 여 사실테이블에 저장하는 절차를 정의한다. ⅱ)저장프로세스 명세화 데이터웨어하우스를 구축하기 위한 저장처리 절차에 대한 상세화 작업으로서 입력으로 사용될 운영시스 템의 테이블과 구성항목에 대하여 정의하고 이를 처리하기 위한 프로세스를 명세화 한다. 입력테이블의 추출 및 처리조건에 대한 논리 흐름을 정의하여 프로세스 명세서를 작성한다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-프로세스모델링 3) 데이터 활용처리 명세화 사실테이블과 차원테이블을 이용하여 사용자가 요구하는 정보를 제공하기 위한 프로세스 명세화 작업과정으로서 조인질의 최적화를 위한 각 테이블 검색방법을 정의하고 이를 요구하는 정보에 맞추어 명세화하는 작업이다. ⅰ)조인질의(Join Query)최적화 검토 사실테이블과 차원테이블을 조인하여 검색하는데 있어서의 성능최적화를 위한 질의조건 등을 검토한다. 사용자의 요구정보 제공을 위한 질의 방법을 도출하고 이를 최적화할 수 있도록 설계한다. ⅱ)활용 프로세스 명세화 사용자의 요구정보 제공을 위하여 도출된 질의 처리사항에 대한 명세화 과정으로서, 사용자에 의해 도출된 요구정보에 대하여 검색이 필요한 사실테이블과 차원테이블을 정의하고 치리조건 등을 기술하여 논리흐름을 작성하고 이를 명세화함으로써 처리절차 등이 구체화 되어진다.
데이터 웨어 하우스 Ⅲ. 데이터웨어하우스의 모델링-프로세스모델링 4) 프로세스 모델 검증 4) 프로세스 모델 검증 데이터모델 및 프로세스 모델에 대하여 상호검증하는 단계로서 구축하려고 하는 데이터에 대하여 모든 프로세스가 적용될 수 있는지와 처리프로세스별 생성하는 데이터와 검색에 활용되는 데이터가 효율적으로 접근이 가능한지를 검증하여 모델의 완성도를 검토하는 단계이다. ⅰ)데이터 및 프로세스 검증 데이터웨어하우스와 같은 대량의 데이터들을 저장 하고 검색하는 것은 처리방법에 따라 성능면에서는 많은 차이가 있을 수 있으므로 처리성능을 분석하여 저장 및 질의 최적화 방안을검토한다. ⅱ)사용자 승인 및 검토 데이터 저장 및 활용프로세스에 대한 처리방법이나 절차 등에 관하여 명세화 한 설계서를 가지고 사용자와 검토하여 사용자의 요구를 충족시킬 수 있는가에 대하여 검토 및 승인 과정을 거친다.
데이터 웨어 하우스 Ⅳ. 데이터웨어 하우스 적용방안 데이터웨어하우스는 조직경영에 있어서 필수적인 의사결정지원을 위한 토대가 되며 조직의 정보가치를 극대화 할 수 있는 전략적 도구라 할 수 있다. 따라서 이를 효과적으로 구축하고 적절하게 경영에 활용하는 것이 조직의 경쟁력을 강화시키고 궁극적으로는 조직의 경영목표를 달성할 수 있게 해준다. 이를 위해서는 조직의 정보처리방향을 온라인업무처리(OLTP) 중심에서 온라인업무분석(OLAP) 환경으로의 전환을 시도하여 정보의 전략화를 통한 경영합리화를 지향할 수 있는 정보처리 기반구조를 확립하여야 할 것이다.
데이터 웨어 하우스 Ⅳ. 데이터웨어 하우스 적용방안- 데이터웨어하우스 구축방향 데이터웨어하우스의 구축은 조직의 정보처리환경의 전환을 의미하는 것으로서 조직의 경영자나 사용자 모두에게 의미 있는 과정으로 이를 위해서는 사용자가 주도하는 형태로 시작되어야 하며 대량의 데이터처리를 감안하여 각종 시스템 환경의 정비가 요청된다.
데이터 웨어 하우스 Ⅳ. 데이터웨어 하우스 적용방안- 데이터웨어하우스 구축방향 ⅰ)사용자 중심의 정보처리 데이터웨어하우스의 구축은 사용자에 의하여 정보가 분석되고 활용되기 때문에 사용자의 전산마인드를 심화시킬 수 있는 정보화교육과 정보처리 환경에 대한 이해도를 높이는 것이 중요하다. ⅱ)정보분석 중심의 업무처리 지원 운영시스템의 데이터처리를 단순히 확장한 개념의 정보분석으로는 적절한 의사결정 지원자료를 제공할 수 없다. 따라서 조직의 경영목표를 달성하기 위한 전략적 개념의 주요정보를 도출하고 이를 처리할 수 있는 방향으로 추진되어야 한다.
데이터 웨어 하우스 Ⅳ. 데이터웨어 하우스 적용방안- 데이터웨어하우스 구축방향 ⅲ)정확성과 처리성능 데이터웨어하우스는 운영시스템의 데이터를 가공하여 통합한 형태로 제공되기 때문에 대량의 데이터처리가 불가피하고 중요한 의사결정을 위하여 정확성이 요청된다. 특히 처리성능에 있어서는 적정한 시간 내에 많은 데이터를 처리․제공하기 위하여 필요한 정보기술 및 도구 등이 적용되어야 한다. ⅳ)단계적이고 점차적인 확산 사용자의 요구에 따라 설정되어 추진이 되겠지만 통합적인 개념의 정보제공은 데이터웨어하우스가 초기 단계부터 운영되면서 점차적으로 확대되어 완성되어 갈 것이므로 체계적인 정보처리 환경의 구축과 사용자의 전산마인드 고취를 통하여 단계적이고 점차적으로 완성시켜 나가야 한다.
데이터 웨어 하우스 Ⅳ. 데이터웨어 하우스 적용방안- 데이터웨어하우스의 향후 전개방향 데이터웨어하우스는 정보기술의 발전에 따라 또 다른 영역으로의 확장을 도모할 것이며 궁극적으로는 의사 결정지원시스템(DDS : Decision Support System)으로 정착될 것이다. ⅰ)새로운 정보기술의 수용 기존의 의사결정지원 정보가 텍스트(Text)위주의 계수나 수치자료로 이루어져 있지만 향후에는 텍스트 자료 뿐만이 아니라 다양한 형태의 멀티미디어 자료의 수용까지도 포함될 것이다. 또한 웹을 기반으로 한 데이터 연동처리를 지원하고 그룹웨어를 사용하여 사용자에게 전달할 수 있는 새로운 정보기술 분야로의 발전을 도모하고 있다. ⅱ)의사결정지원시스템의로 정착 데이터웨어하우스는 조직의 정보처리 수준을 단순 온라인 처리에서 복잡한 의사결정정보처리수준으로 높이는 역할을 할 것이며 궁극적으로는 조직의 모든 의사결정을 담당할 의사결정지원시스템(DDS)으로 정착되어 갈 것이다.