Presentation is loading. Please wait.

Presentation is loading. Please wait.

Data Management Software

Similar presentations


Presentation on theme: "Data Management Software"— Presentation transcript:

1 Data Management Software
DB2 UDB EEE IBM Software Group

2 목 차 …………………………………………. 1. DB2가 설치될 수 있는 OS 종류 및 국내 Reference Site
목 차 …………………………………………. 1. DB2가 설치될 수 있는 OS 종류 및 국내 Reference Site (특히 AIX외 사이트) DB2의 Clustering 가능 여부와 기술 자료 2-1. Oracle의 RAC와 유사 기능 및 RAC와의 비교자료 2-2. HACMP와 연계하의 Clustering 구성자료 3. 기존에 Stand-alone 으로 DB2(Version 7.1) 설치하여 사용하다가 Clustering 구현시 고려사항 또는 주의사항

3 Multi-Platform용 DB2 지원 플랫폼 ………………………………………….
AIX , HP-UX, Solaris, Linux, Windows 9x/NT/2000/XP, PTX (NUMA-Q), OS/2 DB2 클라이언트의 플랫폼 PTX (NUMA-Q), OS/2 , Silicon Graphics IRIS

4 Multi-Platform용 DB2 국내 고객 사례 ………………………………………….
플랫폼 멀티 플랫폼용 DB2를 사용하는 고객사 AIX 국세청, 국민연금, 국민은행, 외환은행, 제일은행, 우리은행, 외환카드, 국민카드, 세종증권, 대신증권, 신한생명, LG 화재, 동양화재, 국제화재, 교보생명, 흥국생명, 동부화재, 제일화재, SK Global ES, SK Corp, LG 화학, LG 생활 건강, LG CI, POSCO 광양, Hynix, SK Telecom, ROTEM, 한라공조, 현대 Mobis, 기아차, 현대 중공업, 현대 캐피탈, 동양 오리엔탈 투자신탁, 베텔스만, 현대약품, 화승, 삼성 종합 기술원, 철도청, 한국 전지 Windows 국세청, 삼성전자, SK Telecom, LG 생활 건강, 삼성화재, 신한생명 HP-UX 방송통신대, 제일은행 Solaris 국민은행, 제일은행 Linux , OS/2, PTX (NUMA) SK Telecom (OS/2)

5 Multi-Platform용 DB2 국내 고객 사례 ………………………………………….
[ 국내구축사례] 고객사 크기 업무 특징 외환카드 2TB 손익분석, 영업분석, 고객 분석 NCR과 최종 경쟁하여 IBM Win. 매년 1TB 씩 데이터 증가 흥국생명 1TB CRM 분석 DW NCR과 경쟁. IBM IIW 솔루션과 함께 도입 동양화재 목표 5TB E-CRM, 영업분석, 상품개발 NCR, Sybase와 경쟁. CRM을 고려한 Total 솔루션을 고려하여 IBM 선택 국제화재 1TB CRM 통합, 손익분석, 고객 분석 가격 대비 성능 및 확장성이 주된 관점. DB2 EEE가 관리비용 및 확장성 측면에서 선택됨 현대캐피탈 1TB DW/e-CRM Mining 및 고객 분석 위주의 CRM으로 현재 진행 중 현대전자 2TB 반도체 공정분석 DB2 UDB EEE, Intelligent Miner, Brio 사용 NCR과 경쟁 국민은행 4TB ECRM, 영업분석, 고객분석 호스트환경에서 DB2/390을 이용하여 DW구현 외환은행 0.7TB 종합수익관리 DB2 UDB EEE 사용

6 Multi-Platform용 DB2 국외 고객 사례 ………………………………………….
[ 국외 구축 사례 ] 고객 명 산업 분류 노드 수 데이터 크기 (TB) Tele Denmark Telecom 52 12.0 Chase Manhattan Bank 136 11.3 Royal Bank Bank 58 10.2 CitiBank Bank 116 7.0 Prrudential Insurance 30 6.0 American Express Card 47 4 StateFarm Marketing Insurance 186 36 StateFram Actuarial Insurance 246 15 Sprint PCS Telecom 17 7.0 Nomura Securities Finance 22 4 Fuji Bank Bank 29 6 LL Bean Retail 12 3.5 PCS Healthcare Health 12 3.0 Nippon Telephone Telecom 22 4.0 DymlerChristler Auto 23 3.5 Bell Atlantic Telecom 9 2.0

7 Multi-Platform용 DB2 국내 고객 사례 ………………………………………….
외환카드 - 국내 외환 신용 카드는 RS/6000 SP 8 노드에 EEE를 사용하여 2TB의 데이터를 운용하고 있다. 2000년 5월에 시스템을 오픈 할 당시 4 노드 였던 것이 불과 1년도 안되어서 두 배로 늘어난 것이다. 노드 확장 시에도 단 하루 동안의 작업만으로 데이터 재분배 및 기타 확장 작업들을 성공적으로 완료하였다. 사용자수 : 200명, 데이터량 : 2TB, 월 평균 증가량 : 30GB 평균 조회 시간 : 2~30초(Query에 따라 달라짐) OLAP Tool : BRIO Explorer 최대 로드 시간 : 20분(2700만 건) – Parallel Load사용 시 구성도 IBM 9672-R22 Tandem Win NT (x 4) Web Server CAP Scheduler Scheduler Java HTML IMS Enscribe SQL Server WebSphere Scheduler PRISM ETT PRISM ETT WinNT PRISM ETT OS/390 Guardian 데이터웨어하우스서버 손익/자금분석 DW 관리용서버 OLAP 관리용 PC DB2 UDB EEE 6.1 SPSS PWE PWD Navi. Web Browser PRISM ETT SQL Server PWD BRIO Design BRIO Exp. AIX 4.3.3 WinNT PSM Win95 SPSS (RS/6000 SP, 8 node) WinNT Win95

8 Multi-Platform용 DB2 국외 고객 사례 ………………………………………….
도이치텔레콤 - 국외 유럽에서 가장 큰 통신 회사인 도이치 텔레콤은 IBM RS/6000 SP기반 위에 DB UDB EEE를 이용하여 100TB의 세계 최대 규모의 데이터 웨어하우스를 구축하여 운용하고 있다. 초기에는 SP 42노드에 24TB 데이터를 사용하였지만 1년 내에 4배 이상 확장하여 100TB 데이터를 사용하고 있으며 EEE의 성능과 확장성을 보여주는 좋은 사례이다. HW : IBM RS/6000 SP 42 Nodes,4 way 375Mhz AIX V 4.3.3 DB : IBM DB2 UDB EEE 구성도 [ DW 서버 ] 42 node [ 데이터변환 서버] IBM RS/6000 S80

9 Multi-Platform용 DB2의 서버 유형 ………………………………………….
DB2 UDB 서버의 유형 특 징 DB2 Personal Edition(PE) 단일 사용자용 데이터베이스로서 Mobile 사용자나 Power 사용자를 위한 Full Function을 제공하는 ORDBMS이다. 복제 기능과 GUI 환경의 관리 기능을 갖추고 있다. DB2 Workgroup Edition(WE) 클라이언트 / 서버 환경이나 웹 환경을 지원하는 DB2 Enterprise Edition과 동일한 기능을 갖는 Full Function을 제공하는 ORDBMS 로서 중소기업의 데이터베이스 서버로 적합하다. Intel의 경우 4 CPU , Unix의 경우 2 CPU 까지만 SMP (Symmetric Multi-Processing) 환경을 지원합니다. DB2 Enterprise Edition(EE) 클라이언트 / 서버 환경이나 웹 환경 및 DRDA 환경을 지원하는 Full Function을 제공하는 ORDBMS 로서 큰 규모의 기업 데이터베이스 서버로 적합하다. SMP (Symmetric Multi-Processing) 환경을 완벽하게 지원합니다. DB2 Extended-Enterprise Edition(EEE) 클라이언트 / 서버 환경이나 웹 환경 , DRDA 환경, 클러스터 환경과 SMP 및 MPP(Massively Parallel Processor)를 지원하는 Full Function을 제공하는 ORDBMS 로서 큰 규모의 비즈니스 서버 통합에 유리한 Tera 바이트 급 이상의 데이터베이스 서버에 적합하다. 이 제품의 적용 범위는 Large SMP, Data Warehouse, Data Mining 및 High Volume OLTP이다.

10 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
병렬처리 프로세스 데이터 분배 및 적재 (데이터 분배 해싱) 데이터 적재 도구 – Autoloader 유틸리티 데이터 재분배 도구 비용 기반 옵티마이저 가용성 질의 최적화 – Visual Explain 자동 요약 테이블(Automatic Summary Table)과 복제 요약 테이블(Replicated Summary Table) 파티션 간의 Fail-Over 연동성 GUI 환경 툴 및 DB2 버전8의 새로운 기능

11 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 무공유 방식 아키텍처 (Shared Nothing Architecture) MPP나 클러스터에서 각 Node(CPU, Memory, Disk를 갖춘 개별 처리 장치)들을 고속의 스위치 로 연결하여 노드 간의 간섭을 최소화하고 처리용량을 최대화 한 구조 이다. 대용량 데이터 처리에 이상적이며 선형적인 확장성을 보장한다. 다양한 H/W 지원 RS/6000 SP, Large SMP(S85,Regatta..) HACMP / LAN 클러스터 NUMA 각 파티션의 독립적 병렬 수행 Select/Insert/Update/Delete Load/Backup/Restore 버퍼 풀 및 메모리 관리 로깅 / Function Shipping 유연한 파티션 확장 노드 및 파티션 추가 DB 구성 매개변수 변경 데이터 재분배 수행 비용기반(cost based) 옵티마이저 쿼리 재작성 기능 어플리케이션의 투명성 【Client Application】 Interconnec t CPU CPU ... CPU 1 2 n Mem Mem Mem 1 2 ... n Locks Locks Locks Data Indexes Data Indexes Data Indexes Logs Logs Logs

12 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 병렬처리 프로세스 질의분배 MPP/클러스터 환경에서 사용자 어플리케이션 질의는 임의의 파티션에 연결된다. 이때 최초로 연결된 파티션을 ‘코디네이터’ 파티션이라고 하며, 코디네이터 파티션은 사용자의 질의를 받아서 다른 파티션으로 적절히 분배 분배받은 파티션들은 각각 독립적으로 병렬하게 작업을 수행하고 그 결과를 코디네이터 파티션으로 반환한다. 코디네이터 파티션은 그 결과를 취합하여 사용자에게 최종적으로 결과값을 반환 질의 코디네이터 파티션 결과 보고 질의결과 사용자 어플리케이션 파티션 2 분배 파티션 3 파티션 …

13 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 병렬처리 프로세스 질의병렬처리 Inter-Partition& Intra-Partition Parallelism DB2 EEE는 하나의 SQL문이 모든 파티션에서 동시에 수행되는 Inter-partition Parallelism을 지원한다. 또한 한 파티션 내에서는 SQL문을 세분하여 각각의 CPU들이 병렬로 작업을 할 수 있도록 하는 Intra-partition Parallelism을 함께 지원한다. 이러한 기능을 이용함으로써 DB2 EEE는 복잡한 SQL문을 보다 빠르게 처리할 수 있다. SELECT... FROM... SELECT... FROM... SELECT... FROM... Data Data 【Database Partition】 【Database Partition】

14 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 병렬처리 프로세스 질의병렬처리 Inter-Partition& Intra-Partition Parallelism DB2 EEE는 하나의 SQL문이 모든 파티션에서 동시에 수행되는 Inter-partition Parallelism을 지원한다. 또한 한 파티션 내에서는 SQL문을 세분하여 각각의 CPU들이 병렬로 작업을 할 수 있도록 하는 Intra-partition Parallelism을 함께 지원한다. 이러한 기능을 이용함으로써 DB2 EEE는 복잡한 SQL문을 보다 빠르게 처리할 수 있다. SELECT... FROM... SELECT... FROM... SELECT... FROM... Data Data 【Database Partition】 【Database Partition】

15 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 데이터 분배 및 적재 데이터 분배 -해싱(Hashing) DB2 UDB EEE는 모든 파티션에 데이터를 골고루 분배하기 위해서 해싱과 파티셔닝 맵을 사용한다. 우선 파티션 키로 사용될 컬럼을 테이블에 대해 지정한다. 새로운 레코드가 삽입될 때 파티션 키 컬럼 값을 해싱하고 여기에 파티션 맵을 적용하여 최종 파티션을 결정한다. 파티션 간에 데이터의 불균형이 발생하는 경우 파티션 맵을 조정함으로써 데이터를 균형 있게 재분배 할 수 있다. 주민등록번호 이 름 주 소 홍 길 동 디비투시 유디비동 이세개동 Partition Key value Hashed to: "8" 파티션닝 맵 Vector Position 1 2 3 4 5 6 7 8 9 10 11 12 ... 4094 4095 Node 1 2 3 1 2 3 4 2 3 1 2 4 1 ... 4 2 DB2 UDB EEE DB2 UDB EEE DB2 UDB EEE DB2 UDB EEE 파티션 1 파티션 2 파티션 3 파티션 …

16 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 데이터 분배 및 적재 데이터 적재도구 - AutoLoader 유틸리티 대량의 데이터를 다중 파티션 테이블에 로드 하는 경우 파티션 별로 데이터를 분할 (split)하고 테이블에 대한 로드까지 수행하는 Autoloader 라고 하는 유틸리티를 제공 한다. Autoloader 유틸리티는 입력 파일을 읽어 들인 후 목표 테이블의 파티션 키, 파티션 정보, 파티션 맵 등을 이용하여 각 파티션 별로 파일을 분할 한다. 이 분할된 파일을 다시 테이블에 로드 한다. 이렇게 함으로써 DB관리자는 대량의 데이터를 여러 개의 파티션에 보다 쉽고 빠르게 로드 할 수 있다. Autoloader S P L I T TCP/IP Load T1 partition 1 TCP/IP Load T1 partition 2 partitioning key partitions partitioning map TCP/IP Load T1 partition 3 Catalog TCP/IP Load T1 partition 4

17 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 데이터 재분배 데이터 재분배 도구- Redistribute 데이터가 계속 증가하여 기존 시스템 용량을 초과하게 되면 CPU나 메모리를 증설하여 시스템 용량을 늘릴 수 있다. 이 경우에 EEE는 추가된 Resoure를 최대 활용하기 위해 파티션을 추가하고 데이터를 재분배할 수 있도록 하는 Redistribute 유틸리티를 제공한다. 노드를 추가하고 데이터를 다시 분산시킴으로써 EEE는 매우 유연한 확장성을 제공한다. 재분배 유틸리티는 파티션이 추가된 경우 외에도 오랜 기간동안 데이터베이스를 운영하는 동안에 발생할 수 있는 데이터 스큐 (skew : 특정 파티션에 데이터가 몰리는 현상)를 해결하기 위한 용도로 사용될 수 있다. 데이터 스큐가 발생하면 특정 파티션에 병목현상이 생기게 되고 이는 성능 저하로 이어지게 된다. 재분배 유틸리티는 이러한 데이터 스큐를 해결하는데 사용된다. Ⅰ. 파티션 추가 > Alter nodegroup mygroup add nodes (4) Ⅱ. 추가된 파티션에 대한 재분배 > REDISTRIBUTE NODEGROUP mygroup UNIFORM

18 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 질의 최적화 비용기반 옵티마이저 사용자가 만든 질의를 최적화하여 최상의 수행속도를 보여 주기 위한 기법으로 비용기반(cost-based) 최적화 알고리즘을 장착 비용기반이라는 것은 질의를 수행하는데 있어, 최소한의 자원, 즉 CPU, 메모리, 디스크 I/O 등을 고려하여 사용자의 쿼리를 옵티마이저가 스스로 분석하여 최상의 수행속도를 보여준다. 필요에 따라서는 옵티마이저가 사용자 쿼리를 보다 효율적인 쿼리로 재작성하여 수행하기도 한다. 가용성 온라인 백업 및 복구 로그파일 이중화(dual Logging) 온라인 인덱스 재구성(Online Index Reorg) 재분배 유틸리티 시스템 장애 시 자동복구 기능 데이터베이스 파티션별 백업과 복구 디스크 장애 시 해당부분만 사용 불가능 다양한 백업 및 복구 기능 제공

19 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 질의 최적화 Visual Explain DB2 EEE 자체 제공되는 Visual Explain은 DB Optimizer의 선택과 경로 및 최적화 된 SQL을 사용자 및 관리자에게 GUI를 통해 제공함으로서, Problem SQL을 튜닝 할 수 있다.

20 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 AST와 RST 자동 요약테이블 (Automatic Summary Table) 자동요약 테이블은 자주 사용되면서 시간이 오래 걸리는 질의에 대해서 미리 실행하여 작성해 두는 요약 테이블이다. 사용자 조회 시 빠른 응답시간을 제공한다. 옵티마이저는 요청 들어온 질의에 대해 부합하는 AST가 있는지를 동적으로 확인하고, 존재하면 AST를 수행한다. Visual Explain 툴을 이용하여 새로 작성한 AST가 실제로 사용되었는지를 확인할 수 있다. 복제요약 테이블 (Replicated Summary Table) 특정 파티션에만 존재하는 테이블을 다른 파티션에 복제하여 놓는 것을 중복요약 테이블이라고 한다. 예를 들어, 코드성 테이블은 다른 큰 테이블들과 조인되는 경우가 많을 수 있는데, 파티션 간의 데이터 이동(I/O Shipping)이 생기게 되고 이는 수행속도 저하를 가져온다. 이럴 경우, RST 기능을 이용하여 이러한 테이블들을 여러 파티션에 복제해 놓으면 조인 수행 시 데이터의 이동 없이 자체 파티션 내에서 처리가 가능하게 되어 수행속도를 크게 향상시킬 수 있다. 이러한 조인을 ‘co_located 조인’이라고 한다. EEE노드 Primary Replicated Versions Co-located Join STORE_LOCATION

21 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 파티션간의 Fail-over IBM DB2는 각 파티션 노드간의 fail-over 기능을 지원한다. IBM RS/6000 시스템의 경우, HACMP라는 소프트웨어를 이용하여 각각 상대방의 시스템활동을 감시하고 있다가 시스템 장애가 감지되면 한 서버가 다른 서버의 워크로드를 이어받아 처리한다. Standby 방식을 사용하면 병렬 노드 중 한 노드가 백업으로 있다가 장애노드를 Take Over 하고, Mutual을 사용하면 각각의 노드가 각각의 업무를 운영하다가 장애발생 시 상대방이 장애노드의 업무까지를 함께 운영한다. 데이터베이스 측면에서는 SCSI가 Take Over되어 데이터베이스가 마치 Restart되는 것과 같은 상태로 사용자는 Commit을 수행한 상태로부터 다시 사용할 수 있다. 【 외장 디스크】 【어플리케이션】 Machine1 Partition1 Disk Machine2 Partition2 Disk Machine3 Partition3 Disk Machine4 Partition1 Disk Partition4

22 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 연동성 Host DB2와의 완벽한 연동성 IBM DB2는 Host DB 에서 부터 Unix, NT DBMS에 이르기까지 일관된 아키텍쳐로 구성되어, DB2 for OS/390, DB2 for AS/400과 같은 Host DB2가 DB2 for AIX, HP, Sun, NUMA-Q와 같은 제품들과 완벽하게 연동된다. DRDA 분산관계형 데이터 베이스 아키텍쳐 구현 고가의 호스트 구성요소나 전용 게이트웨이 없이 Host에 연계 DB2 Connect DB2 제품군사이의 분산 데이터 액세스를 지원하는 산업 표준 단일 DBMS 이미지 IBM DB2는 Relational Connect를 통해 타 이기종 DBMS와 연계하고, DB2 Connect를 통해 Host DB2와 연계함으로써, DBMS를 하나의 단일 DBMS로 운영관리 한다.

23 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 인덱스 스마트가이드 인덱스 스마트 가이드는 주어진 SQL 워크로드와 테이블 스키마 정보를 통해서 최적의 성능을 제공할 수 있는 인덱스를 정의해 주는 마법사 기능을 제공한다. DB 관리자로 하여금 최적의 인덱스 조건을 찾도록 도와 주며 성능 분석과 튜닝의 복잡성을 경감시킨다.

24 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 GUI 환경의 DBA 도구- 제어센터 DB2는 제어 센터를 통해 테이블 관리, 작성 뿐 아니라 모니터링 튜닝을 할 수 있을 뿐 아니라, Warehouse 관리, SAP 관리 등도 하나의 모니터링 화면을 통해 관리할 수 있다. 모든 물리/논리노드에 대한 Start/stop 테이블 관리 : 작성, Reorg, Runstats, Drop, Sample Query 성능 튜닝, 인덱스 튜닝 성능 모니터링, 복제관리, 트리거 작성 등 Application관리 : User agent리스트, Force, Package관리, UDF, UDT등록 및 삭제, 권한 grant/revoke, Job 스케쥴링, 저널관리

25 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 Common Client 아키텍처의 간소화 (DB2 버전8의 새로운 기능) 64비트 및 32비트를 모두 지원하는 Common Client 아키텍처의 간소화로 CLI 및 ODBC에 있어서 향상된 성능을 가져왔다. 이 아키텍처는 기존의 클라이언트/서버 아키텍처를 효율적이고 간소화된 DRDA 아키텍처로 통합하였고, 클라이언트에서도 코드 페이지 변환을 이루어지게 하여 서버의 부하를 분담할 수 있게 했다. 다수의 데이터베이스 연결 풀 사용시 메모리 사용을 50%로 감소시켰다. 또한 데이터 블록 내에서의 로컬 스크롤 커서를 지원하며 자세한 SQL 오류 정보 추출과 Kerboros및 Encrypted USERID/PASSWORD와 같은 DB2 인증을 위한 향상된 보안을 지원한다.

26 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 개발센터 (DB2 버전8의 새로운 기능) DB2 개발 센터를 이용하면 손쉽게 스토어드 프로시저(SP)나 UDF와 같은 서버 사이드 루틴을 프로젝트 기반으로 손쉽게 개발할 수 있다. 또한 DB2 개발 센터는 SP를 위한 SQL 디버거 기능을 지원하고 LOB, XML, Datalinks를 지원하는 구성 화면을 갖고 있으며, EJB 세션 빈(Session Bean)을 위한 SP 랩퍼 기능을 갖는다. 뿐만 아니라 MQ Series와 OLEDB TableUDF와 통합되어 있으며, 많이 사용하는 IDE(Microsoft Visual InterDev, Microsoft Visual Basic (6.0) Add-In, Microsoft Visual Studio.Net (7.0) Add-In, 및 IBM Eclipse Plug-In)와도 긴밀하게 통합되어 있다.

27 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 대용량 데이터 질의, 여러 테이블을 조인하는 복잡한 질의, 다수 사용자의 질의에도 빠른 응답속도를 지원할 수 있어야 한다. (DB2 버전8의 새로운 기능) DB2 UDB EEE는 대용량 DW환경에 적합한 DBMS이며, 1TB 이상의 DW를 운영하는 고객은 전세계적으로 130 곳 이상 Nested Loop Join, Merge Scan Join, Star Join, Hash join 등 다양한 조인 기법을 제공 노드간 병렬처리 뿐만 아니라, 업체 중 유일하게 노드내 병렬 처리도 지원함으로써 다수의 사용자 질의에도 최상의 처리속도를 보장 한다. 연결 집중화기는 보다 많은 애플리케이션을 처리하기 위해 애플리케이션당 메모리의 사용을 최소화했고, 최대 코디네이터 에이전트 (Coordinator agent) 수에 도달하더라도, 이로 인하여 애플리케이션의 처리가 취소되지 않도록 한다. (DB2 버전8의 새로운 기능) 각 파티션 노드에 캐시된 카탈로그 정보(예를 들면 권한, 테이블 구조 등)를 두어 성능향상을 꾀하였다. (DB2 버전8의 새로운 기능)

28 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 대용량 데이터 질의, 여러 테이블을 조인하는 복잡한 질의, 다수 사용자의 질의에도 빠른 응답속도를 지원할 수 있어야 한다. (DB2 버전8의 새로운 기능) 다차원 파티션 기법인 MDC (MultiDimensional Clustering)은 주로 데이터 웨어하우징 및 대용량 데이터베이스 환경을 위해 고안된 IBM 특허 기술이다. 이를 통해 탁월한 조회 성능 뿐만 아니라 Insert, Update, Delete 작업시 인덱스 유지보수 또는 재구성 (Reorganization)에 대한 오버헤드를 획기적으로 감소시켰다. (DB2 버전8의 새로운 기능)

29 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 DATABASE의 원활한 관리에 필요한 각종 유틸리티를 제안하고 각각에 대한 기능을 설명하여야 한다. (DB2 버전8의 새로운 기능) 그래픽 툴인 제어센터를 통해 손쉽고 통합적인 데이터베이스 관리가 가능하다. DB2 High Performance Unload for Multiplatforms 를 통한 기업체간 또는 부서간 데이터 이동을 위해 사용되며, 데이터를 빠르고 쉽게 Unload 한다. DB2 Performance Expert for Multiplatforms를 이용하여 DB2 성능과 관련된 정보의 통합, 레포팅 및 분석을 통해 SMART 변경을 추천한다. 헬스 모니터(Health Monitor) 및 헬스센터(Health Center)는 시스템의 성능에 영향을 미치는 실제 문제가 되기 이전에 잠재적인 시스템 헬스 이슈를 경고하는 것이다. 헬스 모니터는 서버측 툴로써 지속적으로 인스턴스의 상태를 모니터링한다. 사용자의 상호작용이 없다고 하더라도 지속적으로 모니터링 한다. (DB2 버전8의 새로운 기능)

30 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 DATABASE의 원활한 관리에 필요한 각종 유틸리티를 제안하고 각각에 대한 기능을 설명하여야 한다. (DB2 버전8의 새로운 기능) TYPE-2 인덱스 지원을 통해 잠금의 동시성 향상과 실제 인덱스 페이지에서 데이터를 지우지 않고 삭제될 부분만 표시하기 때문에 향상된 성능을 보장한다. 또한 255바이트 이상의 컬럼에 대한 인덱싱이 가능하다. (DB2 버전8의 새로운 기능) 온라인 재구성(Reorganization)은 테이블에 대한 읽고 쓰는 작업을 하는 동안 테이블에 대한 테이블에 대한 재구성 작업을 수행할 수 있음을 나타낸다. (DB2 버전8의 새로운 기능) 온라인 Inspect 툴을 통해 데이터베이스 관리자(DBA)가 시스템 운용 중에 DB2의 상태를 감시할 수 있다. DB2는 DB2DART툴을 이용하여 이터베이스 상태를 점검하거나 장애를 치료할 수 있다. (DB2 버전8의 새로운 기능) Null 및 디폴트 값에 대해 압축지원을 한다. (DB2 버전8의 새로운 기능) 256GB로 증가된 데이터베이스 로그 사이즈와 무제한 로깅 기능을 들 수 있다. (DB2 버전8의 새로운 기능)

31 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 모든 연산 등에서 병렬처리가 지원 DB2 UDB EEE는 MPP 환경의 DW 서버인 RS/6000 SP와 가장 잘 맞는 DBMS 이다. DB2 UDB EEE는 기본적으로 완벽한 병렬처리를 지원하며, 노드간 병렬처리 뿐만 아니라, 업체 중 유일하게 노드내 병렬 처리도 지원 한다. 운영계 시스템과 제안하는 각종 Tool (OLAP, Mining, ETCL 등)과 무리없이 연동 되어야 한다. DB2 for OS/390과 DB2 UDB EEE는 근본적으로 동일한 구조를 택하고 있어 호환성이 아주 우수 하며, 또한 개방형 구조를 채택하고 있어 가장 많은 Tool과 연동된다.

32 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 최소한의 튜닝과 관리로 높은 성능을 유지 DB2 UDB EEE는 다음과 같은 기능 제공으로 튜닝이 거의 필요 없는 높은 수행 환경을 보인다. RST(Replicated Summary Table) AST(Automatic Summary Table) Redistribute(자동 Skew 제거) Reconfiguration Index Smart Guide를 통한 자동으로 적절한 인덱스 생성 CPU 사용의 증감을 제어할 수 있는 트로틀(Trottle) 유틸리티를 제공한다. (DB2 버전8의 새로운 기능) 메모리 비쥬얼라이저(Memory Visualizer)를 제공한다. (DB2 버전8의 새로운 기능)

33 DB2 Clustering(DB2 EEE)의 기술자료 ………………………………………….
구분 내 용 제안하는 DBMS는 실 데이터 4TB 이상, 사용자 3,600명, 동시 사용자 200명 이상의 복잡한 질의를 무리 없이 지원할 수 있는 성능을 보장하여야 하며 유사한 DW구축사례를 제시하여야 한다. DB2 UDB EEE가 다룰 수 있는 DB 크기는 제한이 없으며, 도이치텔레콤의 경우 100TB 의 DW를 운영하고 있다. 국내에서는 TIMS에 제안하는 동일한 환경에서, 2TB DW를 운영하고 있다. 라)구축사례 참고 Engine Unlimited Users 8 node 이상 DB2 UDB EEE는 사용자수 제한이 없으며, 10 node를 제안 한다. Utility DW서버와 ETCL서버용의 load용 필요 시IBM Mainframe에 설치할 load용 기본적으로 제공하는 Autoloader는 대용량 데이터를 고속으로 적재하기 위한 도구이다. 기타 ODBC, JDBC 등 개발과 관리용 SW 필요한 Preprocessor (C, COBOL 등) 현재 TIS와 연동하여 사용중인 DB2 Connect를 이용한다. C, C++, COBOL 등을 제공 한다. ODBC,JDBC및 CLI 전용 카탈로그 뷰를 생성하여 조회성능을 향상시킨다. ODBC, JDBC 등에서 사용되는 동적 SQL을 자동으로 정적 SQL변환시키는 기능을 사용하여 조회성능을 향상시킨다.

34 …………………………………………. DB2 EEE의 Oracle RAC와 유사기능 (split mirror)
DB2 UDB의 OS RAID의 미러링 대신에 OS 차원의 빠른 복제를 수행하는 DB2 Split Mirror 기능과 HACMP를 접목하여 서버의 다운을 최소화하여 서버의 가용성을 극대화할 수 있다. DB 로그 복사 및 롤 포워드

35 DB2 EEE의 Oracle RAC와 유사기능 (CA, 연속 가용성-DB2 버전8의 새로운 기능)
…………………………………………. DB2 UDB의 OS RAID의 미러링 대신에 OS 차원의 빠른 복제를 수행하는 DB2 Split Mirror 기능과 CA(연속 가용성) 기능을 이용하면 HACMP없이 DB2 클라이언트가 서버의 가용성을 감지 하여 한 서버가 다운되면 DB2 클라이언트가 자동적으로 다른 서버로 연결하여 사용할 수 있 는 Zero-dowun time 환경을 지원한다. DB 로그 복사 및 롤 포워드

36 …………………………………………. DB2 EEE의 Oracle RAC와 비교 (Architecture)
클러스터를 통해 확장하는 데 사용되는 두 가지 주요 아키텍처인 비공유 및 공유 디스크 중에서 DB2는 업계에서 유일하게 이 두 가지 아키텍처를 모두 지원한다. 즉, z/OS 또는 OS/390용 DB2는 공유 디스크 아키텍처를 사용하고 있고, UNIX 및 Windows 플랫폼용 DB2 UDB는 비공유 디스크 아키텍처를 사용한다. 공유 디스크 아키텍처는 클러스터에 있는 모든 노드가 공유 디스크 서브 시스템에 대한 액세스를 공유해야 하기 때문에 한 노드가 다른 노드의 작업을 실행 취소할 수 없도록 전역 메모리 및 잠금 관리가 필요하다. z/OS 또는 OS/390용 DB2는 필요한 상호작용을 빠르고 효율적이며 확장 가능하도록 하드웨어 커플링 기능을 긴밀히 통합함으로써 구현 가능했다. 이처럼 특수한 하드웨어 기능을 사용해야 하기 때문에 저렴한 비용으로 구현할 수 있는 아키텍처는 아니다. 특수 하드웨어 기능이 없는 UNIX 및 Windows에서는 소프트웨어의 한계로 인해 낮은 성능을 나타내기 때문에, UNIX 및 Windows 플랫폼을 위해 Oracle을 제외한 모든 벤더들이 비공유 아키텍처를 채택해 왔다. 비공유 아키텍처를 사용하면 각 노드가 독립된 디스크, CPU 및 메모리 리소스에 대해 완벽한 소유권을 가지며, 이 모델에서 해결해야 하는 문제는 각 요청이 적절하게 분배되고 결과가 통합되었는지 확인하는 것이다. 이를 위해 DB2 UDB는 해시 기반 파티셔닝, 고급 조회 최적화 프로그램 기술 뿐만 아니라 VI 및 Infiniband와 같은 첨단 표준 연결 기술을 지원한다. 이러한 기술이 통합되어 있으므로 DB2는 원하는 하드웨어, 운영체제 또는 워크로드에서 확장이 가능한 것이다. DB2로 비공유(shared-nothing) 아키텍처를 구현하여 얻을 수 있는 또 다른 장점은 유연성이다. DB2가 이러한 성능을 달성하는 데는 어떤 독점 하드웨어 또는 소프트웨어도 필요하기 때문에, DB2는 가장 널리 사용되는 운영체제인 윈도우, 리눅스, AIX, Solaris 및 HP-UX에서 실행되는 산업 표준 Intel 및 RISC 플랫폼에 비공유의 무제한 확장성을 제공한다.

37 DB2 EEE의 Oracle RAC와 비교 (전체)
………………………………………….

38 …………………………………………. DB2 EEE의 Oracle RAC와 비교 (Optimizer) 1. Query 최적화 지원
비교 항목 DB2 EEE 버전 7.2 Oracle RAC 9i 비용 기반 최적화 최초 적용 시기 1970 년대 부터 사용 ( Query Rewrite 기능은 1990년 부터 적용되기 시작 ) 2001년 부터 적용 시작 (기존에는 Rule 기반 최적화를 사용하여 사용자의 성능 튜닝 교육을 통한 hint에 의한 이 필수적이었고, 동일한 플랜에 대한 제거 지원 모든 플랜에 대한 소모적인 목록 비지원 Bushy Tree (복합 내부 조인)의 사용 Cartesian product의 회피 다수 테이블에 대한 핸들링 알고리즘

39 …………………………………………. DB2 EEE의 Oracle RAC와 비교 (Optimizer)
1. Query 최적화 지원 (계속) 비교 항목 DB2 EEE 버전 7.2 Oracle RAC 9i DBA에게 hint 사용 능력 요구 불필요 필요 참조 제한조건에 대한 최적화 지원 비지원 스타 스키마 최적화 액세스 경로을 생성하는 개개의 rule을 적용/비적용 가능 Converts dynamic SQL to static SQL Bitmap Indexing 제한적으로 지원 (비효율적인 Static bitmap indexing을 지원) CPU 속도와 Disk 전송률을 최적화에 고려

40 …………………………………………. DB2 EEE의 Oracle RAC와 비교 (Optimizer)
2. 비즈니스 로직을 최적화와 통합 비교 항목 DB2 EEE 버전 7.2 Oracle RAC 9i 사용자 조회와 함께 컨스트레인트를 최적화 지원 비지원 사용자 조회와 함께 트리거를 최적화

41 …………………………………………. DB2 EEE의 Oracle RAC와 비교 (Optimizer) 3. 조회 재작성 비교 항목
3. 조회 재작성 비교 항목 DB2 EEE 버전 7.2 Oracle RAC 9i 서브 쿼리를 조인으로 변환 지원 비지원 외부 조인을 내부 조인으로 전환 내부 및 외부 조인의 재정렬 조건에 맞는 레코드를 필터링하기 위해 Predicate push down 사용 사용자 조회와 트리거의 최적화

42 …………………………………………. DB2 EEE의 Oracle RAC와 비교 (확장성) 비교 항목 DB2 EEE 버전 7.2
Oracle RAC 9i 아키텍처 Shared Nothing Shared Disk 노드간의 잠금 관리에 의한 병목현상 발생하지 않는다 발생할 가능성이 높다. SMP 지원 MPP 부분적 지원 (Cache Fusion을 이용) 자동 데이터 재분배 비지원 병렬 백업 테이블, 인덱스 스캔의 병렬성

43 …………………………………………. DB2 EEE의 Oracle RAC와 비교 (가용성) 비교 항목 DB2 EEE 버전 7.2
Oracle RAC 9i 신속한 백업과 복구 기능 지원 Fast database restart Online/offline backup Incremental Backup Online maintenance utilities (organizing, create objects, etc) 클러스터 환경에서 미러링된 디스크를 다른 노드에서 사용할 수 있는 기능

44 …………………………………………. DB2 EEE의 Oracle RAC와 비교 (관리성) 비교 항목 DB2 EEE 버전 7.2
Oracle RAC 9i Central graphical console Control Center Oracle Enterprise Manager (OEM) Performance Configuration SMART Guide 지원 비지원 Index advisor (Performance를 높이기 위한 인덱스를 찾을 수 있다) Visual explain tool (액세스 경로 탐색) Automatic index balancing Dynamic Memory Management Reorganizing physical data (3rd party 제품을 사용하면 가능 )

45 …………………………………………. DB2 EEE의 Oracle RAC와 비교 (접속성) 비교 항목 DB2 EEE 버전 7.2
Oracle RAC 9i DRDA (Distributed Relational Database Access) 지원 부분 지원 Ability to optimize queries from foreign DBMS (이기종 DBMS 질의 최적화 기능) 비지원 Life science data connect OLE DB DB2/390, DB2/400 access VSAM, IMS access

46 …………………………………………. DB2 EEE의 Oracle RAC와 비교 (DB2 성능의 선형성 특징) 성능자료
지난(2001년) 4월에 미국의 Teraplex Center에서 확장성 테스트 결과, 데이터와 하드웨어 자원을 2배로 증가시킬 때, 약 100%의 확장성을 보여 주고 있다. 즉 데이터가 2 배 증가하고 시스템 자원 역시 2배로 증가되었을 때 거의 동일하거나, 더 빠른 수행 성능을 보여 주었다. 데이터베이스 작성 : 101%확장율 단일 사용자 조회 : 96.8%확장율 시간 (분) 200 400 600 AST Reorg Runstat Index Load 500GB 1 TB 조회 유형 500 1000 1500 시간 (초) 500GB 1 TB 데이터 추가 및 삭제 다중 사용자 조회 [ 500GB →1TB ] 12 동시 사용자 : % 128 동시 사용자 : % 256 동시 사용자 : %

47 DB2 EEE의 Oracle RAC와 비교 (정규화에 대한 특징)
………………………………………….

48 DB2 EEE의 HACMP 구성 ………………………………………….
1. DB2 EEE의 HACMP에서 표준 이벤트 중 하는 node_down 이벤트이다. 복구 프로세스의 일부가 되는 작업을 계획할 때 HACMP에서는 두 가지 실패복구 옵션을 제공한다. 하나는 긴급(또는 유휴) 대기이고 다른 하나는 상호 인계이다. 2. DB2 Universal Database Enterprise - Extended Edition(UDB EEE)은 노드마다 파티션이 있는 상호 인계 모드에서 수행된다. 다만 카탈로그 노드가 긴급 대기 구성의 일부인 시나리오는 예외인 경우이다. 여기서 카탈로그 노드는 DB2 데이터베이스 엔진이 위치한 NFS 마운트된 노드를 일컫는다.

49 DB2 EEE의 HACMP 구성 …………………………………………. NFS 실패복구가 있는 상호 인계 (정상 상태)
(상호 인계) NFS 노드 실패복구 (긴급 대기)

50 DB2 EEE의 HACMP 구성 …………………………………………. NFS 실패복구가 있는 긴급 대기 (정상 상태)
(긴급 대기) NFS 노드 실패복구 (긴급 대기)

51 DB2 EEE의 HACMP 구성 …………………………………………. NFS 실패복구가 있는 상호 인계 (정상 상태)
(상호 인계)

52 …………………………………………. DB2 PE/WE/EE에서 DB2 EEE로의 Migration시 고려사항
DB2 UDB 버전 8에서는 DB2 EE와 DB2 EEE가 하나의 제품인 DB2 ESE로 통합되기 때문에 DB2 버전7을 DB2 버전8으로 업그레이드 한다면 이 문제에 대한 접근이 이전 버전보다 쉬워진다. DB2 UDB ESE 버전8에서는 Partition Key보다는 다차원 파티션 기법(MDC, Multi-Dimensional Clustering)이라는 IBM 특허 기술을 이용하기 때문에 데이터에 대한 향상된 성능 및 유지보수를 할 수 있다. ………………………………………….

53 …………………………………………. DB2 PE/WE/EE에서 DB2 EEE로의 Migration시 고려사항
DB2 UDB EEE 버전7에서는 DB2 EE에서는 정의하지 않은 Partition Key를 정의하여 이 키값을 기준으로 하여 데이터베이스 파티션에 데이터를 분배해야 한다. 이러한 적절한 Partition Key의 선정은 필수적이다. 사용자 응용 프로그램 레벨에서의 차이점은 없다. 실제로 데이터가 파티션에 분배되어 있지만 최종 사용자는 단지 하나의 테이블처럼 핸들링 할 수 있다. 성능 향상을 위해 For Read Only 커서 사용, 방향이 지정된 분산 하위 섹션(DSS)의 사용 및 로컬 바이패스의 사용 등을 들 수 있으나 필수 사항이 아닌 옵션 사항일 뿐이다. 즉, For Read Only 커서 사용함으로써 DB2 옵티마이저가 갱신가능한 커서로 인식하지 않도록 해야 한다. 갱신 가능한 커서는 조정자 파티션이 FETCH 한 번에 한 행만을 검색하도록 하기 때문에 비용 소모가 크기 떄문이다.

54 …………………………………………. DB2 PE/WE/EE에서 DB2 EEE로의 Migration시 고려사항
또한 방향이 지정된 분산 하위 섹션(DSS)을 사용하는 경우에는 조회를 단일 파티션으로 지정하기 위해 테이블 파티션 키를 사용해야 한다. 이는 사용자 응용 프로그램에서 이러한 유형의 조회를 사용하여 모든 노드로 조회 브로드캐스트를 하는 데 필요한 조정자 파티션의 오버헤드를 피할 수 있다. 그 SQL의 예는 다음과 같다. SELECT ... FROM t1 WHERE PARTKEY=:hostvar 마지막으로 로컬 바이패스의 사용함으로써 조정자 파티션이 다른 파티션과 통신할 필요가 없이 조회를 완료할 수 있다. 이는 해당 트랜잭션에 대한 데이터가 들어 있는 파티션으로 트랜잭션을 라우팅함으로써 그 사용을 증가시킬 수 있다. 이를 수행하는 한 가지 기법은 원격 클라이언트가 각 파티션으로의 연결을 유지보수하도록 하는 것이다. 따라서 트랜잭션은 입력 파티션 키에 근거하여 올바른 연결을 사용할 수 있다. 또 다른 기법은 파티션별로 트랜잭션을 그룹화하고, 각 파티션에 별도의 응용프로그램 서버를 두는 것이다.


Download ppt "Data Management Software"

Similar presentations


Ads by Google