6장. 물리적 데이터베이스 설계 물리적 데이터베이스 설계

Slides:



Advertisements
Similar presentations
1 SQL 정보보호학과 양 계 탁. 2 SQL 개요 SQL 개요 3 Database u 연관된 데이터들의 집합 u 데이터를 쉽게 관리하는 프로그램 종 류종 류 관계형 데이터베이스 객체지향형 데이터베이스 계층형 데이터베이스 네트워크 데이터베이스 데이터를 2 차원적인 테.
Advertisements

SQLite 소개 및 안드로이드에서의 사용법
강사: 이종인 다우 교육원 전임강사 / 온디멘드 수석 컨설턴트 / FMG 수석 컨설턴트
데이터베이스 9주차 : 데이터베이스 설계 2교시 : 데이터베이스 설계(3)
Allow reverse scans allow reverse scnas. allow reverse scans allow reverse scnas.
19.(코드+년도+월)별,(코드)별,전체총액을 한번에
소리가 작으면 이어폰 사용 권장!.
데이터 모델링 방법론 2003년 03월.
IT Application Development Dept. Financial Team May 24, 2005
데이터베이스 시스템.
질의어와 SQL 기본 SQL 고급 SQL 데이타의 수정 데이타 정의 언어 내장 SQL
관계 대수와 SQL.
오라클 데이터베이스 성능 튜닝.
Chapter 5 SQL: 확장된 질의, 주장, 트리거, 뷰.
제 5 장 인덱스 생성 및 관리.
4장. 관계 대수와 SQL SQL 관계 데이터 모델에서 지원되는 두 가지 정형적인 언어
SQL-99: 스키마 정의, 기본제약조건, 질의어 충북대학교 구조시스템공학과 시스템공학연구실
SQL 개요 SQL 개요 - SQL은 현재 DBMS 시장에서 관계 DBMS가 압도적인 우위를 차지하는 데 중요한 요인의 하나
10장. 데이터베이스 보안과 권한 관리 데이터베이스 보안과 권한 관리
데이터베이스 담당교수 신정식 Chapter 4 SQL(1).
Information Technology
Toad for Oracle 설치 방법.
12. 데이터베이스 설계.
데이터베이스 와 JDBC 1.데이터베이스와 데이터베이스 관리 시스템은? 2.데이터베이스 장점?
데이터 베이스 란? 데이터 베이스 기능 데이터 베이스 관리 시스템 정보시스템의 구성 관게형 데이터 베이스
관계 데이터 모델과 제약조건 개념, 특성, 키, 무결성 제약조건.
11장. 데이터베이스 서버 구축과 운영.
제 8장. 멀티미디어 데이터베이스 및 정보검색 시스템
오라클 데이터베이스 성능 튜닝.
kHS 데이터베이스 테이블 및 인덱스 kHS.
6장. 기 억 장 치 Lecture #6.
On the computation of multidimensional Aggregates
MySQL 기본 사용법.
4.2 SQL 개요 SQL 개요 SQL은 IBM 연구소에서 1974년에 System R이라는 관계 DBMS 시제품을 연구할 때 관계 대수와 관계 해석을 기반으로, 집단 함수, 그룹화, 갱신 연산 등을 추가하여 개발된 언어 1986년에 ANSI(미국 표준 기구)에서 SQL.
차례 튜닝 - 프로필러를 이용한 튜닝 프로필러 친해지기 프로필러 결과 테이블로 만들기 프로필러 결과 분석하기
2장. 관계 데이터 모델과 제약조건 관계 데이터 모델은 지금까지 제안된 데이터 모델들 중에서 가장 개념이 단순한 데이터 모델의 하나 IBM 연구소에 근무하던 E.F. Codd가 1970년에 관계 데이터 모델을 제안함 관계 데이터 모델을 최초로 구현한 가장 중요한 관계 DBMS.
소프트웨어시스템 실험 Software Systems Lab. 데이터베이스 기초
Chapter 16 데이터베이스 파일 인덱싱 기법, B-트리 및 B+-트리
1장. 데이터베이스 시스템 컴퓨터를 사용하여 정보를 수집하고 분석하는데 데이터베이스 기술이 활용되고 있음
16장. 테이블의 변경 새로운 행 삽입 테이블에서 테이블로 행을 복사 행 값의 변경 테이블에서 행 삭제
SQL.
파일 시스템 인터페이스(File System Interface)
01 데이터베이스 개론 데이터베이스의 등장 배경 데이터베이스의 발전 과정 데이터베이스의 정의 데이터베이스의 특징
Computer System Architecture
강사: 이종인 다우 교육원 전임강사 / 온디멘드 수석 컨설턴트 / FMG 수석 컨설턴트
SQL Server 7.0 세미나 (Performance Tuning)
SQL (structured query language)
Chapter 3: Introduction to SQL
CHAPTER 06. 데이터베이스 자료의 조직적 집합체_데이터베이스 시스템의 이해
정보처리기사 8조 신원철 양진원 유민호 이기목 김다연 윤현경 임수빈 조현진.
JSP 게시판 구현.
View(뷰) 1 가상 테이블(Virtual Relation)
2장. 관계 데이터 모델과 제약조건 관계 데이터 모델은 지금까지 제안된 데이터 모델들 중에서 가장 개념이 단순한 데이터 모델의 하나 IBM 연구소에 근무하던 E.F. Codd가 1970년에 관계 데이터 모델을 제안함 관계 데이터 모델을 최초로 구현한 가장 중요한 관계 DBMS.
데이터베이스 (Database) SQL 추가 기능: 주장, 뷰, 프로그래밍 기법 문양세 강원대학교 IT대학 컴퓨터과학전공.
Database 중고차 매매 DB 비즈니스IT 윤동섭.
제15강 기억장치 3.
기본적인 SELECT문 작성.
Chapter 12 Memory Organization
시스템 분석 및 설계 글로컬 IT 학과 김정기.
MS-SQL7.0 Implementation 강의 노트
06. SQL 명지대학교 ICT 융합대학 김정호.
CHAPTER 04 파일 설계(FiLE Design).
How I Approach Tuning a SQL Statement
1. 관계 데이터 모델 (1) 관계 데이터 모델 정의 ① 논리적인 데이터 모델에서 데이터간의 관계를 기본키(primary key) 와 이를 참조하는 외래키(foreign key)로 표현하는 데이터 모델 ② 개체 집합에 대한 속성 관계를 표현하기 위해 개체를 테이블(table)
뇌를 자극하는 Windows Server 장. 데이터베이스 서버.
데이터 베이스의 내부 구조.
Stored program 장종원
I/O Management and Disk Scheduling
제 5 장 MariaDB인덱스 생성 및 관리.
가상 기억장치 (Virtual Memory)
Presentation transcript:

6장. 물리적 데이터베이스 설계 물리적 데이터베이스 설계 물리적인 설계 단계에서는 논리적인 설계의 데이터 구조를 보조 기억 장치상의 화일(물리적인 데이터 모델)로 사상함 예상 빈도를 포함하여 데이터베이스 질의와 트랜잭션들을 분석함 데이터에 대한 효율적인 접근을 제공하기 위하여 저장 구조와 접근 방법들을 다룸 특정 DBMS의 특성을 고려하여 진행됨 질의를 효율적으로 지원하기 위해서 인덱스 구조를 적절히 사용함 6장. 물리적 데이터베이스 설계

6.1 보조 기억 장치 보조 기억 장치 자기 디스크 각 화일은 고정된 크기의 블록들로 나누어져서 저장됨 사용자가 원하는 데이터를 검색하기 위해서 DBMS는 디스크 상의 데이터베이스로부터 사용자가 원하는 데이터를 포함하고 있는 블록을 읽어서 주기억 장치로 가져옴 블록 크기는 512바이트부터 수 킬로바이트까지 다양하나 전형적인 블록 크기는 4,096바이트 데이터가 변경된 경우에는 블록들을 디스크에 다시 기록함 자기 디스크 디스크는 자기 물질로 만들어진 여러 개의 판으로 이루어짐 각 판은 트랙과 섹터로 구분됨 각 면마다 디스크 헤드가 있음 정보는 디스크 표면 상의 동심원(트랙)을 따라 저장됨 6장. 물리적 데이터베이스 설계

6.1 보조 기억 장치(계속) 자기 디스크(계속) 여러 개의 디스크 면 중에서 같은 지름을 갖는 트랙들을 실린더라고 부름 블록은 한 개 이상의 섹터들로 이루어짐 디스크에서 임의의 블록을 읽어오거나 기록하는데 걸리는 시간은 탐구 시간(seek time), 회전 지연 시간(rotational delay), 전송 시간(transfer time)의 합 DBMS의 성능은 주로 디스크 입출력 연산의 횟수에 좌우됨 6장. 물리적 데이터베이스 설계

6.2 버퍼 관리와 운영 체제 버퍼 관리와 운영 체제 디스크 입출력은 컴퓨터 시스템에서 가장 속도가 느린 작업이므로 입출력 횟수를 줄이는 것이 DBMS의 성능을 향상하는데 매우 중요 가능하면 많은 블록들을 주기억 장치에 유지하거나 자주 참조되는 블록들을 주기억 장치에 유지하면 블록 전송 횟수를 줄일 수 있음 버퍼는 디스크 블록들을 저장하는데 사용되는 주기억 장치 공간 버퍼 관리자는 운영 체제의 구성요소로서 주기억 장치 내에서 버퍼 공간을 할당하고 관리하는 일을 맡음 6장. 물리적 데이터베이스 설계

6.2 버퍼 관리와 운영 체제 Programs call on the buffer manager when they need a block from disk. If the block is already in the buffer, buffer manager returns the address of the block in main memory If the block is not in the buffer, the buffer manager Allocates space in the buffer for the block Replacing (throwing out) some other block, if required, to make space for the new block. Replaced block written back to disk only if it was modified since the most recent time that it was written to/fetched from the disk. Reads the block from the disk to the buffer, and returns the address of the block in main memory to requester. 6장. 물리적 데이터베이스 설계

6.2 버퍼 관리와 운영 체제 한정된 버퍼 공간에 어느 블록들을 주기억 장치에 유지할 것인가? 운영 체제에서 버퍼 관리를 위해 흔히 사용되는 LRU(Least Recently Used) 알고리즘은 데이터베이스를 위해 항상 우수한 성능을 보이지는 않음 Queries have well-defined access patterns (such as sequential scans), and a DB system can use the information in a user’s query to predict future references LRU can be a bad strategy for certain access patterns involving repeated scans of data E.g., when computing the join of 2 relations R and S by a nested loops for each tuple tr of R do for each tuple ts of S do if the tuples tr and ts match … Mixed strategy with hints on replacement strategy provided by the query optimizer is preferable 6장. 물리적 데이터베이스 설계

6.3 디스크 상에서 화일의 레코드 배치 디스크 상에서 화일의 레코드 배치 릴레이션의 attribute는 고정 길이 또는 가변 길이의 필드로 표현됨 연관된 필드들이 모여서 고정 길이 또는 가변 길이의 레코드(= 투플)가 됨 한 릴레이션을 구성하는 레코드들의 모임이 화일이라고 부르는 블록들의 모임에 저장됨 6장. 물리적 데이터베이스 설계

6.3 디스크 상에서 화일의 레코드 배치(계속) 디스크 상에서 화일의 레코드 배치(계속) 한 화일에 속하는 블록들이 반드시 인접해 있을 필요는 없음 인접한 블록들을 읽는 경우에는 탐구 시간과 회전 지연 시간이 들지 않기 때문에 입출력 속도가 빠르므로 블록들이 인접하도록 한 화일의 블록들을 재조직할 수 있음 6장. 물리적 데이터베이스 설계

6.3 디스크 상에서 화일의 레코드 배치(계속) BLOB(Binary Large Object) 이미지(GIF, JPG), 동영상(MPEG, RM) 등 대규모 크기의 데이터를 저장하는데 사용됨 BLOB의 최대 크기는 MS SQL Server에서 2GB까지도 가능 채우기 인수 각 블록에 레코드를 채우는 공간의 비율 한 블록에 빈 공간을 남겨두는 이유는 나중에 레코드가 삽입될 때 기존의 레코드들을 이동하는 가능성을 줄이기 위해서 블로킹 인수(blocking factor) 한 블록에 포함되는 레코드 수 6장. 물리적 데이터베이스 설계

6.3 디스크 상에서 화일의 레코드 배치(계속) 고정 길이 레코드 레코드 i를 접근하기 위해서는 n*(i-1)+1의 위치에서 레코드를 읽음 6장. 물리적 데이터베이스 설계

6.3 디스크 상에서 화일의 레코드 배치(계속) 고정 길이 레코드(계속) 가변 길이 레코드 특정 레코드의 접근이 어려워짐 한 가지 구현 방법은 각 레코드의 끝을 나타내는 특별한 문자를 사용 레코드 삭제 후 그 공간에 길이가 더 긴 레코드를 삽입할려면 레코드들의 위치를 옮겨서 필요한 공간을 만들어야 함 6장. 물리적 데이터베이스 설계

6.3 디스크 상에서 화일의 레코드 배치(계속) 화일 내의 클러스터링(intra-file clustering) 한 화일 내에서 함께 검색될 가능성이 높은 레코드들을 디스크 상에서 물리적으로 가까운 곳에 모아두는 것 6장. 물리적 데이터베이스 설계

6.3 디스크 상에서 화일의 레코드 배치(계속) 화일 간의 클러스터링(inter-file clustering) 논리적으로 연관되어 함께 검색될 가능성이 높은 두 개 이상의 화일에 속한 레코드들을 디스크 상에서 물리적으로 가까운 곳에 저장하는 것 공통된 attribute를 사용해 빈번하게 조인이 수행되는 화일들에 대해서 사용 화일 전체를 탐색하는 연산, 레코드를 삽입하는 연산, 조인 attribute를 수정하는 연산의 속도는 저하시킬 수 있음 6장. 물리적 데이터베이스 설계

6.4 화일 조직 화일 조직은 화일내의 데이터를 보조기억 장치에서 블록과 레코드들로 배치하는 것 화일 조직의 유형 히프 화일(heap file), 순차 화일(sequential file) 인덱스된 순차 화일(indexed sequential file) , 직접 화일(hash file) 히프 파일(비순서 화일) 히프 화일은 가장 단순한 화일 조직 일반적으로 레코드들이 삽입된 순서대로 화일에 저장됨 새로 삽입되는 레코드는 화일의 가장 끝에 첨부되나, 화일 중간에 빈 공간이 있으면 거기에 삽입할 수도 있음 원하는 레코드를 찾기 위해서는 모든 레코드들을 순차적으로 접근해야 함 삭제는 원하는 레코드를 찾은 후에 그 레코드를 삭제하고, 삭제된 레코드가 차지하던 공간을 재사용하지 않음 좋은 성능을 유지하기 위해서 히프 화일을 주기적으로 재조직할 필요가 있음 릴레이션에 데이터를 한 꺼번에 적재할 때(bulk loading), 릴레이션에 단지 몇 개의 블록들만 있을 때, 모든 투플이 검색 위주로 사용될 때 6장. 물리적 데이터베이스 설계

6.4 화일 조직(계속) 6장. 물리적 데이터베이스 설계

6.4 화일 조직(계속) 히프 화일의 성능 FROM EMPLOYEE; FROM EMPLOYEE 히프 화일은 질의에서 모든 레코드들을 참조하고 레코드들을 접근하는 순서는 중요하지 않을 때 SELECT * FROM EMPLOYEE; 특정 레코드를 검색하는 경우에는 히프 화일이 비효율적 히프 화일에 b개 블록이 있다고 가정하자. 원하는 블록을 찾기 위해서 평균적으로 b/2개의 블록을 읽어야 함 SELECT TITLE FROM EMPLOYEE WHERE EMPNO = 1365; 몇 개의 레코드들을 검색하는 경우에도 비효율적 조건에 맞는 레코드를 이미 한 개 이상 검색했더라도 화일의 마지막 블록까지 읽어서 원하는 레코드가 존재하는가를 확인해야 하기 때문에 b개의 블록을 모두 읽어야 함 SELECT EMPNAME, TITLE WHERE DNO = 2; 급여의 범위를 만족하는 레코드들을 모두 검색하는 아래의 질의도 EMPLOYEE 릴레이션의 모든 레코드들을 접근해야 함 WHERE SALARY>= 3000000 AND SALARY <= 4000000; 6장. 물리적 데이터베이스 설계

6.4 화일 조직(계속) 6장. 물리적 데이터베이스 설계

6.4 화일 조직(계속) 순차 화일 순차 화일은 레코드들이 하나 이상의 필드 값에 따라 순서대로 저장된 화일 레코드들이 일반적으로 레코드의 탐색 키(search key) 값의 순서에 따라 저장됨 탐색 키는 순차 화일을 정렬하는데 사용되는 필드를 의미 탐색 키: 파일 내의 레코드들을 참조하는데 사용되는 속성(들) 삽입 연산은 삽입하려는 레코드의 순서를 고려해야 하기 때문에 시간이 많이 걸릴 수 있음 레코드를 삭제하는 연산은 삭제된 레코드가 사용하던 공간을 빈 공간으로 남기기 때문에 히프 화일의 경우와 마찬가지로 주기적으로 순차 화일을 재조직해야 함 순차 파일은 레코드들을 순차 접근하는 응용에 적합 기본 인덱스가 순차 화일에 정의되지 않는 한 순차 화일은 데이터베이스 응용을 위해 거의 사용되지 않음 6장. 물리적 데이터베이스 설계

6.4 화일 조직(계속) 6장. 물리적 데이터베이스 설계

6.4 화일 조직(계속) 순차 화일의 성능 FROM EMPLOYEE WHERE EMPNO = 1365; EMPLOYEE 화일이 EMPNO의 순서대로 저장되어 있을 때 첫 번째 SELECT문은 이진 탐색을 이용할 수 있고, SELECT TITLE FROM EMPLOYEE WHERE EMPNO = 1365; 두 번째 SELECT문의 WHERE절에 사용된 SALARY는 저장 순서와 무관하기 때문에 화일 전체를 탐색해야 함 SELECT EMPNAME, TITLE WHERE SALARY >= 3000000 AND SALARY <= 4000000; 6장. 물리적 데이터베이스 설계

6.4 화일 조직(계속) 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스 단일 단계 인덱스 인덱스된 순차 화일은 인덱스를 통해서 임의의 레코드를 접근할 수 있는 화일 단일 단계 인덱스의 각 엔트리는 <탐색 키, 레코드에 대한 포인터> 인덱스 엔트리들은 탐색 키 값의 오름차순으로 정렬됨 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) 단일 단계 인덱스(계속) 인덱스는 데이터 화일과는 별도의 화일에 저장됨 인덱스의 크기는 데이터 화일의 크기에 비해 훨씬 작음 하나의 화일에 여러 개의 인덱스들을 정의할 수 있음 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) 단일 단계 인덱스(계속) 인덱스가 정의된 필드를 탐색 키라고 부름 탐색 키의 값들은 후보 키처럼 각 투플마다 반드시 고유하지는 않음 키를 구성하는 attribute뿐만 아니라 어떤 attribute도 탐색 키로 사용될 수 있음 인덱스의 엔트리들은 탐색 키 값의 오름차순으로 저장되어 있으므로 이진 탐색을 이용할 수도 있음 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) 기본 인덱스(primary index) 기본 인덱스는 기본 키의 값에 따라 정렬된 데이터 화일에 대해 정의됨 기본 인덱스는 흔히 희소 인덱스로 유지할 수 있음 희소 인덱스는 데이터 화일을 구성하는 각 블록마다 하나의 탐색 키 값이 인덱스 엔트리에 포함된다. 즉, 일부 탐색 키 값에 대해서만 인덱스에 엔트리로 유지 각 릴레이션마다 최대 한 개의 기본 인덱스를 가질 수 있음 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) 클러스터링 인덱스(clustering index) 키가 아닌 어떤 특정 필드 값에 따라 정렬된 데이터 화일에 대해 정의됨 클러스터링 attribute 각각의 상이한 키 값마다 하나의 인덱스 엔트리가 인덱스에 포함됨 범위 질의에 유용: 범위의 시작 값에 해당하는 인덱스 엔트리를 먼저 찾고, 범위에 속하는 인덱스 엔트리들을 따라가면서 레코드들을 검색할 때, 레코드들은 대부분 같거나 인근 블록에 있으므로 디스크에서 읽어오는 블록 수가 최소화됨 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) EMPLOYEE 화일의 EMPNAME attribute에 대한 클러스터링 인덱스 인덱스 엔트리들이 인접해 있을 때 관련 레코드들은 같거나 인접한 데이터 블록들에 있으므로 디스크 접근을 줄임 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) 비 클러스터링 인덱스에서는 데이터 화일의 레코드들이 탐색 키의 값과 무관하게 저장 인덱스 엔트리들이 인접해 있어도 관련 레코드들을 대부분 멀리 떨어져 있음 EMPNAME에 대한 어떤 범위를 만족하는 레코드들 검색할 때 비효율적 범위를 만족하는 첫 레코드를 인덱스 엔트리에서 찾은 후에, 범위 내의 인덱스 엔트리들을 차례대로 읽으면서 데이터 레코드를 검색할 때마다 매번 디스크 블록을 접근할 가능성 많음 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) 보조 인덱스(secondary index) 한 화일은 기껏해야 한 가지 필드들의 조합에 대해서만 정렬될 수 있음 보조 인덱스는 탐색 키 값에 따라 정렬되지 않은 데이터 화일에 대해 정의됨 보조 인덱스는 일반적으로 밀집 인덱스이므로 같은 수의 레코드들을 접근할 때 보조 인덱스를 통하면 기본 인덱스를 통하는 경우보다 디스크 접근 횟수가 증가할 수 있음 기본 인덱스를 사용한 순차 접근은 효율적이지만 보조 인덱스를 사용한 순차 접근은 비효율적 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) 클러스터링 인덱스와 보조 인덱스의 비교 클러스터링 인덱스는 키가 아닌 필드 값에 따라 정렬된 데이터 화일에 대해 정의되는 반면 보조 인덱스는 정렬되지 않은 데이터 화일에 대해 정의됨 클러스터링 인덱스는 희소 인덱스일 경우가 많으며 범위 질의 등에 좋음 클러스터링 인덱스를 정의할 때는 채우기 인수에 낮은 값을 지정하여 추가로 삽입되는 레코드들에 대비하는 것이 바람직 보조 인덱스는 밀집 인덱스이므로 일부 질의에 대해서는 화일을 접근할 필요 없이 처리할 수 있음 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) 희소 인덱스(sparse index) 일부 키 값에 대해서만 인덱스에 엔트리를 유지하는 인덱스 일반적으로 각 블록마다 한 개의 탐색 키 값이 인덱스 엔트리에 포함됨 밀집 인덱스(dense index) 각 레코드의 키 값에 대해서 인덱스에 엔트리를 유지하는 인덱스 데이터 화일의 각 레코드의 탐색 키 값이 인덱스 엔트리에 포함됨 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) 희소 인덱스와 밀집 인덱스의 비교 희소 인덱스는 각 데이터 블록마다 한 개의 엔트리를 갖고, 밀집 인덱스는 각 레코드마다 한 개의 엔트리를 가짐 밀집 인덱스 내의 엔트리 수는 희소 인덱스 내의 엔트리 수에 블록당 평균 레코드 수를 곱한 것 레코드의 길이가 블록 크기보다 훨씬 작은 일반적인 경우에는 희소 인덱스의 엔트리 수가 밀집 인덱스의 엔트리 수보다 훨씬 적음 희소 인덱스로 키 값이 K인 레코드를 찾는 방법 이진 탐색으로 인덱스에서 K와 같거나 작으면서 가장 큰 엔트리 i 찾음 엔트리 i의 포인터를 따라 데이터 블럭을 접근해 탐색 키 값이 K인 레코드 찾음 희소 인덱스는 밀집 인덱스에 비해 모든 갱신과 대부분의 질의에 대해 더 효율적 6장. 물리적 데이터베이스 설계

6.5 단일 단계 인덱스(계속) 희소 인덱스와 밀집 인덱스의 비교(계속) 그러나 질의에서 인덱스가 정의된 attribute만 검색(예를 들어, COUNT 질의)하는 경우에는 데이터 화일을 접근할 필요 없이 인덱스만 접근해서 질의를 수행할 수 있으므로 밀집 인덱스가 희소 인덱스보다 유리 한 화일은 한 개의 희소 인덱스와 다수의 밀집 인덱스를 가질 수 있음 왜냐하면 희소 인덱스는 디스크 상에서 데이터 화일의 물리적인 순서에 의존 6장. 물리적 데이터베이스 설계

6.6 다단계 인덱스 다단계 인덱스 인덱스 자체가 클 경우에는 인덱스를 탐색하는 시간도 오래 걸릴 수 있음 인덱스 엔트리를 탐색하는 시간을 줄이기 위해서 단일 단계 인덱스를 디스크 상의 하나의 순서 화일로 간주하고, 단일 단계 인덱스에 대해서 다시 인덱스를 정의할 수 있음 원래의 인덱스를 1단계 인덱스라 하고 이 인덱스에 대해 정의한 추가 인덱스를 2단계 인덱스라고 함 다단계 인덱스는 가장 상위 단계의 모든 인덱스 엔트리들이 한 블록에 들어갈 수 있을 때까지 이런 과정을 반복함 가장 상위 단계 인덱스를 마스터 인덱스(master index)라고 부름 마스터 인덱스는 한 블록으로 이루어지기 때문에 주기억 장치에 상주할 수 있음 대부분의 다단계 인덱스는 B+-트리를 사용 6장. 물리적 데이터베이스 설계

6.6 다단계 인덱스(계속) 6장. 물리적 데이터베이스 설계

6.6 다단계 인덱스(계속) 6장. 물리적 데이터베이스 설계

6.6 다단계 인덱스(계속) SQL의 인덱스 정의문 다수의 attribute를 사용한 인덱스 정의 SELECT * SQL의 CREATE TABLE문에서 PRIMARY KEY절로 명시한 attribute에 대해서는 DBMS가 자동적으로 기본 인덱스를 생성 UNIQUE로 명시한 attribute에 대해서는 DBMS가 자동적으로 보조 인덱스를 생성 SQL2는 인덱스 정의 및 제거에 관한 표준 SQL문을 제공하지 않음 다른 attribute에 추가로 인덱스를 정의하기 위해서는 DBMS마다 다소 구문이 다른 CREATE INDEX문을 사용해야 함 다수의 attribute를 사용한 인덱스 정의 한 릴레이션에 속하는 두 개 이상의 attribute들의 조합에 대하여 하나의 인덱스를 정의할 수 있음 예: CREATE INDEX EmpIndex ON EMPLOYEE(DNO, SALARY); 이 인덱스는 아래의 질의에 활용될 수 있음 SELECT * FROM EMPLOYEE WHERE DNO=3 AND SALARY = 4000000; 인덱스 제거는 drop index <index-name> 6장. 물리적 데이터베이스 설계

6.6 다단계 인덱스(계속) 다수의 attribute를 사용한 인덱스 정의(계속) SELECT * FROM EMPLOYEE 이 인덱스는 아래의 질의에도 활용될 수 있음 SELECT * FROM EMPLOYEE WHERE DNO>=2 AND DNO <=3 AND SALARY >= 3000000 AND SALARY <= 4000000; WHERE DNO = 2; (또는 DNO에 대한 범위 질의) 이 인덱스는 아래의 질의에는 활용될 수 없음 WHERE SALARY >= 3000000 AND SALARY <= 4000000; (또는 SALARY에 대한 동등 조건) 6장. 물리적 데이터베이스 설계

6.6 다단계 인덱스(계속) 인덱스의 장점과 단점 인덱스는 검색 속도를 향상시키지만 인덱스를 저장하기 위한 공간이 추가로 필요하고 삽입, 삭제, 수정 연산의 속도는 저하시킴 데이터 파일이 갱신되는 경우에는 그 파일에 대해 정의된 모든 인덱스들에도 갱신 사항이 반영되야 하므로 인덱스 갱신은 데이터베이스 성능을 저하시킨다 소수의 레코드들을 수정하거나 삭제하는 연산의 속도는 향상됨 릴레이션이 매우 크고, 질의에서 릴레이션의 투플들 중에 일부(예, 2%~4%)를 검색하고, WHERE절이 잘 표현되었을 때 특히 성능에 도움이 됨 6장. 물리적 데이터베이스 설계

6.7 인덱스 선정 지침과 데이터베이스 튜닝 인덱스 선정 지침과 데이터베이스 튜닝 성능 목표를 만족시키기 위해서, 가장 중요한 질의들과 이들의 수행 빈도, 가장 중요한 갱신들과 이들의 수행 빈도, 이와 같은 질의와 갱신들에 대한 바람직한 성능들을 고려하여 인덱스를 선정함 워크로드 내의 각 질의에 대해 이 질의가 어떤 릴레이션들을 접근하는가, 어떤 attribute들을 검색하는가, WHERE절의 선택/조인 조건에 어떤 attribute들이 포함되는가, 이 조건들의 선별력은 얼마인가 등을 고려함 워크로드 내의 각 갱신에 대해 이 갱신이 어떤 릴레이션들을 접근하는가, WHERE절의 선택/조인 조건에 어떤 attribute들이 포함되는가, 이 조건들의 선별력은 얼마인가, 갱신의 유형, 갱신의 영향을 받는 attribute 등을 고려함 어떤 릴레이션에 인덱스를 생성해야 하는가, 어떤 attribute를 탐색 키로 선정해야 하는가, 몇 개의 인덱스를 생성해야 하는가, 각 인덱스에 대해 클러스터링 인덱스, 밀집 인덱스/희소 인덱스 중 어느 유형을 선택할 것인가 등을 고려함 인덱스를 선정하는 한 가지 방법은 가장 중요한 질의들을 차례로 고려해보고, 현재의 인덱스가 최적의 계획에 적합한지 고려해보고, 인덱스를 추가하면 더 좋은 계획이 가능한지 알아봄 물리적 데이터베이스 설계는 끊임없이 이루어지는 작업 6장. 물리적 데이터베이스 설계

6.7 인덱스 선정 지침과 데이터베이스 튜닝(계속) 인덱스를 결정하는데 도움이 되는 몇 가지 지침 지침 1: 기본 키는 클러스터링 인덱스를 정의할 훌륭한 후보 지침 2: 외래 키도 인덱스를 정의할 중요한 후보 지침 3: 한 attribute에 들어 있는 상이한 값들의 개수가 거의 전체 레코드 수와 비슷하고, 그 attribute가 동등 조건에 사용된다면 비 클러스터링 인덱스를 생성하는 것이 좋음 지침 4: 투플이 많이 들어 있는 릴레이션에서 대부분의 질의가 검색하는 투플이 2% ~ 4% 미만인 경우에는 인덱스를 생성 지침 5: 자주 갱신되는 attribute에는 인덱스를 정의하지 않는 것이 좋음 지침 6: 갱신이 빈번하게 이루어지는 릴레이션에는 인덱스를 많이 만드는 것을 피함 6장. 물리적 데이터베이스 설계

6.7 인덱스 선정 지침과 데이터베이스 튜닝(계속) 인덱스를 결정하는데 도움이 되는 몇 가지 지침(계속) 지침 7: 후보 키는 기본 키가 갖는 모든 특성을 마찬가지로 갖기 때문에 인덱스를 생성할 후보 지침 8: 인덱스는 화일의 레코드들을 충분히 분할할 수 있어야 함 지침 9: 정수형 attribute에 인덱스를 생성 지침 10: VARCHAR attribute에는 인덱스를 만들지 않음 지침 11: 작은 화일에는 인덱스를 만들 필요가 없음 지침 12: 대량의 데이터를 삽입할 때는 모든 인덱스를 제거하고, 데이터 삽입이 끝난 후에 인덱스들을 다시 생성하는 것이 좋음 6장. 물리적 데이터베이스 설계

6.7 인덱스 선정 지침과 데이터베이스 튜닝(계속) 언제 인덱스가 사용되지 않는가? 시스템 카탈로그가 오래 전의 데이터베이스 상태를 나타냄 DBMS의 질의 최적화 모듈이 릴레이션의 크기가 작아서 인덱스가 도움이 되지 않는다고 판단함 인덱스가 정의된 attribute에 산술 연산자가 사용됨 SELECT * FROM EMPLOYEE WHERE SALARY * 12 > 40000000; DBMS가 제공하는 내장 함수가 집단 함수 대신에 사용됨 WHERE SUBSTRING(EMPNAME, 1, 1) = ‘김’; 널값에 대해서는 일반적으로 인덱스가 사용되지 않음 WHERE MANAGER IS NULL; 질의 튜닝을 위한 추가 지침 DISTINCT절의 사용을 최소화하라 GROUP BY절과 HAVING절의 사용을 최소화하라 임시 릴레이션의 사용을 피하라 SELECT * 대신에 SELECT절에 attribute 이름들을 구체적으로 명시하라 6장. 물리적 데이터베이스 설계