SQL 개요 SQL 개요 - SQL은 현재 DBMS 시장에서 관계 DBMS가 압도적인 우위를 차지하는 데 중요한 요인의 하나 - SQL은 IBM 연구소에서 1974년에 System R이라는 관계 DBMS 시제품 을 연구할 때 관계 대수와 관계 해석을 기반으로, 집단 함수, 그룹화, 갱신 연산 등을 추가하여 개발된 언어 - 1986년에 ANSI(미국 표준 기구)에서 SQL 표준을 채택함으로써 SQL이 널리 사용되는데 기여 - 다양한 상용 관계 DBMS마다 지원하는 SQL 기능에 다소 차이가 있음 - 본 책에서는 SQL2를 따름
SQL 개요(계속) SQL은 비절차적 언어(선언적 언어)이므로 사용자는 자신이 원하는 바(what)만 명시하며, 원하는 것을 처리하는 방법(how)은 명시할 수 없음 관계 DBMS는 사용자가 입력한 SQL문을 번역하여 사용자가 요구한 데이터를 찾는데 필요한 모든 과정을 담당 SQL의 장점은 자연어에 가까운 구문을 사용하여 질의를 표현할 수 있다는 것 두 가지 인터페이스 - 대화식 SQL(interactive SQL) - 내포된 SQL(embedded SQL)
SQL의 구성요소 - 데이터 정의어 - 데이터 조작어 - 데이터 제어어
데이터 정의어와 무결성 제약조건
데이터 정의어 스키마의 생성과 제거 - SQL2에서는 동일한 데이터베이스 응용에 속하는 릴레이션, 도메인, 제약조건, 뷰, 권한 등을 그룹화하기 위해서 스키마 개념을 지원 CREATE SCHEMA MY_DB AUTHORIZATION kim; DROP SCHEMA MY_DB RESTRICT; DROP SCHEMA MY_DB CASCADE;
릴레이션 정의
릴레이션 제거 DROP TABLE DEPARTMENT; ALTER TABLE ALTER TABLE EMPLOYEE ADD PHONE CHAR(13); 인덱스 생성 CREATE INDEX EMPDNO_IDX ON EMPLOYEE(DNO); 도메인 생성 CREATE DOMAIN DEPTNAME CHAR(10) DEFAULT ‘개발’;
제약조건
CREATE TABLE EMPLOYEE ( ID INTEGER, NAME CHAR(10), SALARY INTEGER, MANAGER_SALARY INTEGER, CHECK (MANAGER_SALARY > SALARY));
참조 무결성 제약조건 유지 ON DELETE NO ACTION ON DELETE CASCADE ON DELETE SET NULL ON DELETE SET DEFAULT ON UPDATE NO ACTION ON UPDATE CASCADE ON UPDATE SET NULL ON UPDATE SET DEFAULT
무결성 제약조건의 추가 및 삭제 ALTER TABLE STUDENT ADD CONSTRAINT STUDENT_PK PRIMARY KEY (STNO); ALTER TABLE STUDENT DROP CONSTRAINT STUDENT_PK;
SELECT문 SELECT문 - 관계 데이터베이스에서 정보를 검색하는 SQL문 - 관계 대수의 실렉션과 의미가 완전히 다름 - 관계 대수의 실렉션, 프로젝션, 조인, 카티션 곱 등을 결합한 것 - 여러 가지 질의들의 결과를 보이기 위해서 그림 4.8의 관계 데이터 베이스 상태를 사용함
기본적인 SQL 질의 - SELECT절과 FROM절만 필수적인 절이고, 나머지는 선택 사항
별칭(alias) - 서로 다른 릴레이션에 동일한 이름을 가진 애트리뷰트가 속해 있을 때 애트리뷰트의 이름을 구분하는 방법 EMPLOYEE.DNO FROM EMPLOYEE AS E, DEPARTMENT AS D
릴레이션의 모든 애트리뷰트나 일부 애트리뷰트들을 검색
상이한 값들을 검색
특정한 투플들의 검색
문자열 비교
다수의 검색 조건 - 아래와 같은 질의는 잘못되었음
부정 검색 조건
범위를 사용한 검색
리스트를 사용한 검색
SELECT절에서 산술 연산자(+, -, *, /) 사용
널값 - 널값을 포함한 다른 값과 널값을 +, - 등을 사용하여 연산하면 결과 는 널 - COUNT(*)를 제외한 집단 함수들은 널값을 무시함 - 어떤 애트리뷰트에 들어 있는 값이 널인가 비교하기 위해서 ‘DNO=NULL’처럼 나타내면 안됨
널값(계속) - 다음과 같은 비교 결과는 모두 거짓 NULL > 300 NULL = 300 NULL <> 300 NULL = NULL NULL <> NULL - 올바른 표현
ORDER BY절 - 사용자가 SELECT문에서 질의 결과의 순서를 명시하지 않으면 기본 키의 값이 증가하는 순서대로 사용자에게 제시됨 - ORDER BY절에서 하나 이상의 애트리뷰트를 사용하여 검색 결과를 정렬할 수 있음 - ORDER BY절은 SELECT문에서 가장 마지막에 사용되는 절 - 디폴트 정렬 순서는 오름차순(ASC) - DESC를 지정하여 정렬 순서를 내림차순으로 지정할 수 있음 - 널값은 오름차순에서는 가장 마지막에 나타나고, 내림차순에서는 가 장 앞에 나타남 - SELECT절에 명시한 애트리뷰트들을 사용해서 정렬해야 함
집단 함수 - 데이터베이스에서 검색된 여러 투플들의 집단에 적용되는 함수 - 각 집단 함수는 한 릴레이션의 한 개의 애트리뷰트에 적용되어 단일 값을 반환함 - SELECT절과 HAVING절에만 나타날 수 있음 - COUNT(*)를 제외하고는 모든 집단 함수들이 널값을 제거한 후 남아 있는 값들에 대해서 집단 함수의 값을 구함 - COUNT(*)는 결과 릴레이션의 모든 행들의 총 개수를 구하는 반면에 COUNT(애트리뷰트)는 해당 애트리뷰트에서 널값이 아닌 값들의 개 수를 구함 - 키워드 DISTINCT가 집단 함수 앞에 사용되면 집단 함수가 적용되기 전에 먼저 중복을 제거함
그룹화 - GROUP BY절에 사용된 애트리뷰트에 동일한 값을 갖는 투플들이 각 각 하나의 그룹으로 묶임 - 이때 사용된 애트리뷰트를 그룹화 애트리뷰트(grouping attribute)라 고 함 - 각 그룹에 대하여 결과 릴레이션에 하나의 투플이 생성됨 - SELECT절에는 각 그룹마다 하나의 값을 갖는 애트리뷰트, 집단 함 수, 그룹화에 사용된 애트리뷰트들만 나타날 수 있음 - 다음 질의는 그룹화를 하지 않은 채 EMPLOYEE 릴레이션의 모든 투 플에 대해서 사원번호와 모든 사원들의 평균 급여를 검색하므로 잘 못됨 SELECT EMPNO, AVG(SALARY) FROM EMPLOYEE;
집합 연산 - 집합 연산을 적용하려면 두 릴레이션이 합집합 호환성을 가져야 함 - UNION(합집합), EXCEPT(차집합), INTERSECT(교집합), UNION ALL(합집합), EXCEPT ALL(차집합), INTERSECT ALL(교집합)
조인 - 조인은 두 개 이상의 릴레이션으로부터 연관된 투플들을 결합 - 조인의 일반적인 형식은 아래의 SELECT문과 같이 FROM절에 두 개 이상의 릴레이션들이 열거되고, 두 릴레이션에 속하는 애트리뷰트들 을 비교하는 조인 조건이 WHERE절에 포함됨 - 조인 조건은 두 릴레이션 사이에 속하는 애트리뷰트 값들을 비교 연 산자로 연결한 것 - 가장 흔히 사용되는 비교 연산자는 =
조인(계속) - 조인 조건을 생략했을 때와 조인 조건을 틀리게 표현했을 때는 카티 션 곱이 생성됨 - 조인 질의가 수행되는 과정을 개념적으로 살펴보면 먼저 조인 조건 을 만족하는 투플들을 찾고, 이 투플들로부터 SELECT절에 명시된 애트리뷰트들만 프로젝트하고, 필요하다면 중복을 배제하는 순서로 진행됨 - 조인 조건이 명확해지도록 애트리뷰트 이름 앞에 릴레이션 이름이 나 투플 변수를 사용하는 것이 바람직 - 두 릴레이션의 조인 애트리뷰트 이름이 동일하다면 반드시 애트리 뷰트 이름 앞에 릴레이션 이름이나 투플 변수를 사용해야 함
자체 조인(self join) - 한 릴레이션에 속하는 투플을 동일한 릴레이션에 속하는 투플들과 조인하는 것 - 실제로는 한 릴레이션이 접근되지만 FROM절에 두 릴레이션이 참조 되는 것처럼 나타내기 위해서 그 릴레이션에 대한 별칭을 두 개 지 정해야 함
중첩 질의(nested query) - 외부 질의의 WHERE절에 다시 SELECT ... FROM ... WHERE 형태로 포함된 SELECT문 - 부질의(subquery)라고 함 - INSERT, DELETE, UPDATE문에도 사용될 수 있음 - 중첩 질의의 결과로 한 개의 스칼라값(단일 값), 한 개의 애트리뷰트 로 이루어진 릴레이션, 여러 애트리뷰트로 이루어진 릴레이션이 반 환될 수 있음
한 개의 스칼라값이 반환되는 경우
한 개의 애트리뷰트로 이루어진 릴레이션이 반환되는 경우 - 중첩 질의의 결과로 한 개의 애트리뷰트로 이루어진 다수의 투플들 이 반환될 수 있음 - 외부 질의의 WHERE절에서 IN, ANY(SOME), ALL, EXISTS와 같은 연 산자를 사용해야 함 - 키워드 IN은 한 애트리뷰트가 값들의 집합에 속하는가를 테스트할 때 사용됨 - 한 애트리뷰트가 값들의 집합에 속하는 하나 이상의 값들과 어떤 관 계를 갖는가를 테스트하는 경우에는 ANY를 사용 - 한 애트리뷰트가 값들의 집합에 속하는 모든 값들과 어떤 관계를 갖 는가를 테스트하는 경우에는 ALL을 사용
여러 애트리뷰트들로 이루어진 릴레이션이 반환되는 경우 중첩 질의의 결과로 여러 애트리뷰트들로 이루어진 릴레이션이 반환되는 경우에는 EXISTS 연산자를 사용하여 중첩 질의의 결과가 빈 릴레이션인지 여부를 검사함 중첩 질의의 결과가 빈 릴레이션이 아니면 참이 되고, 그렇지 않으면 거짓
상관 중첩 질의(correlated nested query) 중첩 질의의 WHERE절에 있는 프레디키트에서 외부 질의에 선언된 릴레이션의 일부 애트리뷰트를 참조하는 질의 중첩 질의의 수행 결과가 단일 값이든, 하나 이상의 애트리뷰트로 이루어진 릴레이션이든 외부 질의로 한 번만 결과를 반환하면 상관 중첩 질의가 아님 상관 중첩 질의에서는 외부 질의를 만족하는 각 투플이 구해진 후에 중첩 질의가 수행되므로 상관 중첩 질의는 외부 질의를 만족하는 투플 수만큼 여러 번 수행될 수 있음
INSERT, DELETE, UPDATE문 INSERT문 - 기존의 릴레이션에 투플을 삽입 - 참조되는 릴레이션에 투플이 삽입되는 경우에는 참조 무결성 제약 조건의 위배가 발생하지 않으나 참조하는 릴레이션에 투플이 삽입되 는 경우에는 참조 무결성 제약조건을 위배할 수 있음 - 릴레이션에 한 번에 한 투플씩 삽입하는 것과 한 번에 여러 개의 투 플들을 삽입할 수 있는 것으로 구분 - 릴레이션에 한 번에 한 투플씩 삽입하는 INSERT문 INSERT INTO 릴레이션(애트리뷰트1, ..., 애트리뷰트n) VALUES (값1, ..., 값n);
INSERT문(계속) - 릴레이션에 한 번에 여러 개의 투플들을 삽입하는 INSERT문 INSERT INTO 릴레이션(애트리뷰트1, ..., 애트리뷰트n) SELECT ... FROM ... WHERE ...;
DELETE문 - 삭제 연산은 한 릴레이션으로부터 한 개 이상의 투플들을 삭제함 - 참조되는 릴레이션의 삭제 연산의 결과로 참조 무결성 제약조건이 위배될 수 있으나, 참조하는 릴레이션에서 투플을 삭제하면 참조 무 결성 제약조건을 위배하지 않음 - DELETE문의 구문 DELETE FROM 릴레이션 WHERE 조건;
UPDATE문 - 한 릴레이션에 들어 있는 투플들의 애트리뷰트 값들을 수정 - 기본 키나 외래 키에 속하는 애트리뷰트의 값이 수정되면 참조 무결 성 제약조건을 위배할 수 있음 - UPDATE문의 구문 UPDATE 릴레이션 SET 애트리뷰트 = 값 또는 식[, …] WHERE 조건;
트리거(trigger)와 주장(assertion) - 명시된 이벤트(데이터베이스의 갱신)가 발생할 때마다 DBMS가 자동적으로 수행하는, 사용자가 정의하는 문(프로시저) - 트리거는 데이터베이스의 무결성을 유지하기 위한 일반적이고 강력한 도구 - 트리거는 테이블 정의시 표현할 수 없는 기업의 비즈니스 규칙들을 시행하는 역할 - 트리거를 명시하려면 트리거를 활성화시키는 사건인 이벤트, 트리거가 활성화되었을 때 수행되는 테스트인 조건, 트리거가 활성화되고 조건이 참일 때 수행되는 문(프로시저)인 동작을 표현해야 함 - 트리거를 이벤트-조건-동작(ECA) 규칙이라고도 부름 - E는 Event, C는 Condition, A는 Action을 의미 - SQL3 표준에 포함되었으며 대부분의 상용 관계 DBMS에서 제공됨
트리거(계속) - SQL3에서 트리거의 형식 CREATE TRIGGER <트리거이름> AFTER <트리거를 유발하는 이벤트들이 OR로 연결된 리스트> ON <릴레이션> [WHEN <조건>] BEGIN <SQL문(들)> END - 이벤트의 가능한 예로는 테이블에 투플 삽입, 테이블로부터 투플 삭제, 테이 블의 투플 수정 등이 있음 - 조건은 임의의 형태의 프레디키트 - 동작은 데이터베이스에 대한 임의의 갱신 - 트리거가 제약조건과 유사하지만 어떤 이벤트가 발생했을 때 조건이 참이 되면 트리거와 연관된 동작이 수행되고, 그렇지 않으면 아무 동작도 수행되 지 않음 - 삽입, 삭제, 수정 등이 일어나기 전(before)에 동작하는 트리거와 일어난 후 (after)에 동작하는 트리거로 구분
연쇄적으로 활성화되는 트리거 - 하나의 트리거가 활성화되어 이 트리거 내의 한 SQL문이 수행되고, 그 결과로 다른 트리 거를 활성화하여 그 트리거 내의 SQL문이 수행될 수 있음
주장 - 주장은 SQL3에 포함되어 있으나 대부분의 상용 관계 DBMS가 아직 지원하고 있지 않음 - 트리거는 제약조건을 위반했을 때 수행할 동작을 명시하는 것이고, 주장은 제약조건을 위반하는 연산이 수행되지 않도록 함 - 주장의 구문 CREATE ASSERTION 이름 CHECK 조건; - 트리거보다 좀더 일반적인 무결성 제약조건 - DBMS는 주장의 프레디키트를 검사하여 만일 참이면 주장을 위배하 지 않는 경우이므로 데이터베이스 수정이 허용됨 - 일반적으로 두 개 이상의 테이블에 영향을 미치는 제약조건을 명시 하기 위해 사용됨
내포된 SQL 내포된 SQL(embedded SQL) - SQL이 호스트 언어의 완전한 표현력을 갖고 있지 않기 때문에 모든 - SQL은 호스트 언어가 갖고 있는 조건문(IF문), 반복문(WHILE문), 입출력 등과 같은 동작, 사용자와의 상호 작용, 질의 결과를 GUI로 보내는 등의 기능을 갖고 있지 않음 - C, C++, 코볼, 자바 등의 언어로 작성하는 프로그램에 SQL문을 삽입하여, 데이터베이스를 접근하는 부분을 SQL이 맡고 SQL에 없는 기능은 호스트 언어로 작성하는 것이 필요 - 호스트 언어에 포함되는 SQL문을 내포된 SQL이라 부름 - 데이터 구조가 불일치하는 문제(impedance mismatch 문제)
내포된 SQL(계속) - MS SQL SERVER 2005에서 C 언어에 SQL문을 내포시키는 환경을 ESQL/C라 부름 - 호스트 언어로 작성 중인 프로그램에 SQL문을 내포시킬 때 해당 호 스트 언어의 컴파일러가 어떻게 호스트 언어의 문과 SQL문을 구별 할 것인가? - 호스트 언어로 작성 중인 프로그램에 포함된 SELECT, INSERT, DELETE, UPDATE 등 모든 SQL문에는 반드시 문장의 앞부분에 EXEC SQL을 붙임 - EXEC SQL은 EXEC SQL부터 세미콜론(;) 사이에 들어 있는 문장이 내포된 SQL문임을 전컴파일러에게 알림 - ESQL/C 전컴파일러(precompiler)는 내포된 SQL문을 C 컴파일러에 서 허용되는 함수 호출로 변환함
ESQL/C - ESQL/C는 정적인 SQL문과 동적인 SQL문 모두를 지원함 - 정적인 SQL문은 C 프로그램에 내포된 완전한 Transact-SQL문 - 동적인 SQL문은 응용을 개발할 때 완전한 SQL문의 구조를 미리 알 고 있지 않아도 됨 - 동적인 SQL문은 불완전한 Transact-SQL문으로서 일부 또는 전부를 질의가 수행될 때 입력 가능 - 정적인 SQL문은 입력값과 출력 데이터를 위해서 C 프로그램의 변수 들을 포함할 수 있음 - SQL문에 포함된 C 프로그램의 변수를 호스트 변수(host variable)라 고 부름
불일치 문제와 커서 - 호스트 언어는 단일 변수/레코드 위주의 처리(투플 위주의 방식)를 지원하는 반면에 SQL은 데이터 레코드들의 처리(집합 위주의 방식) 를 지원하기 때문에 불일치 문제가 발생함 - 불일치 문제를 해결하기 위해서 커서(cursor)가 사용됨 - 커서는 한 번에 한 투플씩 가져오는 수단 - DECLARE CURSOR문을 사용하여 커서를 정의함 - OPEN cursor문은 질의를 수행하고, 질의 수행 결과의 첫 번째 투플 이전을 커서가 가리키도록 한다. 이 것이 커서의 현재 투플 - 그 다음에 FETCH문은 커서를 다음 투플로 이동하고, 그 투플의 애 트리뷰트 값들을 FETCH문에 명시된 호스트 변수들에 복사함 - CLOSE cursor는 커서를 닫음
불일치 문제와 커서(계속) - 만일 갱신할 투플들에 대해 커서를 정의할 때는 커서 선언부에 FOR UPDATE OF절을 반드시 포함시키고, 수정할 애트리뷰트들을 함께 명 시함 EXEC SQL DECLARE title_cursor CURSOR FOR SELECT title FROM employee FOR UPDATE OF title; UPDATE employee SET title = :newtitle WHERE CURRENT OF title_cursor;
SQL 통신 영역(SQLCA: SQL Communications Area) - C 프로그램에 내포된 SQL문에 발생하는 에러들을 사용자에게 알려 줌 - 사용자는 SQLCA 데이터 구조의 에러 필드와 상태 표시자를 검사하 여 내포된 SQL문이 성공적으로 수행되었는가 또는 비정상적으로 수 행되었는가를 파악할 수 있음 - SQLCA 데이터 구조 중에서 가장 중요하고 널리 사용되는 필드는 SQLCODE 변수 - SQLCODE의 값이 0이면 마지막에 내포된 SQL문이 성공적으로 끝났 음을 의미