4장. 관계 대수와 SQL 관계 데이터 모델에서 지원되는 두 가지 정형적인 언어 관계 해석(relational calculus) 어떻게 검색할 것인가 보다 무엇을 검색할 것인가 만을 기술하는 선언적 언어 투플 관계 해석(tuple relational calculus)와 도메인 관계 해석(domain relational calculus) 관계 대수(relational algebra) 어떻게 질의를 수행할 것인가를 명시하는 절차적 인어 관계 대수는 SQL을 구현하고 최적화하기 위해 DBMS의 내부 언어로서도 사용됨 관계 해석과 관계 대수는 표현 방법의 차이는 있지만 그 표현 능력에 있어서는 동등 (logically equivalent) 4장. 관계 대수와 SQL
4.1 관계 대수 관계 대수 일반적으로 대수학은 연산자(operator)와 원자성의 피연산자(operand) 로 구성 (x+y) * z 또는 ((x+7)/(y-3)) + x 관계 대수학은 대수학의 또 다른 예 관계 대수는 릴레이션을 처리하기 위한 연산의 집합으로 각 연산의 피연산자가 모두 릴레이션이고 연산 결과도 또한 릴레이션이라는 특성을 갖는다 전통적인 관계 대수학의 연산은 크게 네 가지로 분류 집합 연산: 합 집합, 교 집합, 차 집합 제거 연산: selection, projection 합 연산: Cartesian product, join 재명명(renaming) 연산 릴레이션이나 관계 대수식(이것의 결과도 릴레이션)에 연산자들을 적용하여 보다 복잡한 관계 대수식을 점차적으로 만들 수 있음 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 4장. 관계 대수와 SQL
4.1 관계 대수(계속) selection 연산자 결과 릴레이션의 카디날리티는 항상 원래 릴레이션의 카디날리티보다 작거나 같음 selection 조건을 predicate라고도 함 selection 조건은 일반적으로 릴레이션의 임의의 애트리뷰트와 상수, = , <>, <=, <, >=, > 등의 비교 연산자, AND, OR, NOT 등의 부울 연산자를 포함할 수 있음 형식: σ<selection 조건) (R) <속성> 비교연산자 <상수>, <속성> 비교연산자 <속성> <조건> AND <조건>, <조건> OR <조건>, NOT <조건> 4장. 관계 대수와 SQL
4.1 관계 대수(계속) selection 연산자(계속) 4장. 관계 대수와 SQL
4.1 관계 대수(계속) projection 연산자 한 릴레이션의 애트리뷰트들의 부분 집합을 구함 selection의 결과 릴레이션에는 중복 투플이 존재할 수 없지만, projection 연산의 결과 릴레이션에는 중복된 투플들이 존재할 수 있음 형식: Π<속성 리스트> (R) 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 집합 연산자 합집합 호환 릴레이션이 투플들의 집합이기 때문에 기존의 집합 연산이 릴레이션에 적용됨 세 가지 집합 연산자: 합집합, 교집합, 차집합 연산자 집합 연산자들은 두 개의 릴레이션을 입력으로 받아들이므로 이항 연산자 집합 연산자의 입력으로 사용되는 두 개의 릴레이션은 합집합 호환(union compatible)이어야 함 합집합 호환 두 릴레이션 R1(A1, A2, ..., An)과 R2(B1, B2, ..., Bm)이 합집합 호환일 필요 충분 조건은 n=m이고, 모든 1<=i<=n에 대해 domain(Ai)=domain(Bi) 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 합집합 연산자 두 릴레이션 R과 S의 합집합 R ∪ S는 R 또는 S에 있거나 R과 S 모두에 속한 투플들로 이루어진 릴레이션 결과 릴레이션에서 중복된 투플들은 제외됨 결과 릴레이션의 차수는 R 또는 S의 차수와 같으며, 결과 릴레이션의 애트리뷰트 이름들은 R의 애트리뷰트들의 이름과 같거나 S의 애트리뷰트들의 이름과 같음 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 교집합 연산자 두 릴레이션 R과 S의 교집합 R ∩ S는 R과 S 모두에 속한 투플들로 이루어진 릴레이션 결과 릴레이션의 차수는 R 또는 S의 차수와 같으며, 결과 릴레이션의 애트리뷰트 이름들은 R의 애트리뷰트들의 이름과 같거나 S의 애트리뷰트들의 이름과 같음 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 차집합 연산자 두 릴레이션 R과 S의 차집합 R - S는 R에는 속하지만 S에는 속하지 않은 투플들로 이루어진 릴레이션 결과 릴레이션의 차수는 R 또는 S의 차수와 같으며, 결과 릴레이션의 애트리뷰트 이름들은 R의 애트리뷰트들의 이름과 같거나 S의 애트리뷰트들의 이름과 같음 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 카티션 곱 연산자 카디날리티가 i인 릴레이션 R(A1, A2, ..., An)과 카디날리티가 j인 릴레이션 S(B1, B2, ..., Bm)의 카티션 곱 R × S는 차수가 n+m이고, 카디날리티가 i*j이고, 애트리뷰트가 (A1, A2, ..., An, B1, B2, ..., Bm)이며, R과 S의 투플들의 모든 가능한 조합으로 이루어진 릴레이션 카티션 곱의 결과 릴레이션의 크기가 매우 클 수 있으며, 사용자가 실제로 원하는 것은 카티션 곱의 결과 릴레이션의 일부인 경우가 대부분이므로 카티션 곱 자체는 유용한 연산자가 아님 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 관계 대수의 완전성 합집합, 교집합, 카티션 프로덕트 연산들은 결합적(associative) 성질 (RUS)UT = RU(SUT) = RUSUT (R∩S) ∩T = R ∩(S ∩T) = R ∩S ∩T (RXS)XT = RX(SXT)=RXSXT 합집합, 교집합, 카티션 프로덕트 연산들은 교환적(commutative) 성질 RUS =SUR, R ∩S = S ∩R, RXS = SXR 이러한 성질은 관계 데이터를 처리하는 과정에서 최적화 할 때 이용할 수 있다 관계 대수의 완전성 selection, projection, 합집합, 차집합, 카티션 곱은 관계 대수의 필수적인 연산자 다른 관계 연산자들은 필수적인 관계 연산자를 두 개 이상 조합하여 표현할 수 있음 임의의 질의어가 적어도 필수적인 관계 대수 연산자들만큼의 표현력을 갖고 있으면 관계적으로 완전(relationally complete)하다고 말함 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 조인 연산자 세타 조인과 동등 조인 두 개의 릴레이션으로부터 연관된 투플들을 결합하는 연산자 관계 데이터베이스에서 두 개 이상의 릴레이션들의 관계를 다루는데 매우 중요한 연산자 세타 조인(theta join), 동등 조인(equijoin), 자연 조인(natural join), 외부 조인(outer join), 세미 조인(semijoin) 등 세타 조인과 동등 조인 두 릴레이션 R(A1, A2, ..., An)과 S(B1, B2, ..., Bm)의 세타 조인의 결과는 차수가 n+m이고, 애트리뷰트가 (A1, A2, ..., An, B1, B2, ..., Bm)이며, 조인 조건을 만족하는 투플들로 이루어진 릴레이션 세타는 {=, <>, <=, <, >=, >} 중의 하나 동등 조인은 세타 조인 중에서 비교 연산자가 =인 조인 형식: R R.속성=S.속성 S 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 자연 조인 동등 조인의 결과 릴레이션에서 조인 애트리뷰트를 한 개 제외한 조인 여러 가지 조인 연산자들 중에서 가장 자주 사용됨 실제로 관계 데이터베이스에서 대부분의 질의는 selection, projection, 자연 조인으로 표현 가능 형식: R * <R.속성, S.속성> S 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 디비전 연산자 차수가 n+m인 릴레이션 R(A1, A2, ..., An, B1, B2, ..., Bm)과 차수가 m인 릴레이션 S(B1, B2, ..., Bm)의 디비전 R ÷ S는 차수가 n이고, S에 속하는 모든 투플 u에 대하여 투플 tu(투플 t와 투플 u을 결합한 것)가 R에 존재하는 투플 t들의 집합 형식: R S 4장. 관계 대수와 SQL
4.1 관계 대수(계속) ÷ = T1 = ∩B(R) T2 = ∩B((S × T1) - R) T = T1 – T2 R(Z) ÷ S(X)는 다음과 같이 정의됨 ( X⊆Z 이고, Y=Z-X 임) - T1 – ∩Y(R) - T2 = ∩Y((S × T1) - R) - T = T1 – T2 예 R A B a1 b1 a2 b1 a3 b1 a4 b1 a1 b2 a3 b2 a2 b3 a3 b3 a4 b3 a1 b4 a2 b4 a3 b4 S A a1 a2 a3 T B b1 b4 ÷ = T1 = ∩B(R) T2 = ∩B((S × T1) - R) T = T1 – T2 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 개명 연산 (RENAME, ρ) 중간 결과 릴레이션에 이름을 지정하거나 애트리뷰트 이름을 변경할 때 사용 ρS(E) 관계 대수식 E의 결과 릴레이션의 이름을 S로 지정 ρS(B1,B2, … ,Bm )(E) 관계 대수식 E의 결과 릴레이션의 이름을 S로 지정하면서 애트리뷰트 이름을 각각 B1,B2, … ,Bm 으로 변경 ρ(B1,B2, … ,Bm )(R) 릴레이션 R의 애트리뷰트 이름을 각각 B1,B2, … ,Bm 으로 변경 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 다수의 연산을 결합하여 관계 대수식(질의) 형성할 수 있음 부서 4에서 일하는 사원들의 이름과 봉급을 검색하라 ΠFNAME,LNAME,SALARY (σDNO=4(EMPLOYEE)) 각 중단 단계의 임시 릴레이션에 이름을 부여할 수도 있음 DEPT4_EMPS <- σDNO=4(EMPLOYEE)) R <- ΠFNAME,LNAME,SALARY (DEPT4_EMPS) 관계 대수 질의의 예 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 관계 대수의 한계 관계 대수는 산술 연산을 할 수 없음 집단 함수(aggregate function)를 지원하지 않음 정렬을 나타낼 수 없음 데이터베이스를 수정할 수 없음 projection 연산의 결과에 중복된 투플을 나타내는 것이 필요할 때가 있는데 이를 명시하지 못함 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 추가된 관계 대수 연산자 집단 함수 SUM, AVG, MAX, MIN, COUNT 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 추가된 관계 대수 연산자(계속) 그룹화 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 추가된 관계 대수 연산자(계속) 외부 조인 조인 할 때 상대 릴레이션에서 대응되는 투플을 갖지 못하는 투플이나 조인 애트리뷰트에 널값이 들어 있는 투플들을 다루기 위해서 조인 연산을 확장한 조인 두 릴레이션에서 대응되는 투플들을 결합하면서, 대응되는 투플을 갖지 않는 투플과 조인 애트리뷰트에 널값을 갖는 투플도 결과에 포함시킴 왼쪽 외부 조인(left outer join), 오른쪽 외부 조인(right outer join), 완전 외부 조인(full outer join) 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 왼쪽 외부 조인 오른쪽 외부 조인 릴레이션 R과 S의 왼쪽 외부 조인 연산은 R의 모든 투플들을 결과에 포함시키고, 만일 릴레이션 S에 관련된 투플이 없으면 결과 릴레이션에서 릴레이션 S의 애트리뷰트들은 널값으로 채움 오른쪽 외부 조인 릴레이션 R와 S의 오른쪽 외부 조인 연산은 S의 모든 투플들을 결과에 포함시키고, 만일 릴레이션 R에 관련된 투플이 없으면 결과 릴레이션에서 릴레이션 R의 애트리뷰트들은 널값으로 채움 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 4장. 관계 대수와 SQL
4.1 관계 대수(계속) 완전 외부 조인 릴레이션 R와 S의 완전 외부 조인 연산은 R과 S의 모든 투플들을 결과에 포함시키고, 만일 상대 릴레이션에 관련된 투플이 없으면 결과 릴레이션에서 상대 릴레이션의 애트리뷰트들은 널값으로 채움 4장. 관계 대수와 SQL