Presentation is loading. Please wait.

Presentation is loading. Please wait.

제 8 장 객체지향 데이타베이스와 데이타베이스의 새로운 응용 분야

Similar presentations


Presentation on theme: "제 8 장 객체지향 데이타베이스와 데이타베이스의 새로운 응용 분야"— Presentation transcript:

1 제 8 장 객체지향 데이타베이스와 데이타베이스의 새로운 응용 분야
제 8 장 객체지향 데이타베이스와 데이타베이스의 새로운 응용 분야 객체지향 데이타베이스 데이타베이스의 새로운 응용 분야

2 8.1 객체지향 데이타베이스 등장배경 새로운 요구사항에 대한 대안 현재 상용 DBMS은 대부분 관계형 데이타 모델 기반
관계형 데이타 모델 : 대상 데이타가 대부분 정형화된 문자나 숫자 일 때 가장 적합한 모델 은행의 입출금 업무, 기업의 인사, 행정, 조직관리 등 다양한 응용 분야의 등장 예) 멀티미디어 응용 분야 : 문자, 숫자, 이미지, 오디오, 동영상과 같은 다양한 종류의 데이타를 관리 필요 예) 웹을 이용한 응용 시스템 : HTML이나 기타 정형화되지 않은 일반 문서들에 대한 관리 필요 새로운 요구사항에 대한 대안 기존 관계형 DBMS의 기술 확장 새로운 데이타 모델에 기반한 데이타베이스 개발 관계형 데이타 모델의 단점 극복 : 객체지향 데이타 모델에 기반한 객체지향 데이타베이스(object-oriented database) Copyright  2002 by S.-g. Lee and J.-y. Chang

3 객체지향 데이타 모델 객체 개체-관계 데이타 모델에서의 개체와 유사 Method
개체 : 속성의 집합으로 표현 객체 : 속성들과 메소드들로 구성 Method 객체 내부에서만 필요한 연산으로 정의 다른 객체에서 호출되어 실행되는 인터페이스의 역할 객체 식별자(OID: Object Identifier) 객체의 이름이나 기능에 관계없이 유일 관계형 데이타베이스의 기본 키와 유사 기본 키는 사용자가 입력하는 값에 의존, OID는 시스템에 의해 주어짐  유일성 보장 같은 값을 가져도 OID가 다르면 서로 다른 객체가 됨 Copyright  2002 by S.-g. Lee and J.-y. Chang

4 클래스 - 공통적인 특성을 지닌 객체들을 하나의 그룹으로 묶음 - 개체-관계 데이타 모델에서의 개체 집합과 유사
- 클래스 vs. 객체 - 클래스 : 그 안에 포함된 객체의 특징을 상징적으로 나타내는 기능 - 객체 : 클래스에 정의된 특징을 지닌 개별 인스턴스 Copyright  2002 by S.-g. Lee and J.-y. Chang

5 계층과 계승 계층(hierarchy) : 클래스 간에 관계를 설정
수퍼 클래스(super class) : 계층 내에서 일반적인 개념의 클래스 서브 클래스 (subclass) : 세분화된 클래스 계승(inheritance) : 서브 클래스는 수퍼 클래스의 모든 속성과 메소드를 자신이 정의한 것처럼 사용한다. Copyright  2002 by S.-g. Lee and J.-y. Chang

6 복합 객체(complex object) 한 객체에 정의된 속성으로 숫자나 문자 이외에 또 다른 객체를 사용
개념적으로 여러 단계를 거쳐 속성들을 정의할 수 있으므로 다양한 객체 표현 가능 개체-관계 모델에서 외래 키와 유사 학생 개체 학과 개체 대학 개체 학과 대학 학과 Copyright  2002 by S.-g. Lee and J.-y. Chang

7 학사 데이타베이스에 대한 객체 지향 모델의 예 Copyright  2002 by S.-g. Lee and J.-y. Chang

8 객체지향 질의언어 클래스 정의 구성원, 교수, 학생,학과 클래스 생성 ADDCLASS 구성원 ADDCLASS 학생
TYPE TUPLE ( 주민등록번호: integer, 이름: string, 주소: string, 전화번호: string ) ADDCLASS 교수 INHERITS 구성원 교수번호: integer, 학과명: 학과, 직위: string, 임용연도: date, 강의: set(강좌) ADDCLASS 학생 INHERITS 구성원 TYPE TUPLE ( 학번: integer, 학년: integer, 학과명: 학과, 수강: set (강좌) ) ADDCLASS 학과 학과번호: integer, 학과명: string, 사무실: string, 전화번호: string Copyright  2002 by S.-g. Lee and J.-y. Chang

9 데이타 검색 구성원 클래스에서 김동규라는 이름을 가진 객체를 찾는 질의 전산과에 소속된 2학년 이상의 학생들을 찾는 질의
SELECT t FROM t in 구성원 WHERE t.name = “김동규” 전산과에 소속된 2학년 이상의 학생들을 찾는 질의 SELECT t FROM t in 학생 WHERE t.학년 >= 2 and t.학과.학과명 = “전산과” Copyright  2002 by S.-g. Lee and J.-y. Chang

10 8.2 데이타베이스의 새로운 응용분야 멀티미디어(multimedia) 데이타베이스 시스템의 등장 배경
멀티미디어 데이타도 일반 정형 데이타와 같이 데이타베이스로 관리해야 하는 필요성 기존의 정형 데이타만을 다루는 데이타베이스에 비해 확장된 많은 기능들이 요구 멀티미디어 데이타베이스의 특징 대용량의 저장 공간 다양한 데이타 타입 지원 다양한 검색 방법 지원 실시간(real time) 데이타 처리 능력 Copyright  2002 by S.-g. Lee and J.-y. Chang

11 멀티미디어 데이타에 대한 질의 멀티미디어 데이타와 관련된 정형 데이타가 함께 저장 멀티미디어 데이타 검색
관련 정형 데이타에 대한 조건을 명시 예) “1990년 이전에 생산된 자동차의 이미지들을 검색하라” 내용기반 검색(content-based retrieval) 데이타의 내용 자체에 대한 조건으로 검색 예) “파란색 계열의 차량에 대한 이미지를 검색하라” 데이타의 구조에 관련된 질의 예) “현재 검색된 동영상 데이타에 대해서 처음부터 1분의 상영 시간에 해당하는 데이타를 추출하시오.” 예) “MPEG으로 압축된 동영상 데이타에 대해서 크기가 2Mbyte이하인 것만 검색하라” 질의가 매우 다양한 형태로 나타남. 표준 질의어는 개발되지 않았으나 많은 DBMS에서 질의를 자체적으로 제공. Copyright  2002 by S.-g. Lee and J.-y. Chang

12 지리정보 시스템(GIS) 지리정보 시스템(Geographic Information System: GIS)
컴퓨터를 이용, 지리적 자료를 수집, 저장, 분석, 출력하는 시스템 공간 데이터의 기본요소 : 점(point), 선(line), 영역(region) 기본 요소를 기반으로 공간 데이타에 대한 저장, 검색 방식과 공간 데이타에 대한 분석 기능 제공 점, 선, 영역으로 추상화 Copyright  2002 by S.-g. Lee and J.-y. Chang

13 지리정보 시스템의 응용 분야 - 토지관련 분야 - 시설물 관리 - 교통 분야 - 도시계획 - 환경 분야 - 농업분야
- 토지관련 분야 -   시설물 관리 -   교통 분야 -   도시계획 -   환경 분야 -  농업분야 - 재해재난 Copyright  2002 by S.-g. Lee and J.-y. Chang

14 공간 데이터에 대한 인덱스 공간 데이터 표현을 위한 인텍스 방법
공간 데이터에 대한 인덱스 GIS에서 공간 데이타에 대한 검색과 저장 방식은 시스템 전체의 성능을 좌우하므로 핵심기능을 담당 예) 특정 영역에 위치한 소방서를 찾아라 기존의 B+트리 하나의 값만으로 키를 구성 But, 공간 데이타는 2차원 이상의 값을 이용하여 인덱스를 구축해야 하므로 제약이 많다. 공간 데이터 표현을 위한 인텍스 방법 K-D트리 k는 차원을 나타냄. 2차원에 대한 인덱스 구조이므로 2-D트리라고 할 수 있다. R-트리, 격자 화일(grid file), 사분 트리(quadtree) etc. Copyright  2002 by S.-g. Lee and J.-y. Chang

15 “A영역에 위치한 소방서를 찾아라” 소방서의 위치를 나타내는 지도 2-D 트리의 예
Copyright  2002 by S.-g. Lee and J.-y. Chang

16 공간 데이타에 대한 질의 SELECT building.name
대부분의 GIS는 기존 SQL에 공간 데이타에 대한 질의 조건을 명시할 수 있는 기능을 추가하여 제공 SQL을 확장한 GEOQL이라는 질의어를 이용한 공간 데이타에 대한 질의의 예 “종로3가 역을 중심으로 반경 500m이내에 있는 모든 극장을 찾아라” SELECT building.name FROM building, subway WHERE subway.name = “종로3가” and building.type = “극장” and building within 500m of subway 반경 500m이내  영역, building  점 K-D 트리로 검색가능 Copyright  2002 by S.-g. Lee and J.-y. Chang

17 “서울역과 시청역 사이를 지나는 모든 도로를 찾아라”
SELECT road.number FROM road, subway S1, subway S2 WHERE road intersects line joining S1 to S2 and S1.name = “서울역” and S1,name = “시청역” “road intersects line joining S1 to S2”는 점 S1과 S2사이의 선에 교차하는 길을 찾으라는 조건 road는 모두 선으로 표현될 것이므로 두 선이 서로 교차하는지 판단하는 것은 간단한 계산으로 가능 Copyright  2002 by S.-g. Lee and J.-y. Chang

18 데이타 웨어하우스 기존의 데이타베이스 새로운 요구사항의 등장 업무처리의 효율화 목적 은행 업무, 수강 신청 등
작은 트랜잭션들을 동시에 많이 처리해야함 OLTP (On-Line Transaction Processing) “운영 데이타베이스(operational database)” 새로운 요구사항의 등장 축적되어온 수많은 자료로부터 통계, 추이, 경향 분석 작업 기업이나 기관의 의사결정에 필요한 유용한 고급 정보를 추출 예) “지난해 컬러 TV의 예상 판매액 대비 실제 판매액을 월별 대리점별로 출력하라” “올해 상반기에 판매 신장률이 가장 높은 상위 10개 품목을 출력하라” Copyright  2002 by S.-g. Lee and J.-y. Chang

19 데이타 웨어하우스(data warehouse)
기업내의 의사결정 지원 소프트웨어를 위한 정보 기반을 제공하는 하나의 통합된 데이타베이스 현업 종사자나 관리자가 빠른 시간 내에 자신이 직접 필요로 하 는 의사결정에 필요한 정보를 얻을 수 있는 기반 마련 데이타 웨어하우스의 특징 주제 중심적(subject-oriented) 구성 통합된(integrated) 내용 시간에 따라 변화되는(time variant) 값의 유지 비휘발성(non-volatile) Copyright  2002 by S.-g. Lee and J.-y. Chang

20 주제 중심적 구성 OLTP는 업무중심으로 구성 데이터 웨어하우스의 대상은 주제(subject)
eg) 대부, 저축, 은행카드, 신용 업무처리에 필요한 데이타만을 보유 업무 처리 흐름과 유사 데이터 웨어하우스의 대상은 주제(subject) 고객, 상품, 활동 의사 결정에 필요한 데이타 보유 분석 관점에 의한 데이타 관점 Copyright  2002 by S.-g. Lee and J.-y. Chang

21 통합된(integrated) 내용 다양한 소스와 형식을 가진 데이타들을 하나의 포맷으로 통합 Operational DB DW
A: M, F M, F B: Male, Female A: cm cm B: inches C: yards Copyright  2002 by S.-g. Lee and J.-y. Chang

22 시간에 따라 변화되는 값의 유지 시간에 따라 데이터 적재 대부분의 경우 시간적 요소가 포함됨
5년 ~10년간의 누적된 데이터 적재 키에 시간 성분이 포함 Copyright  2002 by S.-g. Lee and J.-y. Chang

23 비휘발성 데이타 웨어하우스에 데이터가 적재되면 변경되거나 삭제되지 않는다 데이터 웨어하우스에서의 연산
초기 데이터 적재 데이타에 대한 질의 정규화나 트랜잭션 관리가 비교적 단순하다 Copyright  2002 by S.-g. Lee and J.-y. Chang

24 OLTP & OLAP OLTP (On-Line Transaction Processing)
- 매우 작은 트랜잭션을 동시에 많이 처리하는 환경 - 대부분의 운영 데이타베이스 OLAP(On-Line Analytic Processing) - 의사결정을 위해 데이타의 분석 위주로 운영되는 환경 - 데이타 웨어하우스 Copyright  2002 by S.-g. Lee and J.-y. Chang

25 데이타 웨어하우스를 기반으로 하는 정보 흐름 체계
Copyright  2002 by S.-g. Lee and J.-y. Chang

26 데이타 웨어하우스를 위한 데이타 모델 다차원 모델(multidimensional model)
데이타를 서로 다른 관점으로 관찰, 분석 다차원 관점의 개념적 구조 : 차원(dimension)과 값으로 구 값 : 발생 사실, 수치값(numerical value) 차원 : 발생 사실에 대한 하나의 관점 판매 업체의 판매 실적을 분석하기 위한 다차원 모델 시간별, 상품별, 매장별 판매량을 나타냄. 시간 상품 매장 Copyright  2002 by S.-g. Lee and J.-y. Chang

27 데이타 웨어하우스를 위한 데이타 모델 다차원 모델을 관계형 모델로 표현 가능 스타 스키마(Star Schema)
판매: 사실 테이블 나머지: 차원 테이블 Copyright  2002 by S.-g. Lee and J.-y. Chang

28 데이타 웨어하우스에서의 질의 예) 2000년도의 월별 판매량을 보여라
SELECT 시간.월, SUM(판매.판매량) FROM 판매, 시간 WHERE 판매.시간키 = 시간.시간키 and 시간.년 = 2000 GROUP BY 시간.월 예) 2001년 상반기에 각 매장의 분기별 판매액의 보여라 SELECT 매장.매장명, 시간.분기, SUM(판매.판매액) FROM 판매, 시간, 매장 WHERE 판매.시간키 = 시간.시간키 and 판매.매장키 = 매장.매장키 and 시간.년 = 2001 and 시간.분기 = “상반기” Copyright  2002 by S.-g. Lee and J.-y. Chang

29 데이타 웨어하우스에서의 질의 예) 2001년도 매출 판매액 상위 5개의 매장을 출력하라. (SQL의 확장) 기타 질의 예
SELECT 매장.매장명, top(판매.판매액, 5) FROM 판매, 시간, 매장 WHERE 판매.시간키 = 시간.시간키 and 판매.매장키 = 매장.매장키 and 년 = 2001 GROUP BY 매장.매장명 기타 질의 예 “2000년 대비 2001년의 상반기의 월별 판매 실적 비율을 출력하라” “금년 판매량의 월별 누적 분포를 구하라” Copyright  2002 by S.-g. Lee and J.-y. Chang

30 정보 검색 시스템 정보 검색 시스템(information retrieval system)
사용자로부터 입력된 키워드를 기반으로 원하는 “문서”의 위치를 검색하는 시스템 릴레이션과는 달리 정형화 되지 않은 일반 문서가 대상 예) HTML 문서 WWW 환경의 검색 엔진에서 활발히 사용 검색 엔진들은 WWW상의 문서들을 항해(navigation)하면서 -> 각 문서의 키워드들을 추출 -> 인덱스를 구성 -> 사용자가 키워드를 입력 -> 키워드를 포함하는 문서의 위치 검색 -> 사용자에게 결과 알림 Copyright  2002 by S.-g. Lee and J.-y. Chang

31 검색 모델(retrieval model)
사용자의 질의와 저장 문서간의 유사성(similarity)을 평가하는 방법 정형화 되지 않은 문서를 정확히 찾는 방법은 사실상 불가능 오류를 최소화 검색된 정보가 얼마나 정확한가에 대한 기준 정확도(precision) 검색된 문서 중 실제로 질의에 관련된 문서가 얼마나 포함되어 있는가 재현도(recall) 질의에 관련된 문서 중 실제로 얼마 만큼의 문서가 질의의 결과로 추출되었는가 모델의 종류 부울 모델(Boolean model), 벡터 공간 모델(vector space model), 퍼지 집합 모델(fuzzy set model), 확률 모델(probability model) Copyright  2002 by S.-g. Lee and J.-y. Chang

32 부울 모델 현재 온라인 검색 시스템에서 가장 많이 사용되는 검색 기법
사용자는 찾고자 하는 문서의 키워드와 이 키워드들간의 논리적인 관계로 질의를 표현 : AND, OR, NOT 예) “정보” 또는 “검색”이란 키워드가 포함되고 “시스템”이란 키워드가 반드시 포함되는 문서에 대한 질의 (정보 OR 검색) AND 시스템 Copyright  2002 by S.-g. Lee and J.-y. Chang

33 인덱스 역 화일(inverted file) 구조 역 화일에서 각 문서들은 문서들에 포함된 키워드의 집합으로 표현
인덱스 파일 + 링크 파일 인덱스 화일은 다양한 방법으로 구성 가능 Copyright  2002 by S.-g. Lee and J.-y. Chang


Download ppt "제 8 장 객체지향 데이타베이스와 데이타베이스의 새로운 응용 분야"

Similar presentations


Ads by Google