Presentation is loading. Please wait.

Presentation is loading. Please wait.

제 8장. 멀티미디어 데이터베이스 및 정보검색 시스템

Similar presentations


Presentation on theme: "제 8장. 멀티미디어 데이터베이스 및 정보검색 시스템"— Presentation transcript:

1 제 8장. 멀티미디어 데이터베이스 및 정보검색 시스템
제 8장. 멀티미디어 데이터베이스 및 정보검색 시스템

2 목차 개 요 멀티미디어와 데이터베이스 멀티미디어 데이터베이스시스템 개요 멀티미디어 정보 검색 멀티미디어 질의 처리
멀티미디어 데이터베이스시스템 사례 요약

3 개 요 기술의 발달에 따른 멀티미디어 정보 활용성 증대 멀티미디어 정보의 효율적인 관리 필요
프로세서 처리속도, 데이터 저장 (storage) 능력, 네트워크 전송속도 (bandwidth) 등의 발달 처리되는 데이터 타입의 다양화 월드와이드웹 (WWW: World Wide Web)의 경우 초기 텍스트, 저용량 이미지 위주에서 고용량 이미지, 오디오, 비디오 등의 용량이 큰 데이터 활용 확대 멀티미디어 정보의 효율적인 관리 필요 늘어나는 멀티미디어 정보 유용한 정보들을 관리 및 유지할 수 있는 방법 필요 하나의 솔루션 (solution): 멀티미디어 데이터베이스 시스템

4 멀티미디어와 데이터베이스 멀티미디어 종류와 특징 종류 텍스트 텍스트 (text) 사운드 (sound)
멀티미디어 종류와 특징 종류 텍스트 (text) 사운드 (sound) 정지영상 (still image) 동영상 (moving image 또는 motion picture) 텍스트 가장 일반적인 데이터 형식, 일련된 문자의 집합 다양한 어플리케이션(워드프로세서, 프리젠테이션, 데이터베이스 등)에서 사용됨 GUI(Graphic User Interface)의 발달에 따라 텍스트에 부가된 스타일(색상, 크기, 폰트 등) 중요성 증대

5 멀티미디어와 데이터베이스 사운드 사람의 청각에 의해 인지되는 데이터
다양한 파일 포맷 형태(wav, asf, mp3, ogg 등) 파일 크기: 샘플링에 의한 압축 정도와 해당 데이터의 시간 길이에 따라 차이남

6 멀티미디어와 데이터베이스 정지영상 사람의 시각에 의해 인지되는 특정 순간의 이미지
다양한 화일포맷 형태 (gif, jpeg, bmp, pict, pcx 등) 비트맵방식과 벡터방식 비트맵(bitmap) 방식 래스터(raster) 방식이라고도 함 연속된 픽셀 정보의 집합으로 표현됨 한 픽셀의 색상정보를 몇 비트로 표현하느냐에 따라 파일 크기가 차이남 벡터(vector) 방식 이미지를 구성하는 객체들의 집합으로 표현됨 각 객체의 외형적 복잡도와 객체의 수에 따라 파일 크기가 차이남

7 멀티미디어와 데이터베이스 동영상 사람이나 물체의 연속된 움직임을 저장한 영상 데이터 상대적으로 파일의 크기가 큰 데이터 형식
다양한 화일포맷 형태 (mpeg, avi, asf, rm, wmv 등) 연속된 프레임 정보의 집합으로 표현되고, 한 프레임의 용량과 프레임 간의 상관관계가 전체 파일크기에 영향 소리와 함께 저장되고 표현될 경우, 영상과 소리의 내용적 일치가 필요

8 멀티미디어와 데이터베이스 멀티미디어 데이터의 특징 (1) 데이터 크기 전통적인 문자, 숫자들보다는 데이터 크기가 훨씬 큼
동영상: 상대적으로 큰 데이터 크기를 가짐 예) 1초에 15프레임(한 프레임 영상 크기 1MB)인 동영상 을 압축없이 구성할 경우: 1분에 약 900MB 데이터 크기는 정보를 시스템에 저장 및 관리 그리고 검색/획득하는 과정에도 영향

9 멀티미디어와 데이터베이스 (2) 실시간 데이터 처리 오디오, 비디오 데이터의 속성
연속적인 데이터의 흐름 요구된 시간을 만족하는 결과가 유효성을 가짐 데이터 결과를 적합한 시간에 사용자가 볼 수 있도록 저장된 데이터를 읽어내고, 전송할 수 있는 시스템이 필요 예) 오디오, 비디오 조합되어 결과를 보내줄 경우 이들간의 동기화(synchronization)를 맞추어야 함

10 멀티미디어와 데이터베이스 (3) 데이터 내용 이해의 어려움 원하는 결과에 해당하는지 실 데이터 자체만으로는 인식하기 어려움
예) ‘자동차’관련 그림파일을 찾고자 할 경우, 검색하는 데이터 그 자체로는 판단하기 어려움 멀티미디어 데이터가 저장되어 있는 저장소(storage)에서 요구하는 특정 자료만을 찾아낼 수 있는 방법 필요 해결책 예) 데이터에 대한 설명, 즉 메타데이터 (metadata) 같은 부가 정보를 함께 저장

11 멀티미디어와 데이터베이스 데이터베이스시스템 이해 데이터베이스 (Database)란? 데이터베이스관리시스템 (DBMS)
논리적으로 연관된 자료들의 모임 데이터베이스관리시스템 (DBMS) 많은 자료들을 저장하고 관리 및 유지를 할 수 있는 소프트웨어 장점 대용량 데이터 저장 및 효율적인 데이터 유지관리, 인덱스를 이용한 빠른 접근 방법 제공 데이터의 논리적 구조를 표현하는 데이터 정의 언어와 정보를 검색하기 위한 질의 언어 제공 트랜잭션(transaction) 관리 응용 프로그램의 개발을 위한 인터페이스 제공 기타 데이터 사용 권한이나 보안 기능

12 멀티미디어와 데이터베이스 데이터베이스 시스템의 종류 (1) 관계 데이터베이스(Relational DataBase) 시스템
데이터를 테이블 (table) 형태의 관계로 표현하는 시스템 Codd에 의해 1970년대 초에 제안되었던 방법 현재 데이터베이스 주류 시스템들(Oracle®, SQL Server™, DB2® 등) 기반이 된 모델 SQL(Structred Query Language)라는 표준 언어를 통해 데이터베이스 시스템에 데이터 추가, 삭제, 검색 그리고 관리 등의 일을 수행 ISO에서 표준 관리

13 멀티미디어와 데이터베이스 (2) 객체지향 데이터베이스 (Object-Oriented DB) 시스템
데이터를 속성 (attribute)와 메소드 (method)를 가진 객체(object)로 표현한 모델 표준화 단체: ODMG (Object Database Management Group) 질의 언어: 관계 데이터베이스 시스템의 SQL를 기반으로 한 OQL (Object Query Language) (3) 객체-관계 데이터베이스 (Object-Relational DB) 시스템 관계 모델에서 객체형 모델 특징의 일부를 수용한 시스템 테이블에 객체 같은 복합형 데이터 타입 저장 가능 현재 주류를 이끌고 있는 데이터베이스 시스템은 객체-관계형 속성을 지원

14 멀티미디어와 데이터베이스 멀티미디어 데이터베이스시스템 필요성 관리하고 싶은 데이터로 멀티미디어 자료 증대
기존 데이터베이스 시스템 변화 필요 기존의 의미를 가진 텍스트 위주의 효율적인 저장 및 관리 중점적인 방법으로 멀티미디어 데이터 관리의 어려움 멀티미디어 데이터 특성 지원할 수 있는 시스템 고려 기존의 데이터보다 훨씬 큰 데이터 용량 하나의 요구사항 처리에 걸리는 시간 증대 저장 능력, 네트워크 대역폭 (bandwidth) 고려 데이터 타입에 적합한 입출력 방법 및 검색방법 상호작용 가능한 대화형 인터페이스 정보에 따른 고유한 검색 방법, 색인 생성 방법

15 멀티미디어와 데이터베이스 일반 데이터베이스에서 멀티미디어 저장 관계 데이터베이스 시스템
대용량 데이터를 위하여 가변 길이 애트리뷰트 지원 최대 길이 명시 후 그 안에서의 가변 길이 애트리뷰트 지원 ex) CHARACTER, CHARACTER VARYING(N) BIT, BIT VARYING(N) 이진 대용량 객체(Binary Large Object : BLOB) 일반적인 관계 데이터베이스 언어들은 멀티미디어 데이터 타입에 대한 연산을 직접 제공하지 않음 사용자 정의 함수 기능 제공: 멀티미디어 데이터 타입별 연산을 정의하여 데이터베이스 언어 내에서 사용할 수 있음

16 멀티미디어와 데이터베이스 객체지향 데이터베이스 시스템 복잡한 객체를 쉽게 모델링 가능
새로운 데이타 타입 및 연산을 쉽게 정의, 확장성 용이 상속 (inheritance) : 객체의 재사용 용이 캡슐화 (encapsulation) : 독립적인 메소드 변경 용이 다양한 트랜잭션 형태 지원에 대한 고려 장기 트랜잭션 (long transaction) 내포된 트랜잭션 (nested transaction) 프로그래밍 언어와 결합 용이

17 멀티미디어와 데이터베이스 객체-관계 데이터베이스 시스템 관계 데이터베이스와 객체지향 데이터베이스의 장점을 모두 가지고 있음
SQL99 객체-관계 데이터베이스 기능을 수용 객체지향 모델 및 멀티미디어 데이터 타입 지원 예) CREATE TYPE 명령어: 사용자 정의 데이터 타입 생성 가능

18 멀티미디어 데이터베이스시스템 개요 멀티미디어 데이터베이스시스템 개념 멀티미디어 데이터베이스
멀티미디어 데이터 타입 자료들의 모임 멀티미디어 데이터베이스 시스템 (MMDBMS) 멀티미디어 데이터 자료들을 효율적으로 저장하고 관리 및 유지할 수 있는 소프트웨어

19 멀티미디어 데이터베이스시스템 개요 멀티미디어 데이터베이스 시스템 기능 멀티미디어 데이터 타입의 지원 다양한 질의 형태 처리
일반적인 데이터베이스에서의 데이터 타입 지원 멀티미디어 데이터 타입별 특징 (데이터 형태, 가능한 연산)등을 지원 및 처리 다양한 질의 형태 처리 정형화된 속성-기반 (formatted attribute-based), 내용-기반 (content-based) 그리고 설명-기반 (description-based) 질의 등 다양한 방식 지원

20 멀티미디어 데이터베이스시스템 개요 멀티미디어 데이터 저장 기타 멀티미디어 정보의 특성을 고려한 기능 추가
대용량 데이터의 유지 관리, 신속한 검색 등이 가능한 저장 구조와 접근 방법 기타 멀티미디어 정보의 특성을 고려한 기능 추가 데이터 타입의 특성에 맞춘 대화형 데이터 입출력 예) VOD (Video On Demand) 서비스를 제공한다면 대화형 인터페이스는 중요한 부분 멀티미디어 특성에 맞는 기능 부가 예) VOD 서비스를 위해서는 재생, 정지, 일시 중지, 앞으로/뒤로 등의 연산 기능이 필요 멀티미디어 응용 프로그램 개발 도구 및 환경 제공

21 멀티미디어 데이터베이스시스템 개요 멀티미디어 데이터베이스시스템 구조
일반적인 데이터베이스 구조: 3 계층 (3-Layer) 구조

22 멀티미디어 데이터베이스시스템 개요 3 계층 구조 내부 레벨 (Internal level)
물리적 레벨 (Physical level)이라고도 함 데이터베이스의 물리적인 저장소에 대한 스키마 정의 데이터를 실질적인 저장소에 어떻게 저장 및 관리하고 성능을 향상시킬 것인가에 대해 관심 대부분 사용자 및 관리자들은 물리적인 구조에 대해 많은 지식을 가지고 있지 않는 편

23 멀티미디어 데이터베이스시스템 개요 개념적 레벨 (Conceptual level) 외부 레벨 (External level)
논리적 레벨 (Logical level)이라고도 함 어떤 데이터들이 저장되고, 이들간의 어떤 관계를 가지는 지에 대한 스키마 정의 저장 및 관리하는 데이터베이스 전반에 대한 논리적인 구조에 관심 일반적으로 데이터베이스 관리자들에게 보여짐 외부 레벨 (External level) 데이터베이스의 최종 사용자에게 보여주는 레벨 사용자들에게 데이터를 어떠한 형태로 보여줄 것인지에 대해 관심 데이터를 원하는 사용자에게 보여짐 사용자는 DBMS 내부 또는 개념적 구조에 대한 지식이 없어도 가능

24 멀티미디어 데이터베이스시스템 개요 멀티미디어 데이터베이스시스템 구조 내부 레벨 (Internal level)에서 고려사항
데이터 크기와 타입별 특성에 맞는 저장 시스템 시스템 부하와 네트워크 트래픽을 최소화하면서 응답시간 (response time)을 빠르게 하는 방법 용량이 큰 데이터의 입출력 성능을 고려한 저장방법 (필요에 따라 하나의 데이터를 분리 저장) 실시간 데이터 흐름을 위한 일정한 데이터 전송 (예. 텍스트와 동영상이 분리 저장되어 있고 이것을 내용적으로 일치되도록 전송할 경우) 개념적 레벨 (Conceptual level)에서 고려사항 개념적으로 잘 구조화할 수 있는 데이터 모델 필요 객체 지향, 객체-관계 모델 또는 새로운 데이터 모델 멀티미디어 데이터에 대한 정보를 관리 유지하는 메타데이터 (metadata)

25 멀티미디어 데이터베이스시스템 개요 외부 레벨 (External level)에서 고려사항
상호작용 가능한 대화형 인터페이스 사용자 질의 인터페이스: QBE, SQL {QBE, SQL에 대한 내용은 뒤에서 설명} 출력 인터페이스 데이터 타입별 적합한 출력 인터페이스 고려 텍스트, 오디오, 이미지, 동영상 별로 사용자에게 다른 방식으로 보여줄 필요 3계층 구조의 형태를 뿐만 아니라 사용하고자 하는 멀티미디어 어플리케이션의 특성에 따라 변화 가능성 예) 데이터를 분산하여 저장 및 처리하는 스키마를 정의하는 분산 레벨 (Distributed level)이 있을 수 있음

26 멀티미디어 정보 검색 질의 형태 및 검색 방법 정형화된 속성-기반 질의 (Formatted attribute-based query) 전통적인 데이터베이스시스템의 질의 형태 숫자/문자 형태의 데이터 타입에 적절한 질의 이미지, 오디오, 동영상 타입을 이용한 질의는 할 수 없음 예) 2004년도에 입학한 학생들의 이름을 검색하라 이름 입학년도 학번 전공 백두산 2004 전산 한라산 1997 973689 화학 설악산 물리

27 멀티미디어 정보 검색 설명-기반 질의 (Description-based query)
용량이 큰 원시 데이터(문서, 이미지, 오디오, 동영상 타입)에 설명을 추가하는 방법 예) 이미지 파일에 관련된 키워드 (Keyword)를 부가 위성사진 파일 – 지역, 촬영시기 등 설명 추가시 고려사항 같은 이미지 데이터라고 할지라도 사용자마다 다르게 판단할 수 있음

28 멀티미디어 정보 검색 내용-기반 질의 (Content-based query)
원하는 데이터의 내용의 특징을 조건으로 질의하는 방법 텍스트-기반에서 할 수 없는 질의 및 검색 가능 시스템이 저장된 멀티미디어 데이터 내용에서 특징을 분석하고 검색할 수 있는 메커니즘을 사용 예) 파도 소리가 나는 오디오 파일을 검색하라 하늘을 배경으로 하는 이미지 파일을 검색하라

29 멀티미디어 정보 검색 질의 및 검색 방법 비교 구 분 검 색 방 법 정형화된 속성-기반
구 분 검 색 방 법 정형화된 속성-기반 - 관계 데이터베이스에서의 테이블형태와 같은 구조화된 데이터에서 속성 값을 이용하여 검색 - 속성 값들의 인덱스를 활용 설명-기반 - 원시 데이터에 대한 사용자에 의해 부여된 부가정보를 이용하여 검색 - 부가정보 값들의 전문(full-text) 색인어를 활용 내용-기반 - 원시 데이터의 특징을 시스템에서 자동적으로 분석 및 추출하여 검색 - 내용/특징을 분석 및 검색할 수 있는 자동화된 메커니즘 필요 - 매체에 따라 적절한 인식(recognition) 기술 필요 - 매체에 따라 검색 질의 분류

30 멀티미디어 정보 검색 메타데이터 (Metadata)
개념: 관심 대상이 되는 데이터를 설명하기 위한 데이터 (literally “data about data”) 메타데이터의 역할 관리하는 데이터를 표현하는 수단 데이터를 이해하기 위한 방법 예) 텍스트: 폰트, 크기, 색, 효과, 스타일 등 - 무궁화 꽃이 피었습니다. - 궁서체, 18pt, 파란색, 기울임꼴, 밑줄 저장되어 있는 데이터를 찾아내기 위한 질의처리 수단 메타데이터를 통해 원래 데이터를 효율적으로 찾을 수 있는 인덱스 역할

31 멀티미디어 정보 검색 메타데이터의 종류 내용-독립적인 (Content-independent) 메타데이터
데이터의 내용에 의존하지 않는 정보 예) 문서파일의 소유자, 최초 작성일자, 저장위치 내용-의존적인 (Content-dependent) 메타데이터 데이터 내용과 관련된 정보 예) 내용과 직접 관련된 메타데이터: 전자문서의 색인 데이터의 내용을 설명하는 메타데이터: 영화 동영상에 대한 작품 정보(감독, 배우, 장르, 줄거리 등)

32 멀티미디어 정보 검색 메타데이터 생성 방법 사람에 의한 수동(manual) 생성 생성 작업에 많은 시간과 노력이 필요
미디어 데이터를 분석하여 이에 적합한 메타데이터 생성하고 시스템에 저장하는 방법 예) 구조화되지 않거나 준-구조화 (Semi-structured)된 문서의 구조 분석, 정지영상의 내용물들을 추가하는 것, 동영상에서 주요 장면이나 의미 있는 부분을 찾는 것 미디어 데이터의 특징에서 유추되는 부가적인 정보를 추가하는 방법 정보추가를 위해 데이터에 대한 배경지식이 필요 예) X-Ray를 찍은 사람의 흉부 이미지에 대한 전문의의 분석 정보

33 멀티미디어 정보 검색 시스템에 의한 자동생성 데이터 생성시 또는 저장을 하면서 시스템이 필요한 메타데이터를 자동으로 생성하는 방법 예) 디지털카메라로 촬영한 데이터의 경우 촬영 시기 (생성시간): :24 파일 크기: 1024KB 가로, 세로 규격: 8 X 6 cm2 이미지 포맷 규격: JPEG 기타

34 멀티미디어 정보 검색 전통적인 데이터베이스에서의 메타데이터 데이터베이스 스키마와 관련된 제약조건들에 대한 설명
데이터베이스 스키마와 관련된 제약조건들에 대한 설명 예) 관계형 데이터베이스의 테이블 (table) 이름 크기 생성정보 (생성자, 날자 등) 접근권한 속성 (attribute) 구성 (이름, 타입, 조건) 기타

35 멀티미디어 정보 검색 멀티미디어 데이터베이스에서의 메타데이터 각 매체 특성에 맞는 메타데이터 구조와 분류 방식 필요
원시 데이터 그 자체만으로 데이터의 의미를 이해하기 어려움 예) 한 편의 드라마에서 특정 장면이 나오는 부분을 검색하고자 할 경우 그것에 대한 설명 필요 저장된 멀티미디어 데이터 변화에 따른 관련 메타데이터와 인덱스 일치화 메카니즘

36 멀티미디어 정보 검색 멀티미디어 데이터 검색 텍스트 문서(text document) 검색 검색시 고려사항
같은 개념, 의미에 대해 사람마다 다르게 표현 단어가 문맥에 따라 다른 의미를 가짐 (polysemy) 다른 단어지만 문맥에서 같은 의미를 가짐 (synonymy) 텍스트에서 자주 사용하지만 의미에는 영향을 주지 않는 단어 (stop word) Stop word는 검색시 보통 삭제하거나 무시함

37 멀티미디어 정보 검색 질의 검색 방법: 텍스터 문서에 대한 메타데이터와 그 색인을 바탕으로 최적의 문서를 검색하는 방법
벡터 모델 (Vector model) 질의조건과의 유사도(similarity)가 높은 데이터 검색 검색조건과 메타데이터 정보 관계성을 기반 예) “관계형 데이터베이스, 객체지향성 데이터베이스, 저장시스템” 불리언 모델 (Boolean model) 검색 조건을 포함하거나 포함하지 않는 조건을 만족하는 데이터 검색 검색이 유사성이 아닌 조건 만족(참, True) 또는 불만족(거짓, False) 판정을 기반 예) “((관계형 데이터베이스 OR 객체지향형 데이터베이스) AND 저장시스템)”

38 멀티미디어 정보 검색 정지영상 데이터 검색 정지영상에 대한 메타데이터 활용
사람에 의해서 개념적인 설명을 추가하고 이를 이용하여 검색하는 방법 예) ‘모나리자’ 이미지에 대해 아래와 같은 메타정보를 저장해두고 검색에 활용 작가: 레오나르도 다빈치 종류: 유채 패널화 제작년도: 1503~1506년 원본소장: 루브르미술관 특징: 레오나르도 다 빈치가 피렌체의 부호(富豪) 프란체스코 델 조콘다를 위해 그 부인인 엘리자베타 (Elisabetta)를 그린 초상화로 눈썹이 없는 것을 유명 간단하고 쉬운 검색 방법이지만 표준적인 이미지 설명 방법은 없음

39 멀티미디어 정보 검색 이미지가 가지는 특징 (Feature)을 활용한 검색 색상 (Color)을 기준으로 한 검색
이미지에 대한 색상 히스토그램 분석을 통해 유사성 (similarity)이 있는 정보 검색 색상 히스토그램: 이미지 색상에 대한 그래프, 일반적으로 RGB로 표현을 많이 함

40 멀티미디어 정보 검색 질감 (Texture)을 기준으로 한 검색
질감의 유사성을 분석하여 정보 검색하는 방법 질감 (texture): 이미지를 접했을 때 느낄 수 있는 특정 재질의 특성 예) 금속, 나무, 벽돌, 바위, 모래 등 모양 (Shape) 또는 외형 (Appearance)을 기준으로 한 검색 주어진 모양 또는 형태와 유사한 이미지를 검색하는 방법 예) 별 모양을 가진 이미지를 검색하라 위치 (Spatial location)를 기준으로 한 검색 이미지 내용들의 위치적인 관계를 이용한 검색 방법 예) 사람 옆에 개가 있는 이미지를 검색하라

41 멀티미디어 정보 검색 동영상 데이터 검색 질의동영상 정보를 검색하기 위해서는 동영상 자료에 대한 메타데이터를 미리 생성하고 이를 이용한 검색 방법 질의-기반, 내용-기반, 설명-기반 질의 지원 동영상 데이터를 분할하고 이에 맞는 메타데이터를 부여 예) 동영상 구조 동영상 데이터: 제목, 파일 크기, 재생 시간, 생성 시간 등 신 (scene) 데이터: 주제, 재생시간, 시작/종료 프레임 번호, 키워드 등 샷 (shot) 데이터 프레임 (frame) 데이터 신(scene): 화면 내용이 같은 주제를 공유하는 shot들의 단위 집합 샷(shot): 연속적으로 이어지는 필름 이미지, 비디오를 생산(production), 표현(representation), 색인(index) 하는데 기본적 단위

42 멀티미디어 질의 처리 멀티미디어 질의처리 과정 일반적인 데이터베이스 시스템 멀티미디어 데이터베이스 시스템 구문 해석
질의 최적화 멀티미디어 데이터베이스 시스템 다양한 질의 인터페이스 멀티미디어를 위한 검색 도구 적합성 피드백 검색된 결과가 사용자의 의도에 일치할 확률이 적음 반복적 질의 처리 구조 질의 정제 (query refinement) 순서화된 결과 (ranked result)의 제공 도메인 지식 (domain knowledge) 질의 처리 조건 각각에 대한 가중치

43 멀티미디어 질의 처리 예) 데이터베이스 시스템에서 질의처리 과정 질의 명세 입력 및 수정 질의 생성 질의 처리 질의 결과 생성
대화식 질의 도구 질의 생성 API 질의 처리 질의 해석 질의 최적화 질의 수행 질의 결과 생성 멀티미디어를 위한 검색 도구 질의 명세 입력 및 수정 순서화된 결과 (ranked results) 현장 지식 가중치 및 불확실성 요소 얻어진 결과로부터 새로운 질의 명세를 위한 피드백 (a) 기존 데이터베이스 시스템 (b) 멀티미디어 데이터베이스 시스템

44 멀티미디어 질의 처리 SQL99 질의어 (Query language) 질의 방법
사용자가 데이터를 저장하고 있는 시스템에서 원하는 데이터를 검색하기 위한 언어 질의 방법 객체-관계형 데이터 모델을 지원하도록 기존의 SQL을 발전시킨 형태의 ISO/IEC 국제표준 대용량 데이터를 저장하는 방법이 제안됨 SQL/MM (Multimedia and Application Packages) 멀티미디어 데이터 검색을 위한 SQL 확장 형식 QBE (Query By Example) 방식 적용 주어진 예제를 통해 원하는 데이터 검색하는 방법

45 멀티미디어 질의 처리 SQL99에서의 대용량 데이터 저장 LOB (Large Object) 데이터 타입 지원
CLOB (Character large object)와 BLOB (Binary large object) 두 가지 형태로 구분 테이블에 객체 형태 저장 지원 객체에 사용자 정의 타입 (User-defined type) 저장 가능 사용자 정의 타입으로 대용량 데이터 저장 가능

46 멀티미디어 질의 처리 상용제품(예. Oracle)에서 SQL99 지원
오라클에서 제공하는 데이터 타입 데이터베이스 시스템 내부 저장: BLOB, CLOB, NCLOB 데이터베이스 시스템 외부 저장: BFILE BFILE 컬럼에는 운영체계의 파일시스템에 저장되어있는 파일의 포인터(참조 위치) 정보를 저장 이 름 최대크기 설 명 BLOB 4 GB 바이너리 형식 데이터 저장 CLOB 문자 형식 데이터 저장 NCLOB 다국어 문자 형식 데이터 저장 BFILE 운영체계 상의 파일시스템에 데이터 저장

47 멀티미디어 질의 처리 SQL/MM 멀티미디어를 검색 목적의 SQL로 ISO 하위그룹(ISO/IEC JTC/SC32)에서 표준 작업 SQL/MM의 주요 구성(Part) 구성 1: 프레임 워크 (Framework) SQL/MM 구성 요소에 대한 일반적인 개념 설명 구성 2: 텍스트 (Full-text) 단어(word)나 구(Phrase) 등을 이용하여 검색하기 위한 언어 구성 3: 공간 (Spatial) 점, 곡선, 평면 그리고 이들의 집합과 같은 공간 데이터에 대한 검색 언어 구성 5: 이미지 (Still image) JPEG 같은 이미지를 검색하기 위한 언어

48 멀티미디어 질의 처리 예) FULLTEXT Part 2의 텍스트를 위한 사용자 정의 타입의 하나
텍스트 문서를 저장하고 검색할 수 있는 메소드를 가짐 테이블 생성: CREATE TABLE text_document ( document_ID INTEGER, document FULLTEXT) 질의문: SELECT document_ID FROM text_document WHERE document.CONTAINS(“SQL/MM”) = 1

49 멀티미디어 질의 처리 QBE 방식 적용 QBE (Query by example)은 미국 IBM에서 70년대 개발한 관계 데이터베이스 질의 사용자가 화면상의 테이블을 통해 필드의 조건을 입력하여 정보를 검색하는 방법 이점: SQL 같은 질의어를 배우지 않아도 쉽게 검색 가능 멀티미디어 데이터를 쉽게 검색하기 위해서 예제 조건을 입력하여 검색하는 방식 상호작용 가능한 대화형 인터페이스에 적용 가능 예) 질감(Texture)를 기준으로 한 이미지 검색 주어지는 질감 예제 중 선택하여 이와 유사한 이미지를 검색하게 하는 방법

50 멀티미디어 질의 처리 멀티미디어 트랜잭션 관리 트랜잭션 (Transaction) 트랜잭션의 조건: ACID
데이터베이스 시스템에서 질의처리는 트랜잭션을 단위로 처리 트랜잭션을 관리하기 위해서 병행 수행되는 트랜잭션을 제어 (concurrency control)와 회복 (recovery) 기법이 필요 트랜잭션의 조건: ACID 원자성 (Atomicity): 전체가 다 수행되거나, 아무것도 수행되지 않음 일관성 (Consistency): 실행이 완료된 이후에 모든 일관성 조건 만족해야 함 고립성 (Isolation): 실행되는 트랜잭션은 병행수행 되는 다른 트랜잭션으로 부터 영향을 받지 않음 지속성 (Durability): 완료된 트랜잭션의 결과는 보존되어야 함

51 멀티미디어 질의 처리 멀티미디어 데이터베이스 시스템에서의 트랜잭션 특징 트랜잭션 시간이 길어짐에 따른 문제점
멀티미디어 데이터가 대용량이고 복잡하여 트랜잭션의 연산시간이 길어짐 트랜잭션 시간이 길어짐에 따른 문제점 트랜잭션 작업 취소에 따른 복귀 (rollback) 비용이 비싸짐 자원 경합이 있어 작업 대기시간이 길어지고, 교착상태 (deadlock)이 발생할 수 있음 장기 트랜잭션의 처리방법 내포된 트랜잭션 (nested transacton) 직렬화 가능성 (serializability) 조건을 응용 특성에 맞게 완화하여 수행

52 멀티미디어 데이터베이스시스템 사례 프로그래밍 예제
JSP/서블릿을 이용하여 Oracle에 BLOB 형태로 저장된 정지영상을 웹 브라우저에서 보여주는 예제 환경 웹 서버/서블릿 컨테이너: Tomcat JDBC 데이터베이스: Oracle 클라이언트 서버 웹 서버 웹 브라우저 서블릿 컨테이너 데이터베이스 JDBC

53 멀티미디어 데이터베이스시스템 사례 화면 예)

54 멀티미디어 데이터베이스시스템 사례 IBM QBIC (Query By Image Content)

55 멀티미디어 데이터베이스시스템 사례 예) 러시아 에미르타주(Hermitage) 박물관미술 작품 검색
색상을 조건으로 하는 내용-기반 질의 환경

56 멀티미디어 데이터베이스시스템 사례 Oracle 데이터베이스시스템 멀티미디어 데이터 저장 및 활용할 수 있는 인터페이스 제공
기존 데이터베이스 시스템은 멀티미디어 데이터 타입을 저장하면서 관련된 메타데이터를 구성하는 방식 사용

57 멀티미디어 데이터베이스시스템 사례 멀티미디어 어플리케이션 적용 예
미국 뉴 멕시코주 교통부 도로 관리 응용을 위해 Oracle 데이터베이스 시스템을 이용 총 5TB 크기의 이미지 데이터베이스 관리 도로 50피트(feet) 간격의 이미지: 약 5,000,000개의 JPEG 각 이미지에 대한 메타데이터 활용 뉴 멕시코주의 도로 정보 관리 유지 차량 운전자를 위한 가상 드라이브 정보 제공

58 요약 멀티미디어 데이터를 데이터베이스 시스템에 저장하기 위해서는 다음을 고려해야 한다
멀티미디어의 어떠한 특성을 고려해야 하는지 멀티미디어 데이터베이스 시스템이 어떠한 것인지 멀티미디어 데이터베이스 시스템이 갖추어야 할 기능과 구조 멀티미디어 데이터베이스 시스템에서 멀티미디어 데이터에 대한 질의처리에는 다양한 방법이 있다 -> 멀티미디어 종류별 각 방법에 맞는 적당한 검색 알고리즘 개발이 필요함.


Download ppt "제 8장. 멀티미디어 데이터베이스 및 정보검색 시스템"

Similar presentations


Ads by Google