11.멀티미디어 정보검색 모델과 언어 목차 11.1 소개 11.2 데이터 모델링 11.3 질의어 11.4 연구 동향 및 쟁점 11.멀티미디어 정보검색 모델과 언어 목차 11.1 소개 11.2 데이터 모델링 11.3 질의어 11.4 연구 동향 및 쟁점 11.5 참고 문헌 고찰 최신정보검색론 Chapter 11
11. 1 소개 : 다양한 자료들을 다루어야 한다 멀티미디어 정보 시스템의 중요 특징 데이터 검색 매우 복잡한 구조의 객체에 대한 기본 자료 모형, 질의어 ,접근법, 저장법이 지원 되야 한다. 데이터 검색 : 데이터 속성 뿐만 아니라 멀티미디어 객체의 내용을 이용 사용자 요구 효율적 검색 하는것이 멀티미디어 정보 검색 시스템의 주 목표 최신정보검색론 Chapter 11
11. 1 소개(계속) 데이터 검색에 기본단계 멀티미디어, 전통적 정보검색 시스템차이 - 질의 명세 : 사용자가 자신의 요구 명시 - 질의 처리 및 최적화 : 시스템 내부 표현 생성시 가장 좋은 평가 계획 수립 하도록 질의 최적화 - 질의 응답 : 검색 객체 연관성의 역순으로 제시 - 질의 반복 : 사용자가 만족할때 까지 반복 멀티미디어, 전통적 정보검색 시스템차이 - 멀티미디어 객체는 전통적인 정보 검색 시스템이 다루는 텍스트 데이터 구조보다 복잡 - 객체 검색은 유사도에 의지, 검색된 객체들은 유사도 순으로 정렬 사용자에게 보여짐 최신정보검색론 Chapter 11
11. 2 데이터 모델링 멀티미디어 데이터와 일반데이터의 차이 정보 검색 시스템의 관점에서 데이터 모델링의 문제점 - 스키마에 의해서 제공된 속성으로 표현될 수 없다 - 멀티미디어 데이터는 대량의 메모리가 요구 정보 검색 시스템의 관점에서 데이터 모델링의 문제점 - 자료형과 멀티미디어 자료형을 함께 지원할수 있어야 한다. - 멀티미디어 데이터를 시스템 내에 어떻게 표현할 것인가 최신정보검색론 Chapter 11
11. 2. 1 상용 DBMS에서 멀티 미디어 데이터 지원 상용 DBMS에서 가변 길이 자료형을 다루는 방법은 표준화 가 안됨 (각각의 회사들은 가변길이 자료형을 서로 다른 이름으로 부름, 가변 자료형 연산도 틀림) DBMS는 데이터 내용에 관한 해석 제공 안함, 자료형들이 매우 제한적, DBMS에서 제공되는 내장 함수로 수행할 연산 매우 단순 SQL3 : 일반 객체 지향 환경에서처럼 복잡한 객체 모델링하도록 관계형 모델 확장한 언어 표준 최신정보검색론 Chapter 11
11. 2. 1 상용 DBMS에서 멀티 미디어 데이터 지원(계속) 상용 SQL3에 종류 - 데이터 커트리지(ORACLE) - 데이터 블레이드(ILLUSTRA) 객체 관계 기술과 확장타입 시스템 - La Scala 아카이브 연구과제 (Oracle 기술인 Teatro alla Scala의 멀티 미디어 아카이브 개발하는것) 최신정보검색론 Chapter 11
11. 2. 2 MULTOS 데이터 모델 MULTOS - 고급 문헌 검색이 가능한 멀티미디어 문헌 서버 - 클라이언트/서버구조에 바탕 - MULTOS 데이터 모델은 고수준의 개념 표현 가능 최신정보검색론 Chapter 11
11. 2. 2 MULTOS 데이터 모델(계속) 그림 11.1은 타입 Generic_Letter의 개념 구조이며, 노드 Letter_Body는 스프링 컴포넌트 타입이다. 그림 11.2는 타입 Business_Product_Letter의 완전한 개념 구조이며, 그림 11.1의 Letter_Body를 복잡한 개념 요소로 명시화 함으로써 만들어진 것이다. 이 개념 요소는 다섯 개의 개념 요소를 포함하는 집합이다. 개념모델에 따라서 문헌 타입 Business_Product_Letter는 is_a 관계로 문헌 타입 Generic_Letter와 연결된다. 예에서 구성 요소 Receiver에 붙은 + 기호는 여러 개의 값을 가지고 있음을 의미하며, Name과 Address는 개념 요소 Receiver와 Sender를 루트로 하는 두 서브트리 내에 있다. 최신정보검색론 Chapter 11
11. 3 질의어 멀티미디어 질의 설계 고려사항 사용자는 자신의 요구를 어떻게 시스템에 입력할 것인가? 사용자는 멀티미디어 객체에 관한 어떤 조건을 요구로 명시할 것인가? 불확실성 정도, 유사도, 가중치는 어떤 방법으로 질의어 설계에 반영되나 최신정보검색론 Chapter 11
11. 3. 1 요구 명세 - 브라우징과 항해에 기반 객체 질의 위한 두 종류의 인터페이스 질의의 명시 두가지 - 질의에 기반 - 특졀한 질의어(전통적인 데이터에 사용) - 예제 기반 질의 방법(이미지와 오디오 데이터에 유용) 최신정보검색론 Chapter 11
11. 3. 2 멀티미디어 데이터에 대한 조건들 질의 술어 세가지 그룹 - 속성 술어 : 멀티 미디어 객체의 속성 11. 3. 2 멀티미디어 데이터에 대한 조건들 질의 술어 세가지 그룹 - 속성 술어 : 멀티 미디어 객체의 속성 - 구조적 술어 : 고려되어야 할 데이터의 구조 - 의미적 술어 : 포함된 데이터의 의미와 구조화되지 않은 내용 최신정보검색론 Chapter 11
11. 3. 3 질의 표현 내의 불확실성과 근접성 및 가중치 검색된 객체의 연관성 정도 명시 방법 - Nomal, unacceptable, typical과 같이 부정확한 용어를 사용 - 특정한 근접 술어를 명시 - 각각의 조건 혹은 용어에 가중치 부여 최신정보검색론 Chapter 11
11. 3. 4 몇 가지 제안 SQL질의어 장점 - 멀티미디어 응용에 적합한 인터페이스 언어로 사용 - 함수와 저장된 프로시듀어 - 활동 데이터베이스 기능 장점 - 멀티미디어 응용에 적합한 인터페이스 언어로 사용 - 외부 함수와 사용자 정의 데이터 타입들을 다루는 능력은 복잡한 구조를 가진 멀티미디어 객체 다루도록 함 - 데이터 베이스의 일관성이 유지 최신정보검색론 Chapter 11
11. 3. 4 몇 가지 제안(계속) 단점 - 어떤 정보 검색 기술들도 SQL3 질의 처리기와 통합 될수 없다. - 객체들은 순위화 되지 않고, 하나의 집합으로 응용에 반환 - 사용자가 색인 기술을 알아야 한다. 최신정보검색론 Chapter 11
11. 3. 4 몇 가지 제안(계속) MULTOS 질의어 : 개발의 이유 - 문헌 구조를 통해 쉽게 항해할 수 있어야 함 - 복잡한 구성 요소에 대한 질의 술어들이 반드시 지원되어야 함 최신정보검색론 Chapter 11
11. 3. 4 몇 가지 제안(계속) - MULTOS 질의 형식 FIND DOCUMENTS VERSION version-clause SCOPE scope-clause TYPE type-clause WHERE condition-clause WITH component MULTOS가 지원하는 술어 - 데이터 속성에 관한 술어 - 텍스트 구성 요소에 관한 술어 - 이미지에 관한 술어 최신정보검색론 Chapter 11
11. 3. 4 몇 가지 제안(계속) 보기2 FIND DOCUMENT VERSIONS LAST WHERE Document.Date > 1/1/1998 AND (*Sender.Name = "Olivetti" OR *Product_Presentation CONTAINS "Olivetti")AND *Product_Description CONTAINS "Personal Computer" AND (*Address.Country = "Italy" OR TEXT CONTAINS "Italy") AND WITH *Company_Logo. 최신정보검색론 Chapter 11
11. 3. 4 몇 가지 제안(계속) FIND DOCUMENT VERSIONS LAST WHERE (Document.Date BETWEEN (12/31/1998, 1/31/98) PREFERRED BETWEEN (2/1/1998, 2/15/98) ACCEPTABLE) HIGH AND (*Sender.Name = "Olivetti" OR *Product_Presentation CONTAINS "Olivetti") HIGH AND (*Product_Description CONTAINS "Personal Computer") HIGH AND (*Product_Description CONTAINS "good ergonomics") LOW AND (*Address.Country = "Italy" OR TEXT CONTAINS "Italy") HIGH AND WITH *Company_Logo HIGH (IMAGE MATCHES screen HIGH keyboard HIGH AT LEAST 2 floppy_drives LOW) HIGH 최신정보검색론 Chapter 11
11. 4 연구동향 및 쟁점 DBMS 정보 검색 기술 통합 멀티 미디어 데이터 모델 정의할때 발생하는 문제 멀티 미디어 데이터 내용 내부적적으로 표현하는 기능 최신정보검색론 Chapter 11