Semantic Web 의 개요와 활용방안 2004 년 5 월 동아대학교 경영정보과학부
2 차례 I. 시맨틱 웹의 개요 II. 시맨틱 웹의 구조와 활용 III. 결론
3 I. 시맨틱 웹의 개요 현재의 웹 시맨틱 웹의 등장배경 시맨틱 웹의 탄생 시맨틱 웹의 정의 컴퓨터가 이해할 수 있는 의미 ? 웹의 진화방향 HTML vs Semantic Web
4 현재의 웹 ? 사용자의 클릭을 통한 웹 네비게이션 검색 엔진을 이용한 정보소재 파악 HTML 을 사용하여 작성한 수많은 자료들은 정보를 잘 포장하여, 웹을 보는 “ 사람 ” 이 읽고 작업하기 편하도록 만들어짐 개 요개 요
5 Semantic Web 의 등장배경 사람뿐만 아니라 자동화된 프로그램, 즉 “ 기계 ”(Agent) 가 사람을 대신하여 웹 상의 정보를 읽고 작업하고 나아가 이를 가공하여 새로운 정보를 만들어 낼 수 있도록 한다 전제조건 : Agent 를 실현하기 위해서는 웹 상의 정보가 사람 눈이 아니라 컴퓨터 프로그램이 이해하기 쉬운 “ 의미 ” 즉 Semantic 을 가지고 있어야 한다. ※ 스프레드 시트로 전달된 자 료가 다른 정보 형태로 손쉽게 변환되거나 처리될 수 있다. [ 그림 ] Fax vs. Spread Sheet Program 개 요개 요
6 Semantic Web 의 탄생 인터넷의 역사 1989 Tim Berners-Lee 에 의해 창시 1991 년 일반에 공개 1994 년 10 월 Tim Berners-Lee 의 주도로 MIT 와 공동으로 W3C 설립 웹의 다음 단계의 발전 …?! "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." Tim Berners-Lee, James Hendler, Ora Lassila The Semantic Web, Scientific American, May 2001 "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." Tim Berners-Lee, James Hendler, Ora Lassila The Semantic Web, Scientific American, May 2001 개 요개 요
7 Semantic Web 정의 “ 컴퓨터가 정보의 의미를 이해하고 의미를 조작할 수 있는 웹 ” 웹에서 정보 리소스 (URI) 들 사이의 연관성을 잘 표현해 준다면 웹에서 의미처리가 가능 이것은 마치 관계형 DB 에서 Relation 을 정의하 는 것과 같음 데이터 정보 지식 개 요개 요 연관성에이전트 추론
8 컴퓨터가 이해할 수 있는 의미 ? 문서의 각 부분을 컴퓨터가 이해할 수 있는 형 식으로 기술 (description) 사용 예 개 요개 요 고속철도를 이용하여 1 박 2 일의 관광을 할 수 있는 장소 중 가장 저렴한 관광 여행상품은 무엇인가 ? 고속철도 1박2일1박2일가장 저렴한 관광상품 Agent
9 웹의 진화 방향 개 요개 요 HTTP 현재의 웹 기반 HTML XML RDF 스스로 표현된 문서들 Proof, 로직, 온토롤지 언어 Shared terms/terminology Machine-Machine communication 신뢰할 수 있는 웹 자원들 웹의 진화방향 ( 자료 : 팀 버너스리, 네이쳐,2001)
10 HTML vs Semantic Web HTML : 보여주기 위한 웹 사람의 관점 Semantic Web : 컴퓨터가 의미를 이해할 수 있 는 웹 컴퓨터 ( 프로그램, 에이전트 ) 의 관점 개 요개 요 문서의 구성요소 문서의 내용 문서의 구조 - 비구조화 - 구조화 - 준구조화 문서의 스타일 HTML XML 문서의 의미
11 시맨틱 웹의 구성, 자원서술 XML RDF 예제, 지식 서술 RDF Spec 및 예제 Ontology 에 대하여 Ontology 계층과 다른 계층과의 관계도 Ontology 에 대한 프로젝트, 통합운용 전자상거래에 대한 시맨틱 웹의 활용 II. 시맨틱 웹의 구조 요소와 활용
12 Semantic Web 의 구성 Resource Description Framework Ontology Technique Agent Program Semantic Web 시맨틱 웹의 요소
13 계층적 구조 시맨틱 웹의 요소 시맨틱 웹의 구조 ( 자료 : 팀 버너스리, 네이쳐,2001)
14 Semantic Web 기술요소 자원서술 : 메타데이터 데이터의 형식에 대한 내용 정보검색의 향상 누구든 자유롭게 어휘의 사용을 정의 예 : 도서관의 목록카드와 같은 양식, 프로파일 등 지식 표현 (Knowledge Representation) 인공지능의 핵심분야 중 하나 정보 리소스간의 의미적 연관성 시맨틱 웹의 상호운용성 시맨틱 웹의 요소
15 자원서술 메타데이터 : 일반적으로 “ 데이터를 위한 데이터 ” 라고 정의 의미 부여를 위해서는 데이터뿐만 아니라 데이터에 대한 추론을 규정하는 규칙의 표현이 필요 시맨틱 웹에서 제시한 해결책은 웹에 수록된 정보를 기술하기 위해 메타데이터를 사용 구현 : XML(eXtensible Markup Language) + RDF(Resource Description Framework) XML 임의의 문서구조를 지정할 수 있음. 문서의 의미를 해석하는 역할을 하 지는 않음 RDF 문서의 의미를 지정하는 역할. RDF 에서는 표현하고자 하는 대상 을 * URI 를 이용하여 정의. * URI(Unifrom Resource Identifier): The generic set of all names/addresses that are short strings that refer to resources. URL(Unifrom Resource Locator): An informal term (no longer used in technical specifications) associated with popular URI schemes: http, ftp, mailto, etc. 시맨틱 웹의 요소
16 XML, RDF 예제 List of persons in company: 47782> On leave for ObjectAttributeValue Created_by #anonymous_resource name #anonymous_resource phone #anonymous_resource “John” XML 표현 예 항목이 3 개 있는 RDF description created by name phone A directed labeled graph representation 인용 Michel Klein, XML, RDF, and Relatives, IEEE Intelligent System, 2001 시맨틱 웹의 요소
17 계층적 구조 (1) - XML 시맨틱 웹의 요소 HTML 을 대체하는 차세대 웹 언어이다 ? Similar to HTML but different HTML 은 메타언어가 아닌 메타언어를 통해 만들어진 애플리케이션 XML 은 현재 가장 보편적인 메타데이터 언어 XML 의 한계 컴퓨터가 이해할 수 없다 ?
18 계층적 구조 (2) - RDF 시맨틱 웹의 요소 Resource Description Framework Is a declarative language and provides a standard way for using XML to represent metadata in the form of statements about properties and relationships of items (a Web address) on the Web. A foundation for processing metadata. Provides interoperability between applications that exchange machine-understandable information on the Web.
19 계층적 구조 (2) - RDF 시맨틱 웹의 요소 메타데이터 기술과 교환을 위한 프레임워크 메타데이터의 상호운용성 메타데이터의 상호운용성 지원 기계가 이해할 수 있는 메타데이터의 의미정의 풀 텍스트 검색보다 자원탐색에서 향상된 정확 성 실현
20 RDF Spec 과 예제 시맨틱 웹의 요소
21 Simple Explanation of Concepts <RDF xmlns=" " xmlns:dc=" "> The W3C Folio 1999 W3C Communications Team Web development, World Wide Web Consortium, Interoperability of the Web 시맨틱 웹의 요소
22 Basic RDF Basic RDF Model Examples Basic RDF Syntax Basic Serialization Syntax Basic Abbreviated Syntax Schemas and Namespaces 시맨틱 웹의 요소
23 Basic RDF Model Resources Properties Statements 시맨틱 웹의 요소
24 Resources Can be anything provided that it has a Web address. Can be anything that has a URI; the extensibility of URIs allows the introduction of identifiers for any entity imaginable. 시맨틱 웹의 요소
25 Properties A property is a specific aspect, characteristic, attribute, or relation used to describe a resource. Each property has a specific meaning, defines its permitted values, the types of resources it can describe, and its relationship with other properties. 시맨틱 웹의 요소
26 Statements RDF Statement A specific resource (subject) together with a named property (predicate) plus the value (object) of that property. The object of a statement (the property value) Can be another resource specified by a URI Can be a simple string 시맨틱 웹의 요소
27 RDF Model RDF Description Property Property Type Value URI Resource Renato Iannella, 시맨틱 웹의 요소
28 RDF Model… RDF Description Resource 1Resource 2Resource 3 Property Type1 Property Type2 Atomic Value Property Type3 Property Type4 Eric Miller, 1998 시맨틱 웹의 요소
29 RDF Example 1 Ora Lassila is the creator of the resource “ Ora Lassila ” Creator Simple node and arc diagram 주어 (Subject/Resource) 술어 (Predicate/Property) Creator 목적어 (Object/literal) “ Ora Lassila ” 시맨틱 웹의 요소
30 RDF Example 2 Ora Creator Name Property with structured value has creator something and something has name Ora Lassila and 시맨틱 웹의 요소
31 RDF Example Ora Creator Name Structured value with identifier The individual reffered to by employee id is named Ora Lassila and has the address The resource was created by this 시맨틱 웹의 요소
32 Basic RDF Serialization Syntax [1] RDF ::= [' '] description* [' '] [2] description ::= ' ' propertyElt* ' ' [3] idAboutAttr ::= idAttr | aboutAttr [4] aboutAttr ::= 'about="' URI-reference '"' [5] idAttr ::= 'ID="' IDsymbol '"' [6] propertyElt ::= ' ' value ' ' | ' ' [7] propName ::= Qname [8] value ::= description | string [9] resourceAttr ::= 'resource="' URI-reference '"' [10] Qname ::= [ NSprefix ':' ] name [11] URI-reference ::= string, interpreted per [URI]URI [12] IDsymbol ::= (any legal XML name symbol)XML name symbol [13] name ::= (any legal XML name symbol) [14] NSprefix ::= (any legal XML namespace prefix)XML namespace prefix [15] string ::= (any XML text, with " ", and "&" escaped) 시맨틱 웹의 요소
33 Using Default Namespace Syntax <RDF xmlns=" xmlns:s=" Ora Lassila Ora Lassila is the creator of the resource 시맨틱 웹의 요소
34 Abbreviated Syntax <rdf:RDF xmlns:rdf=" xmlns:s=" Ora Lassila 순서화 문법 xmlns:rdf=" xmlns:s=" <rdf:Description about= “ ” s:Creator= “ Ora Lassila ” /> 단축형 문법 시맨틱 웹의 요소
35 RDF Schema Provides a framework in which independent communities can develop vocabularies that suit their specific needs and share vocabularies with other communities. 시맨틱 웹의 요소
36 RDF Schema RDF Data Model 이 자원 간의 관계를 ERD 와 같이 간략하게 기 술하기 위한 목적이었다면, RDF Schema 는 Data Model 과 Syntax 를 이용하여 각 속성들의 특성을 정의하기 위한 메커니 즘을 제공함. XML DTD 와 XML Schema 가 XML 문서 구조에 대해 제한하는 기능을 하는 것이었다면, RDF Schema 는 RDF Data Model 에 의해 선언된 구문을 해석하여 정보를 제공하는 역할을 하는 일 종의 사전과 같은 기능을 하는 것으로, RDF 구문에서 사용되는 용어에 대해 정의하고, 그들에게 특정한 의미를 부여하는 역할 을 함. Schema 는 Property 이용에 있어서 용어를 정의하고 제한하는 기능을 하기 때문에, 같은 용어가 다른 의미로 쓰이는 중복성을 막기위해 XML 의 Namespace 기법을 이용함. 시맨틱 웹의 요소
37 Classes and Properties 시맨틱 웹의 요소
38 Classes and Properties 시맨틱 웹의 요소
39 지식 표현 문서들이 단순한 디스플레이만을 위해 사용되어서는 안 됨 데이터간의 연관관계가 잘 정의되어 있어야 함 다양한 응용영역에서 자동화되고 통합화된 데이터의 공유가 필요 구현 : Ontology 철학 온톨로지 : 존재의 본질과 유형에 관한 이론 철학 온톨로지 : 존재의 본질과 유형에 관한 이론 시맨틱 웹 온톨로지 : 특정 주제에 과한 지식용어들의 집합으로서 이들 용어뿐만 아니라 용어들 간의 의미적 연결관계와 간단한 추론 규칙을 포함 시맨틱 웹 온톨로지 : 특정 주제에 과한 지식용어들의 집합으로서 이들 용어뿐만 아니라 용어들 간의 의미적 연결관계와 간단한 추론 규칙을 포함 출처 : 강상수, 한양대학교 지능시스템 연구실, 시맨틱 웹의 요소
40 계층적 구조 (3) - Ontology 시맨틱 웹의 요소 논리적 추론을 위한 기술 지식표현을 위한 담당
41 Ontology 에 대하여 철학분야에 국한되어 사용되었으나 근래에 컴퓨터공학 분야에 적용되어 널리 사용 특히 지식공학, 지식 표현, 데이터베이스 디자인, 정보 모델링, 정보 통합 / 관리 / 조직, 에이전트 기반 시스템 등에서 널리 사용 인공지능 (AI) 학문에 있어서 Ontology 는 " 개념화의 명세 (specification of a conceptualization)" 로 정의. Ontology 는 "engineering artifact" 로 어떤 사실을 기술하기 위해 필요한 object( 객체 ) 의 집합인 "vocabulary(universe of discourse)" 와 객체들간의 관계인 relation 과 function 들의 집합으로 이루 어짐 온토로지는 객체의 집합과 객체들간의 관계의 정의에 의해 어떤 사실이나 상태를 표현하고자 하는 지식 표현 기법 출처 : 강상수, 한양대학교 지능시스템 연구실, 시맨틱 웹의 요소
42 Ontology 의 계층과 다른 계층과의 관계도 DataOntologies RulesLogic Proof Rules Data heuristic engine Search 시맨틱 웹의 요소
43 Ontology 에 대한 프로젝트 Product of the **On-to-Knowledge Project Standard for the definition and exchange of Ontology It allows the definition of classes, relationships, and the possibility of doing inference well. *OIL Semantic markup language based on OIL Previous version of the ontology language DAML-ONT. Similar to OIL RDF schema extension *** DAML+OIL **On-to-Knowledge: European Project that has goal of developing method and tools that allow to exploit the potential of ontologies in the field of knowledge management. ***DAML(DARPA( 미국방성고등계획연구국 ) Agent Markup Language): DARPA program similar in some ways to the On-To-Knowledge project. The main goal of DAML is the developing of language and tools to facilitate the implementation of the Semantic Web. *OIL: An Ontology Infrastructure for the Semantic Web. Web based ontology language. 시맨틱 웹의 요소
DAML+OIL: an Ontology Language for the Semantic Web
45 DAML+OIL Design Objectives Well designed Intuitive to (human) users Adequate expressive power Support machine understanding/reasoning Well defined Clearly specified syntax (obviously) Formal semantics (equally important) Extend existing web standards DAML+OIL is built on top of RDF(S)
46 Why Build on RDF Provides basic ontological primitives Classes and relations (properties) Class (and property) hierarchy Can exploit existing RDF infrastructure Provides mechanism for using ontologies RDF triples assert facts about resources Use vocabulary from DAML+OIL ontologies
The Cake! DAML+OIL HTML XHTML XML SMILRDF(S) DCPICS
48 Why RDF Is Not Enough Expressive inadequacy Only range/domain constraints (on properties) No properties of properties (unique, transitive, inverse etc.) No equivalence, disjointness, coverings etc. No necessary and sufficient conditions (for class membership) Poorly (un) defined semantics
49 How DAML+OIL Builds ON RDFS Extends expressive power Constraints (restrictions) on properties of classes (existential/universal/cardinality) Boolean combinations of classes and restrictions Equivalence, disjointness, coverings Necessary and sufficient conditions Constraints on properties
50 How DAML+OIL Builds ON RDFS Provides well defined semantics Meaning of DAML+OIL statements is formally specified Both model theoretic and axiomatic specifications provided Allows for machine understanding and automated reasoning
51 DAML+OIL RDF DAML+OIL ontology is a set of RDF statements DAML+OIL defines semantics for certain statements Does NOT restrict what can be said Ontology can include arbitrary RDF But no semantics for non-DAML+OIL statements
52 Well Designed(?) Intuitive to (human) users Supports common ontological idioms Adequate expressive power Extends RDF in several directions Support for machine understanding/reasoning Designed to be “implementable” No features for which it is difficult or impossible to define clear semantics (e.g., defaults) Decidable and (empirically) tractable reasoning
53 Why Automated Reasoning? Semantic web requires machine understanding (of resource descriptions) Reasoning is integral to understanding Supports design and use of ontologies Checking class consistency (e.g., Skyscraper) Checking/deriving subClassOf hierarchy Particularly useful when ontologies are large, multi- authored and rapidly evolving Also useful when integrating/sharing ontologies Does not tell us how to deal with inconsistencies But we should be able to determine when they exist
54 통합운용 웹의 발전 = 분산환경의 발전 에이전트 시스템 : 분산환경과 자율적 기능을 전제 따라서 에이전트 기술은 웹 기반 소프트웨어 시스템 개발 기간을 단축시키고 웹 환경에 적응하고 새로운 다양한 수요 의 확장을 포용하는 소프트웨어 시스템 개발의 필수요소가 되고 있음. 에이전트 기술과 시맨틱 웹의 상호보완적 상승작용을 통한 에이전트 기술의 활성화와 시맨틱 웹의 실현이 이루어질 것 으로 예상. 시맨틱 웹의 활용
55 전자상거래에 대한 시맨틱 웹의 활 용 출처 : 이재호, 양정진 시맨틱 웹 : 차세대 지능형 웹 기술 전자상거래 프레임워크나 전자 카탈로그 또는 상품 분류 코드는 XML 을 기반으로 하고 있으며 기본적으로 시맨틱 웹에서 추구하는 온톨로지 연 구목표와 유사한 목표를 가지고 있음 상품으로 대변되는 “ 개념 ” 들의 체계적 정리가 전자 상거래에도 필요함. Ex. ISO/IEC 13520:2000 Topic Maps 전자상거래는 정의상 거래 당사자간의 상호 작용이 있게 된다. 웹 상에 존재하는 거래 당사자에 관련된 다양한 정보를 전자상거래에 이용하는 것이 필수적임 Ex. Web data mining 시맨틱 웹에서는 이러한 data mining 이 에이전트에 의하여 자연스럽게 이루어질 수 있게 되어 거래자의 편리성이 대폭 증대되고, 이에 따라 거 래의 실현 가능성도 함께 증대되어 전자상거래 e- 비즈니스가 획기적으로 증대될 가능성을 제공한다. 시맨틱 웹의 활용