The Semantic Web 학 번 0095666 발 표 자 이 한 국
차 례 개 요 Semantic Web? Semantic Web의 목적 Semantic Web의 구현 차 례 개 요 Semantic Web? Semantic Web의 목적 Semantic Web의 구현 Semantic Web의 계층구조 - 계층별 역할 Semantic Web 응용 - On-to-Knowledge 도구환경 Semantic Web의 응용 사례 - UNSPSC 분류체계 연구 동향과 발전을 위한 해결과제 결 론 참고 자료
개 요 Web의 도입 1989년 Tim Berners – Lee 의 월드와이드웹(World Wide Web : WWW)의 제안 HTML(Hypertext Markup Language)이라는 간단한 하이퍼텍스트 이행을 만들고, 이것을 URI (Uniform Resource Identifier)를 이용해 확장시킴으로써, 하이퍼텍스트 링크가 하나의 도큐먼트나 한 대의 컴퓨터뿐만 아니라 네트워크에 연결된 컴퓨터들 사이에 만들어질 수 있도록 했다. 통신 프로토콜로는 HTTP(Hypertext Transfer Protocol)를 고안해 웹 서버와 클라이언트 사이로 데이터를 이동 2. Web 의 문제점 Web 정보가 감당할 수 없을 정도로 방대해짐 불필요한 정보를 걸러내기 위한 시간의 낭비 HTML 언어의 사람에 초점을 둔 디스플레이용 언어의 특징으로 소프트웨어/소프트 웨어 에이전트(Software Agent)의 문서추출의 어려움
Semantic Web? ◆ Semantic Web의 정의 기존의 웹과 완전히 구별되는 새로운 개념이 아닌 현재 웹의 확장개념 웹에 올라오는 정보에 잘 정의 된 의미를 부여하고 이를 통해 컴퓨터와 사람이 협동적으로 작업을 수행할 수 있도록 하는 패러다임 W3C(World Wide Web Consortium)에서는 RDF나 기타 다른 표준을 기반 기반으로 웹에 있는 데이터에 의미를 부여할 수 있는 데이터를 추상적으로 표현 하는 것으로 정의 ※ 컴퓨터가 정보의 의미를 이해하고 의미를 조작할 수 있는 웹
Semantic Web과 정보의 의미 Wisdom Knowledge Information Data Pragmatic Web Actions Knowledge Reasoning Information Semantic Web Structure World Wide Web Data <http://www.zdnet.co.kr-마이크로 소프트웨어 2002년 4월 특집기사 참고 >
Semantic Web의 목적 ◆ 목 적 ◆ Semantic Web의 구현을 통한 효과 ◆ 목 적 웹의 정보를 컴퓨터가 좀더 이해하기 쉽도록 도와주는 표준과 기술개발로 시맨틱 검색, 데이터 통합, 네비게이션, 태스크의 자동화 지원 ◆ Semantic Web의 구현을 통한 효과 정보 검색 시 더욱 정확한 결과를 가져옴 서로 다른 이형질 소스의 정보를 통합 / 비교 어떤 리소스에 대해서도 의미적이고 기술적 정보를 연관시킴 웹 서비스의 자동화를 위해 웹에 세부 정보를 첨가
Semantic Web의 구현 ◆ 계층구조 (Layered Structure)설정을 통한 구현 : 하위레벨을 정의하고 다음 레벨의 개념을 정의하는 계층구조를 설정하는 것이 Semantic Web의 일반적인 연구 방향 하위계층 - 주소 지정 방식(Addressing)방법인 URI가 기반 하위계층을 기반으로 XML, Namespace, RDF/RDF 스키마, 온톨로지의 순서로 진행 Logic 계층 - 인공지능의 추론연구를 밑받침으로 일부 연구가 시작 됨 Proof / Trust 계층 - 시맨틱 웹의 신뢰성과 보안에 관한 연구로 아직 개념 정도만 정리
Semantic Web의 계층구조 Unicode URI XML + NS + xmlschema RDF + rdfschema Ontology Vocabulary Logic Proof Trust Digital Signature rules data data Self descriptive document
계층별 역할 ◆ Semantic Web에서의 XML의 역할 1. XML? 2. XML의 특징 SGML의 subset 으로 구성된 마크업 언어 HTML의 비 구조성을 극복하기 위해 이전부터 제시 2. XML의 특징 HTML에 비해 잘 정의된 구조화 문서(well – structured document) 제약조건 - 요소(element)라 불리는 시작 태그와 종료 태그가 반드시 쌍으로 존재 - 중첩 구조가 반드시 지켜져야 함 3. Semantic Web과 관련된 XML의 역할 구조화된 문서의 생성을 이끌어 냄 태그의 이름을 사용자가 자유롭게 정의 함으로써, 의미 정보를 나타낼 수 있는 태그 이름을 사용할 수 있다
4. Semantic Web을 XML으로 달성하기에 부족한 점 서로 다른 사람이 같은 내용의 문서를 작성할 때 같은 의미 이면서 다른 이름을 사용 하여 태그를 정의 할 수 있다. ※ 이 두 태그 이름이 같은 의미를 가진 다는 것을 따로 표현(Ontology의 필요성) 같은 내용에 대해서도 여러 가지 구조를 가진 XML 문서를 사용할 수 있다. - 에이전트 프로그램이 내용을 파악하기 어려워 질 수 있다. <not> <date>12/11/99</date> <to>Tove</to> <from>Jani</from> <heading>Reminder</heading> . <not> <day>12</day> <month>11</month> <year>99</year> . <not> <date>12/11/99</date> .
◆ Semantic Web에서의 RDF의 역할 1. RDF (Resource Description Framework) ? 자원 설명과 메타 데이터 응용을 지원하기 위한 XML 텍스트포맷 XML의 문제점을 해결하고 의미에 초점을 맞추기 위해 제시된 기반구조 2. RDF 모델 : Resource + Property + Statement Resource : 웹사이트 등의 모든 사물 Property : 각 리소스의 특성이나 다른 리소스와의 관계 Statement : 어떤 리소스의 특성의 상태에 대한 값 3. Semantic Web에서의 RDF의 용도 리소스 발견 : 보다 정확한 검색 엔진의 성능을 제공 문서 분류 : 특정 웹 페이지나 디지털 라이브러리의 내용과 관계 기술 지능형 소프트웨어 에이전트 : 지식 공유와 교환 가능 기타 : 문서내용 등급 표시나 사용자의 개인 선호도 표현 등에 사용
4. Serialization : RDF 문을 XML로 표현한 것 - http://www.w3.org의 책임기관, 제목, 작성일의 세가지 특성에 대한 정보표현 5. RDF의 특징 XML 에서와 같이 서로 다른 구조를 가진 여러 표현방법이 존재하지 않으므로 문서 내용에 대한 이해가 쉬워진다. 6. RDF의 문제점 여전히 태그 이름에 대한 모호성과 중첩성이 존재 (Ontology의 필요성) 7. RDF Schema 특성에 대한 정의나 사용상의 제약을 기술 (Ontology와 유사한 개념) <rdf:RDF> <rdf:description about = http://www.w3.org> <s:Publisher>World Wide Web Consortium<s/Publisher> <s:Title>W3C Home Page<s/Title> <s:date>1998-10-03T02:27<s/date> </ <rdf:description>
◆ Semantic Web에서 Ontology의 필요성과 역할 1. Ontology? 용어 사이의 관계를 정의하고 있는 일종의 사전과 같은 것 Gruber : “공유된 개념화에 대한 정형화” 어느 특정 도메인에 대한 단어들을 계층적 구조로 표현하고 추가적으로 이를 확장 할 수 있는 추론 규칙을 포함한다. 2. Ontology의 개념 개념화 (Conceptualization) : 사람의 사물에 대한 생각을 추상화한 모델 명시적 명제 (Explicit specification) : 개념의 타입이나 사용상의 제약조건들이 명시적으로 정의 정형화된 (Formal) : Ontology는 프로그램이 이해할 수 있어야 하며, 여러 단계의 정형화가 존재할 수 있다. 공유된 (Shared) : Ontology는 합의된 지식을 나타내므로 어느 개인에게만 국한 되는 것이 아니라 그룹 구성원 모두 동의 하는 개념이다.
3. Ontology의 역할 서로 다른 데이터 베이스가 같은 개념에 대해서 서로 다른 단어나 식별자를 사용 할 경우 이를 해결해 줌 ex) 주소를 포함하는 두 데이터 베이스가 우편번호를 각각 postal 과 zip code 로 표현되어 졌을 때 이 두 단어가 같은 것을 지칭 한다는 사실을 Ontology를 통해 비교/통합 되어 질 수 있다. 웹 기반의 지식처리나 응용 프로그램 사이의 지식공유, 재사용들을 가능하게 하는 중요한 요소로 자리잡고 있다. 계층분류(taxonomy)와 추론규칙(inference rule)에 대한 정의가 포함 계층분류 : 객체의 클래스, 서브클래스, 클래스 간의 관계를 정의 (address는 location의 서브클래스이며, city code의 대상은 반드시 location 클래스의 객체여야만 한다는 제약조건 성립) 추론규칙 : 프로그램이 새로운 사실을 자동으로 추출하거나 제약조건이 맞지 않는 오류를 찾아내는데 이용
4. Ontology의 표현 Ontology Language : 온톨로지를 표현하기 위해 스키마와 구문구조 등을 정의 DAML+OIL : W3C에서 표준안으로 제시한 언어로 웹 리소스에 대한 semantic markup 언어로 RDF와 RDF Schema 표준에 기반을 두고 이들을 확장한 프레임 기반의 Ontology 표현언어이다. 기본적으로 DAML+OIL로 표현된 Ontology는 크게 클래스 요소와 특성 요소로 구분되어 진다. - 이것 외에 OWL, Ontolingua
Semantic Web 응용 ◆ Ontology를 통한 지식 관리 도구의 개발 1. On-to-Knowledge 과제 EU의 여러 연구기관들이 컨소시엄을 구성하여 Ontology를 이용한 내용기반 지식 관리도구를 개발 하는 과제 기존 지식 관리 시스템의 이질적인 형태로 다양한 물리공간에 산재로 인한 검색의 비효율성 등의 문제를 OTK 과제를 통해 기업 내 비 효율적인 정보를 Semantic Web 기술을 응용하여 관리 하는 것을 목표로 함 2. On-to-Knowledge 과제의 기능 정보의 습득 : 텍스트에서 정보의 의미를 추출하는 기술 정보의 유지 관리 : RDF, XML 및 OIL 등으로 표현된 정보를 유지 관리 사용자가 기존 문서에 Semantic을 추가하는 도구, Ontology 편집도구, 기존 문서에서 자동으로 Ontology를 저장/검출 하는 도구, Ontology 저장 DB 접근 : 푸시 서비스 및 에이전트 기술로 사용자가 정보를 접근하도록 지원
On-to-Knowledge 도구환경 OntoWrapper OntoExtract <출처 : http://www.ontoknowledge.org>
Semantic Web의 응용 사례 1. British Telecom 콜 센터 인트라넷 기반의 가상 공동체를 만들어서, 콜 센터의 직원들 서로의 정보 공유를 Ontology 방식을 도입함으로, 기존에 성공적 지식을 저장 하고 새로운 지식을 자동으로 배포하는 기능을 수행 효과) 지식을 공통의 경험으로 표현함으로써, 신입사원이 기존 경험지식을 빠르게 학습하게 되며, 지식의 표준화된 표현이 가능하게 됨 2. Swiss Life 생명 보험회사의 계정 표준문서 검색 국제계정 표준에 대한 대용량 문서에서 관련 정보를 검색하는 업무에 Ontology를 이용 함. OntoExtract를 이용하여 Ontology 추출 사용자는 Ontology를 이용하여 세밀한 질의를 수행 또한, 직원이 보유한 특별한 기수, 업무 내용 등을 Ontology를 이용하여 작성 한 후 공유 효과) 특정한 기술적 능력, 업무경력 및 학력을 갖춘 적임자를 검색자의 의도에 부합하게 검색이 가능해 짐
3. Music Brainz의 포괄적인 음악 메타데이터 베이스 오디오 CD와 MP3 등의 디지털 음악 트랙을 인지하여 곡에 대한 메타데이터 제공을 목표로 함 음악에 대한 메타데이터는 개인 또는 회사마다 각자의 방식으로 작성되어 있어 메타데이터 교환/처리시 표준화의 문제 발생 방법 : 음악가, 앨범제목, 트랙번호 등에 URI를 부여하고 RDF로 기술 URI로 객체들이 유일하게 결정되므로 메타데이터의 중복을 피하게 되고, 관련 응용 소프트웨어가 RDF로 기술된 정보에 접근하여 해석하게 함 4. UNSPSC : 전자상거래를 위해 개발 되어진 상품 분류 체계 제품에 대한 공통의 어휘와 계층적 구조를 Ontology로 표현하되 제품에 대한 공통의 어휘와 계층적 구조로 표준화 UNSPSC 지원소프트웨어 : Golden Bullet UNSPSC로 표현된 분류체계와 분류 하고자 하는 제품에 대한 간단한 설명을 입력 받고, 입력받은 설명 내용은 정보검색, 기계학습/자연어처리 기법을 이용 하여 간단한 Ontology로 변환되며, UNSPSC에서 가장 유사도가 높은 항목 으로 분류된다. (현재 영어와 프랑스어를 지원)
(응용) UNSPSC의 분류체계 <출처 : http://www.unspsc.co.kr> 물품 순서에 따른 비 계층구조 분류 단계에 따른 계층구조
UNSPSC의 구조 1. UNSPSC는 총 8자리 숫자로 구성 2. UNSPSC코드는 물품과 서비스를 4단계(Segment→Family→Class→Commodity)로 구분 각 단계마다 2자리 숫자로 구성 Ex) '볼펜'이라는 물품은 사무용기기(Segment)→사무용소모품(Family)→필기도구(Class) → 볼펜(Commodity)의 순으로 분류
3. UNSPSC 배포화일구조 - EGCI : 버전관리, 내부시스템 구축 및 코드상정활동을 위한 코드 - EGCC : 외부 검색용 코드 - 영 문 명 : UNSPSC 영문표준물품명 - 한 글 명 : UNSPSC 한글표준물품명 - 추가버전 : 해당 물품이 추가된 버전 - 추가일자 : 해당 물품이 추가된 년, 월, 일 - 삭제버전 : 해당 물품이 삭제된 버전 - 삭제일자 : 해당 물품이 삭제된 년, 월, 일
연구 동향과 발전을 위한 해결과제 ◆ Semantic Web의 연구 동향 W3C의 RDF와 Ontology에 대한 표준을 정의 하는 방향으로 산하 소위원회 를 통해 세부적인 사항을 결정하고 있다. 국내에서는 인공지능 연구 그룹과 DB/전자 상거래 연구 그룹을 중심으로 진행 중이지만 아직 초기 단계이다. 2003년 들어서 정부 차원에서 Semantic Web의 중요성을 인식한 보도 자료들로 대학뿐 아니라 연구소/기업들 중에도 그 효용성을 긍정적으로 받아들이는 곳이 나타나고 있는 상황 ※ 2003년 정통부는 앞으로 3년간 142억원을 들여 Semantic Web과 지식처리엔진 등 지능형 e-비즈니스 플랫폼 기술을 개발한다고 밝혔고, 지능화/자동화 한 기술을 e-비즈니스 시스템에 적용할 경우 생산성을 향상시키고, 거래 비용을 획기적으로 절감해 줄 수 있을 것으로 기대 하고 있음
◆ Semantic Web 발전을 위한 기술적/사회적 해결 과제 Ontology의 생성, 통합, 수정 및 관리를 위한 도구의 필요 UNSPSC 의 경우 7개월마다 20% 씩 변화하는데 이에 대한 지속적 수정을 용이 하게 하고 관리하는 도구가 필요하다. 사용자가 Ontology 에 기반한 문서를 쉽게 작성하도록 보조하는 도구의 개발필요 문서를 작성하고, 특정 개념마다 Ontology를 검색하고, 문서를 해당 Ontology 와 연결 하는데 많은 시간과 오류를 야기 시키므로 편리한 작성도구가 필요 Ontology에 내재된 새로운 지식을 실시간으로 추론/유추한 지식의 관리도구 필요 지식추론은 많은 계산 시간을 필요로 함으로 복잡한 개념을 실시간으로 추론할 수 있는 검색 엔진이 필요하며, 어느 지식이 어느 지식에서 추론된 것인지 파악, 새로운 사실이 입력될 경우 추론을 전파/변경을 반영하는 시스템의 필요 Semantic Web의 확산을 장려하기 위하여 성공사례를 제시하는 것이 필요
결 론 현재 Semantic Web은 제한된 도메인을 갖는 분야에서 우선 도입 테스트 단계 결 론 현재 Semantic Web은 제한된 도메인을 갖는 분야에서 우선 도입 테스트 단계 앞으로 정보와 지식의 표현, 교환 및 검색이 중요한 분야에서 활성화 될 전망 웹 서비스와 같이 서비스 내용 검색/소프트웨어간 파라미터 표준화가 중요한 분야 에이전트간 지능적인 정보 교환이 중요한 분야 등 Semantic Web 은 현 인터넷의 단순한 정보 흐름의 통신망에서 지식을 생산할 수 있는 지능적 웹으로 진화시키는 작업의 시작
자료 출처 정보과학 회지 2003년 3월호 http://www.zdnet.co.kr http://www.ontology.or.kr http://www.ontoknowledge.org http://www.unspsc.co.kr http://www.w3c.or.kr 기타