Presentation is loading. Please wait.

Presentation is loading. Please wait.

메타데이터의 기초 메타데이터의 이해 2007년 1학기 최석두 sdchoi@hansung.ac.kr 한성대학교 지식정보학부.

Similar presentations


Presentation on theme: "메타데이터의 기초 메타데이터의 이해 2007년 1학기 최석두 sdchoi@hansung.ac.kr 한성대학교 지식정보학부."— Presentation transcript:

1 메타데이터의 기초 메타데이터의 이해 년 1학기 최석두 한성대학교 지식정보학부

2 정보규칙(1) 2 정보를 생성할 때 그 생성시의 역할만으로 한정해서는 안 된다. 장래의 재사용을 고려해야 한다.
1 식별기호로 식별되고 저장되고 검색될 수 있다면 정보는 어떤 형식이어도 좋다. 2 정보를 생성할 때 그 생성시의 역할만으로 한정해서는 안 된다. 장래의 재사용을 고려해야 한다. 3 처음부터 모든 데이터가 정보일 수는 없지만 환경이 변함에 따라 쉽게 정보로 바뀔 수 있다. 4 어떤 정보로부터 새로운 정보를 도출하는 것은 어렵다. 정보는 언제나 데이터에서 도출되기 때문이다. 5 정보는 어디에나 있지만 그 유용성은 기본 데이터를 식별할 수 있는 관계와 직접적으로 관련된다. 6 정보가 필요하다면 보통 정보이용자는 그 정보를 찾아, 구해, 적용하는 데 많은 시간이 걸린다. 7 정보이용자가 정보의 존재를 알지 못한다면 좋은 정보도 적절하게 이용하지 못한다. Adrienne Tannenbaum. Metadata solution. Addison-Wesley, 2002.

3 정보규칙(2) 데이터 정보 지식 data information knowledge 객 처리 관 통합 화 보고 메타데이터

4 메타데이터의 탄생배경 자원의 불안전성 동일자원을 구성하는 장절의 분산성 수록되는 형식의 다양성 자원생산의 임의성(가상성)
자원의 대량성 자원의 불안전성 동일자원을 구성하는 장절의 분산성 수록되는 형식의 다양성 자원생산의 임의성(가상성) 자원의 신뢰성이 약함 전문가 작성 불가능 갱신불가능 컴퓨터에 의하여

5 메타데이터의 정의(1) 1 데이터의 데이터. 다른 데이터를 기술하기 위해 사용되는 데이터.
1 데이터의 데이터. 다른 데이터를 기술하기 위해 사용되는 데이터. 2 내용을 기술해 주는 정보. 일상적인 예로는 도서관의 카드목록이나 책자형목록의 한 항목, 또는 온라인색인의 정보. 3 인간이 컴퓨터파일을 이해하기 위한 정보. 4 웹을 위한 기계가 이해할 수 있는 정보 (W3C). 5 네트워크화된 전자자원의 식별과 기술, 소재 확인에 도움을 주기 위하여 사용되는 모든 데이터 (IFLA). 6 어떤 정보자원에 대한 구조화된 데이터. 기술대상, 접근방법, 사용자 불문.

6 메타데이터의 정의(2) 1 “기본표목 – 개인명”은 식별어(메타데이터요소)이다. 2 “100”은 메타데이터요소명(태그)이다.
100 기본표목 – 개인명 기본표목을 개인명으로 할 경우에 이 필드에 기술한다. 기본표목은 목록규칙에 의해 부여된다. 지시기호와 식별기호의 사용법은 다음과 같다(이하생략). 1 “기본표목 – 개인명”은 식별어(메타데이터요소)이다. 2 “100”은 메타데이터요소명(태그)이다. 3 “기본표목을 개인명으로 할 경우에 이 필드에 기술한다. 기본표목은 목록규칙에 의해 부여된다……”는 정의(사용규칙)이다. 4 특정 목적을 위하여 이와 같이 정의된 규칙의 집합은 메타데이터스킴이 된다. 이를 일반적으로 메타데이터형식이라고도 한다. 메타데이터스킴에 따라 정의된 어커런스을 집합을 메타데이터라 한다. • ISO/IEC 참조.

7 메타데이터의 정의(3) 1 “황석영. 장길산”이라고 기술하면 두 사람이 어떤 관계인지 무엇을 뜻하는지 알기 어렵다.
황석영. 장길산. <저자>황석영</저자> <제목>장길산</제목> <작가>황석영</작가> <소설제목>장길산</소설제목> 1 “황석영. 장길산”이라고 기술하면 두 사람이 어떤 관계인지 무엇을 뜻하는지 알기 어렵다. <저자>, <제목>이라는 의미태그를 붙이면 “황석영”은 작가, “장길산”은 소설제목이라는 것을 알 수 있다. 그런데 <저자>, <제목> 대신 <작가>, <소설제목>이라는 의미태그를 사용하여 혼란을 가져 올 수 있다. 4 이를 해결하는 방법은 공통적인 의미태그를 사용하는 것이며 이 공통의미태그를 메타데이터라고 한다.

8 DC의 예 Fiction Shakespeare HTTP://www.w3... Identifier 2006 Subject
Creator Identifier 2006 Subject Grove Press Date Publisher 328 p. Format kor Language Text BOOK Type Description Contributor 이 희곡은 …. 김아무개 Relation Rights Source Coverage 저작권소유는 저자 Title Romeo and Juliet 로미오와 줄리엣

9 모차르트의 예 모차르트 출현본문 SN 외국인명<인명 1756-1791 학파 설명 용어정의 용어범주 BT/NT 이름
모짜르트[Mozart, Wolfgang Amadeus] 모짜르트, 볼프강 아마데우스 모짤트 모짤트, 볼프강 아마데우스 모찰트 모찰트, 볼프강 아마데우스 볼프강 모차르트 볼프강 아마데우스 모짜르트 볼프강 아마데우스 모차르트 출현본문 SN 외국인명<인명 학파 설명 용어정의 용어범주 BT/NT 이름 모차르트 베토벤 하이든 생몰년 이명/이름 잘츠부르크[Salzburg] Salzburg 빈고전파 학파 잘츠부르크 음악제 출생지 음악가 Mozart, Wolfgang Amadeus Wolfgang Amadeus Mozart 모차르트 GER BT/NT 이름 모차르트 바흐 베르디 베토벤 살리에리 슈만 슈베르트 하이든 헨델 돈 지오반니[Don Giovanni] 돈 죠반니[Don Giovanni] 작곡가 직업 이미지 UF 저자 1787 SN 작곡년 오페라 용어정의 가극[歌劇] BTi/NTi 돈 조반니[Don Giovanni] 코지 판 투테[Cosi fan Tutte] 피가로의 결혼[--結婚] 돈 후안[Don Juan] 주인공 Espana Don Giovanni

10 메타데이터의 기능 강의시간에 적을 것.

11 메타데이터의 특성 1 메타데이터요소가 대상 정보자원에 따라 다양하다. 따라서 다양한 메타데이터형식이 존재한다.
1 메타데이터요소가 대상 정보자원에 따라 다양하다. 따라서 다양한 메타데이터형식이 존재한다. 2 요소, 하위요소, 속성 등의 구분이 모호하다. 따라서 동일한 자원에 대한 메타데이터형식이 달라질 수 있다. 3 표목정보와 기술정보를 구분하지 않는다. 어플리케이션에서 정할 수 있다. 4 동일한 요소명이 다른 의미로 사용되거나 다른 요소명이 동일한 의미로 사용되는 경우가 많다(MDR의 필요성).

12 메타데이터 스킴의 종류(일부) 종 류 설 명 Dublin Core(DC)
15개요소. 기술언어 RDF. Dublin Core Metadata Element Set(DCMES) TEI Header 목록을 기반한 형식. 기술언어 SGML, XML. IEEE LOM 학습객체에 관한 기술. Learning Object Metadata. KEM1.0/2.0 DC기반(1.0) LOM기반(2.0) 한국표준교육분야 메타데이터 형식. EAD 아카이브 컬렉션의 기술. Encoded Archival Description. CDWA 예술작품의 기술. Categories for the Description of Works of Art. CIMI 박물관 자원의 기술. Computer Interchange of Museum Information. VRA CORE 시각자원의 기술. VRA Core Categories. GEM 교육자원의 기술. Gateway to Educational Materials. GILS 정부기관 정보자원의 기술. Government Information Locator Service. FGDC-CSDGM 지형공간자원의 기술. Content Standard for Digital Geospatial Metadata. DARWIN CORE 자연사 컬렉션 및 관찰데이터의 기술. ISO/TS23081 기록관리를 위한 표준형식-이를 기반으로 국내 대학기록관리를 위한 요소(20개요소 57개 하위요소 제안). MARC USMARC, KORMARC, UNIMARC……

13 메타데이터의 요소(1) 요 소 내 용 관리정보 메타데이터요소
요 소 내 용 관리정보 메타데이터요소 (재)생산, 갱신, 책임, 소재, 접근, 마이그레이션, 재포멧팅 등 구조정보 메타데이터요소 파일, 이미지, 텍스트, 오디오, 비디오, 데이터베이스 정보 등. 기술정보 메타데이터요소 H/S환경, 기술적구조, 데이터변환, 설치요건 등. 서지정보 메타데이터요소 표제, 생산자, 주제, 내용, 요약 등. 문맥정보 메타데이터요소 배경, 관련 정보 등. 출처정보 메타데이터요소 생산, 관리, 사용, 보존정보 등. 통제정보 메타데이터요소 인증, 권한, 인가정보 등.

14 메타데이터의 요소(2) Thesaurus 지명 관광지 인물(과거 및 현재) 지(誌) 및 문헌 교통 지도 숙박시설 행사 특산물
키워드 메타데이터 메타데이터 메타데이터 지명 관광지 인물(과거 및 현재) 지(誌) 및 문헌 교통 지도 숙박시설 행사 특산물 날씨 방문기 사찰 묘(廟) 문화재 설명 위치 높이 특징 주제어 여행사 예약 비교 여행상품

15 메타데이터의 요소(3)

16 메타데이터의 요소(4) 네비게이션 메타데이터 [이름] 박정희[朴正熙]
[설명] ~ 정치가, 군인. 경북 선산(善山) 출생. 가난한 농부인 박성빈(朴成彬)과 백남의(白南義) 사이에서 5남 2녀 중 막내로 태어났다. 1937년 대구사범학교를 졸업하고, 3년간 초등학교 교사로 근무하다가, 만주의 신경(新京:現 長春)군관학교를 거쳐 1944년 일본육군사관학교를 졸업하였으며, 8 ·15광복 이전까지 주로 관동군에 배속되어 중위로 복무하였다. 1972년 국회 및 정당해산을 발표하고 전국에 계엄령을 선포한 후 '통일주체국민회의'에서 대통령으로 선출되었다. 이로써 유신정권인 제4공화국이 출범하였다…… [생몰년] [출생지] 선산(善山) [직업] 정치가, 군인 [경력] …… [저작] 학술논문 저작 발간지 주제영역 기관/단체 인물 주제키워드 부서 네비게이션 메타데이터

17 상호운용성의 장애요인 강의시간에 적을 것 !

18 메타데이터의 통합(1) 특정 메타데이터형식의 이용 장점 1 크로스워크(crosswalk)의 존재. 2 데이터의 일관된 공유.
2 데이터의 일관된 공유. 3 경제적. 단점 1 정보의 손실. 라운드트립(roundtrip) 매핑의 어려움.

19 메타데이터의 통합(2) RDF 모형 장점 1 정보의 손실 없음. 2 크로스워크의 존재. 3 MDR 단점 1 시스템의 복잡성

20 RDF(1) 이름공간(namespaces) 1 모든 메타데이터요소는 특정 이름공간과 연결된 레이블로 시작
1 모든 메타데이터요소는 특정 이름공간과 연결된 레이블로 시작 2 요소명으로 그 정의를 확인 가능 3 다수의 메타데이터 스킴에서 요소들의 모호함 없이(URI) 단 하나의 자원을 기술하기 위해 사용 가능. 4 URI는 유일한 식별기능(255자까지. 예를 들면, URL, 전화번호, ISBN, 지리적인 위치 등)만 있으면 충분하며 실제로 존재하지 않아도 좋다. 즉, 정보원을 액세스할 수 있어야 할 필요는 없다.

21 RDF(2) 정보자원의 실체 <rdf:Description about=“89-86685-07-8”> 속성 속성치
<kcr:서명>메타데이터의 형식과 구조</kcr:서명> <kcr:저자>최석두</kcr:저자> <kcr:출판자>문헌정보처리연구회</kcr:출판자> <kcr:출판년>1998</kcr:출판년> <kcr:페이지수>359</kcr:페이지수> </rdf:Description> 속성 속성치 kcr:서명 메타데이터의 형식과 구조 kcr:저자 최석두 kcr:출판자 문헌정보처리연구회 kcr:출판년 kcr:페이지수 359 <rdf:Description about=“ <dc:title>메타데이터의 형식과 구조</dc:title> <dc:creator>최석두</dc:creator> <dc:type>text</dc:type> <dc:publisher>문헌정보처리연구회</dc:publisher> <dc:date>1998</dc:date> <dc:format>text/html</dc:format> </rdf:Description> 속성 속성치 dc:title 메타데이터의 형식과 구조 dc:creator 최석두 dc:type text dc:publisher 문헌정보처리연구회 dc:date dc:format text/html

22 RDF(3) 중첩구조 속성 속성치 hr:이름 최석두 ht:전자메일 <rdf:Description about=“ <dc:title>메타데이터의 형식과 구조</dc:title> <dc:creator> <rdf:Description about=“ <hr:이름>최석두</hr:이름> </rdf:Description> </dc:creator> <dc:type>text</dc:type> <dc:publisher>문헌정보처리연구회</dc:publisher> <dc:date>1998</dc:date> <dc:format>text/html</dc:format>

23 RDF(4) 컨테이너 식사 후의 후식으로 치즈, 케익, 멜론이 나온다고 하자. 나오는 방법은 다음과 같다.
1 치즈, 케익, 멜론이 함께 나온다(집합). 2 치즈, 케익, 멜론이 이 순서로 나온다(순서). 3 치즈, 케익, 멜론 중 선택한 것 하나가 나온다(택일). <rdf:bag> <rdf:li>치즈</rdf:li> <rdf:li>케익</rdf:li> <rdf:li>멜론</rdf:li> </rdf:bag> <rdf:seq> <rdf:li>치즈</rdf:li> <rdf:li>케익</rdf:li> <rdf:li>멜론</rdf:li> </rdf:seq> <rdf:seq> <rdf:li> <rdf:bag> <rdf:li>치즈1</rdf:li> <rdf:li>치즈2</rdf:li> </rdf:bag> </rdf:li> <rdf:alt> <rdf:li>케익1</rdf:li> <rdf:li>케익2</rdf:li> <rdf:li>케익3</rdf:li> </rdf:alt> <rdf:li>멜론</rdf:li> </rdf:seq> <rdf:alt> <rdf:li>치즈</rdf:li> <rdf:li>케익</rdf:li> <rdf:li>멜론</rdf:li> </rdf:alt> 치즈메뉴는 치즈1, 치즈2가 함께 나오고, 케익메뉴는 케익1, 케익2, 케익3 중 선택할 수 있다고 하자.

24 메타데이터의 확장(1) <저자>황석영</저자> <제목>장길산</제목> “황석영”은 <저자>이고 “장길산”은 <제목>이라는 것은 알고 있지만, <저자>와 <제목>은 서로가 관계없는 독립적인 의미태그일 뿐이다. 따라서 “황석영이 저술한 소설”을 검색할 수 없다. 2 이를 위해서는 <저자> 와 <제목>간의 의미관계를 설정할 필요가 있다. (∃x)(∃y) (저자(x) ∧저술하다(x,y) ∧제목(y)). <rdf:Description rdf:about=“저자”> <저술하다> 제목 </저술하다> </rdf:Description>  트리플(triple): 객체, 속성, 값 주어(저자:리소스), 술어(저술하다:프로프티), 목적어(제목:프로프 티값) * 값은 리소스이거나 리터럴(literal)이다.  (2항)술어논리표현: 술어(속성, 값) 저술하다(저자, 제목) 저술하다(황석영, 장길산)

25 메타데이터의 확장(2) 1 추론규칙: 아버지(김, 김1). 어머니(이, 김1).
<저자>황석영</저자> <제목>장길산</제목> 1 추론규칙: 아버지(김, 김1). 어머니(이, 김1). 부부(x, y)  아버지(x,z), 어머니(y,z). 심판관(x,y,z)  심판(장기대회, x), 선수1(장기대회, y), 선수2(장기대회, z). 2 의미태그간의 의미관계를 설정하고 그들 사이의 규칙도 정의하게 되면 결국은 해당 분야의 지식체계를 컴퓨터가 이해할 수 있는 형태로 표현된 것이며, 이것을 온톨로지(ontology)라 한다.

26 메타데이터의 확장(3) 1 사람, 이미지, 문헌, 학습객체 등을 기술한 자원의 식별정보는 모두 메타데이터가 된다.
1 사람, 이미지, 문헌, 학습객체 등을 기술한 자원의 식별정보는 모두 메타데이터가 된다. 2 전술한 온톨로지의 트리플 “주어, 술어, 목적어”는 메타데이터가 된다. RDF에서는 술어까지도 URI로 유일하게 식별된다. 3 모든 통제어휘는 메타데이터가 된다. 4 모든 전거데이터는 메타데이터가 된다.

27 메타데이터의 기술언어 XML RDF, RDFs(RDF정의언어)
RDF/OWL(Full, DL: Description Logic, Lite) – W3C XML/Topic Maps(XTM) - ISO

28 표준메타데이터의 필요성(1) 다양한 표현 남녀가 관계하다 결혼하다 사랑하다 관계하다 시집보내다 남달리 생각하다 안다 장가보내다
놀다 밤을 보내다 맺다 인연을 맺다 도둑맞다 몸도둑을 맞다 몸도둑질을 하다 몸을 뺏기다 몸을 허락하다 변을 당하다 결혼하다 시집보내다 장가보내다 살림내주다 사랑하다 남달리 생각하다 이효석의 작품 중

29 표준메타데이터의 필요성(2) 관계의 다양성 부부관계 남녀관계 연인관계 대응관계 동반관계 …… 관련관계 아내 남편

30 용어의 집적 용어의 풀 Intellectual/artistic Knowledge layer link physical
Commodities Events, Monuments General subject terms Laws Hindi Works French Germany Groups/Organizations Geographic Names Japanese Persons Chinese English Organization A Korean Thesaurus A concept b KDC DDC UNSPSC Concept a Intellectual/artistic Engler Knowledge layer link physical Information layer Attribute Information

31 시소러스 시연 용어수: 52만 구축자: 최석두 등 관리시스템 개발: 오롬정보

32 전망 및 결론 MDR 2 메타데이터간의 매핑, 크로스워크
2 메타데이터간의 매핑, 크로스워크 3 메타탐색(federated searching; metasearch; broadcast searching) 대 종합목록탐색 4 교차언어탐색(다국어) 5 PLO(person, location, organization)를 포함하는 (통합)시소러스 6 새로운 화두: 시멘틱 웹, 온톨로지


Download ppt "메타데이터의 기초 메타데이터의 이해 2007년 1학기 최석두 sdchoi@hansung.ac.kr 한성대학교 지식정보학부."

Similar presentations


Ads by Google