Download presentation
Presentation is loading. Please wait.
1
DB표준화 작업의 현황과 과제 Presentation
주 성 지 / 국사편찬위원회 자료정보실 DB표준화 작업의 현황과 과제 Copyright ⓒ National Institute of Korean History
2
Contents 국사편찬위원회 한국사데이터베이스의 현황 표준화 작업의 목적 표준화 작업의 업무흐름
Database 표준화 작업(HOMS : History Object Metadata System) DB표준화 작업의 성과와 전망
3
국사편찬위원회 한국사데이터베이스의 현황 1 - 1
한국사데이터베이스 1996년 : 국사편찬위원회 웹페이지 개통과 함께 DB서비스(hxt) 2000년 : 한국역사정보통합시스템 국사편찬위원회 DB서비스(RDB) 2004년 : hxt와 RDB 데이터베이스를 통합하여 서비스함(kristal) DB Table 현황 관리테이블 : 6개(Directory·색인어 서비스 등 관리테이블) 원문DB테이블 : 34개 Item(2006년 4개 item 추가예정) XML 및 DTD현황 각 Item별로 개별의 DTD 2005년 : 22개 Item을 대상으로 GroupDTD로 정리(도서, 문서, 편년류) DB Schema & XML Parser 각 Item별로 개별의 스키마 작성 XML 파싱 룰(Kristal rule.schema)을 개별 Item 조건에 맞춰 작성
4
국사편찬위원회 한국사데이터베이스의 현황 1 - 2
문제점 - XML Item별 작업지침의 다양화로 작업 및 공정관리 부담이 커짐 유사개념의 요소(Element)가 자료의 성격에 따라 다르게 표현됨 - DB Schema 및 Web 개발 동일요소의 schema column명 불일치 초래 DTD와 DB Schema의 다양성으로 웹개발 부담 증가 웹개발시 동일한 퍼포먼스의 모듈화 불가능(네비게이션, 로케이션 등) 웹개발의 시간과 비용의 부담이 커짐 - 신규 DB 개발 DTD 및 DB설계 문제 웹개발 문제
5
표준화 작업의 목적 2 다양한 형태로 구축된 동일한 개념의 요소를 통일화 함
모든 XML데이터의 요소 및 속성명의 일관성을 부여함 원문DB의 레코드 기준을 확정하여, 모든 레코드가 나름의 메타데이터를 갖도록 함 레코드가 메타데이터인 Header와 원문내용인 Body로 구분되어 데이터 구축이 정규화됨 DB Schema를 통일함 일관된 Rule.Schema를 작성하여, Parsing오류를 최소화함 웹개발에서 특정기능을 모듈화하여 적용함 데이터의 융합을 모색함 일관된 DB설계에 기반한 새로운 서비스 창출 신규 DB 작성시 XML 구축과 DB Schema 설계, 웹개발의 부담을 줄임 원문DB Metadata Set 작성 (HOMS : History Object Metadata System) 한국역사정보통합시스템 연계의 용이성 확보
6
Sample Data Upload 및 오류사항 점검
3 표준화 작업의 업무흐름 기존 XML 데이터 분석 표준 Record Set 작성 국내외 기술규칙 분석 DB Schema 매핑표 작성 XML변환 매핑표 작성 No Item별 Schema 작성 XML 변환 Sample XML Data No Sample Data Upload 및 오류사항 점검 Yes No 변환 데이터 검증 Yes Web개발 Yes Data upload 및 웹서비스 No 최종 XML 데이터 웹검사 Yes
7
HOMS (History Object Metadata System)
4 - 1 HOMS (History Object Metadata System) Database 표준화 역사자료 전산화를 위한 Meatadata Set 원문(Full-Text, Image)DB에 대응하도록 구성함 HOMS의 형태 : Header & Body - Header 역사자료 전산화를 위한 주요 Meatadata(서비스, 유통, 관리를 고려함) ref) ISAD(G), EAD, DC, KORMARC, MODS 등 - Body Contents영역(자료에 따라 text와 image로 구분) ※text DB의 경우, 최대한 원본의 형태를 파괴하지 않고 고유의 형태를 유지하도록 함 ref) TEI, 기존 역통 DTD 등 ※ HOMS는 향후 한국역사자료의 새로운 형태·특성의 출현을 수용할 수 있도록 함
8
HOMS (History Object Metadata System)
4 - 2 HOMS (History Object Metadata System) Database 표준화 Group Element sub-Element Attribute Value Alias 설명 Identity id ID 기사ID title mainTitile 제목 type 형태 문서철,하위문서철,문서,문서형식등 volume 권차 lang 언어 seriesTitle 총서명 Alternavtive 부제 부제,번역,逸名 date dateCreated 작성일 그림,사진 등 포함 yyyy-mm-ddL0 dateSend 발송일 dateReceived 수신일 dateOccured 발생일 dateContract 계약일 subjectClass scheme 분류형식 주제분류 형태별 시대별 주제별 소장처별 code 주제분류코드 level 단계 대분류, 중분류, 소분류 등
9
HOMS (History Object Metadata System)
4 - 3 HOMS (History Object Metadata System) Database 표준화 Group Element sub-Element Attribute Value Alias 설명 Context creator author 저필자 position 소속 직위 editor 편자 sender 발송자 receiver 수신자 translator 역자 reporter 작성자 binder 편철기관 contributor 기여자 roll 역할 결재자 계약자 신문자 등본인 입회인 통역 서기
10
HOMS (History Object Metadata System)
4 - 4 HOMS (History Object Metadata System) Database 표준화 Group Element sub-Element Attribute Value Alias 설명 Content and Structure description introduction 서문,간행사 id name remarks 범례 commentary 해설 abstract 초록 biblioExplanation 해제 groupID 해제그룹 잡지 groupName 해제그룹명 tableOfContent 목차 afterNote 간행후기, 발 coveragePeriod 대상시기 start end binderPeriod 편철기간 문서류
11
HOMS (History Object Metadata System)
4 - 5 HOMS (History Object Metadata System) Database 표준화 Group Element sub-Element Attribute Value Alias 설명 Allied publication publisher 발행처 dateIssued 발행일 date yyyy-mm-ddL0 start 창간일 신문, 잡지 end 폐간일 class 발행구분 신문 조간 석간 무 부록 호외 relation isPartOf 계층관계 idrefs isReferencedBy 참조관계 holdings 소장정보 originOwner 원소장처 owner 현소장처 registrationNo 소장처등록번호 callNo 소장처청구번호 history 소장이력 serialNumber 소장관리번호 등록번호 MFNo MF번호 청구번호 ISBN ISSN source 출전 mainTitle 서명,게재지명
12
Conditions of access and use area
4 - 6 HOMS (History Object Metadata System) Database 표준화 Group Element sub-Element Attribute Value Alias 설명 Conditions of access and use area physicalDescription 형태사항 originSize 원본크기 originQantity 원본분량 originForm 원본형태 낱장,가철,절첩,족자,mf 등 originLang 원본언어 한문,한글,국한문,영어,일어 등 lang originType 원본 원본,사본,영인본,탈초본 등 format 파일 형식 및 크기 medium medium. 파일형식. IMT 준수. scheme IMT extent 파일 크기 Service accessCondition 웹서비스여부 access Y | N metaOperator 메타작성자 role status dateInsert Data 생성일 date dateModified Data 수정일
13
4 - 7 표준 DTD Database 표준화 유형분류 기준 - 원본의 자료형태를 기준으로 구분 - 국사편찬위원회 한국사데이터베이스 Item의 다양성을 반영함 - 가공DB 등 형태를 기준으로 할 수 없는 Item은 고유의 DTD로 구성함 DTD 유형 - doc.dtd(문서류) 각사등록 근대편, 주한일본공사관기록, 통감부문서, 국내항일운동문서, 한민족독립운동사자료집, 한국근대사자료집성, 영문자료, 반민특위조사기록 등 - book.dtd(도서류) 중국정사조선전, 한국고대자료집성, 한국사료총서, 한국근현대잡지자료, 중추원조사자료, 친일파관련문헌 등 - annals.dtd(편년류) 한국근현대신문자료, 일제침략하한국36년사, 비변사등록, 고종시대사, 연표 등 - 기타 한국근현대인물자료, 직원록자료, 회사조합자료, 사진유리필름자료 등
14
4 - 8 표준 DTD Database 표준화 Sample DTD .Book
15
4 - 9 Database 표준화 Sample XML .주한일본 공사관기록
16
DB표준화 작업의 성과와 전망 5 DB 구축 작업의 표준화를 모색함
다양한 형태의 자료라 하더라도 구조와 내용을 직관적으로 이해할 수 있음 DB의 일반화로, 별개의 DB에서 동일한 요소에 대한 접근성이 용이함 DB접근성의 확보로 인하여, DB의 융합 및 새로운 서비스의 창출이 가능함 신규DB 구축시 DTD 및 DB설계 그리고 웹개발에 필요한 인력과 시간을 단축할 수 있음 원본에서 Record별 Metadata를 기술할 수 있는 전문적인 작업자를 양산함. 역사자료 DB 전문가로 육성할 수 있음 기관간의 협의에 따라 유사한 DB설계가 이루어질 경우, 기관간의 주제별 DB통합서비스 등 역사자료 전산화의 새로운 전기를 모색할 수 있음. HOMS는 원본에 따라 새로운 요소가 등장할 때, 이를 반영할 수 있도록 유연한 형태를 취하여야 함. 따라서 당사자간의 Metadata에 대한 정기적인 협의가 필요함.
17
감사합니다 Thank You
Similar presentations