Download presentation
Presentation is loading. Please wait.
1
시소러스 정보보호학과 임수미
2
목 차 1.시소러스란? 1) 유래 2) 정의 3) 필요성 2.시소러스 구성요소 3.시소러스 작성과정 4.시소러스 서비스
목 차 1.시소러스란? 1) 유래 2) 정의 3) 필요성 2.시소러스 구성요소 3.시소러스 작성과정 4.시소러스 서비스 5.시소러스 발전방향
3
1. 1) 시소러스 유래 라틴어 θησαυρ(보물)에서 유래한 말
Peter M. Roget이 영어 어휘를 내용상 분류 동의어,반의어 등 관련어를 엮어 시소러스라 명명함
4
1. 2) 시소러스 정의 시소러스(Thesaurus)란?
분류와 사전의 결합으로 “상위 및 하위개념 사이의 전후 관계를 명확히 하기 위해 공식적으로 조직, 통제된 색인어의 어휘” 실물적, 추상적 세계 개념대상의 대응 상징체계인 용어에 대한 상호간의 관계 표현한 지식베이스 인간의 학습, 탐구활동 등 제반 지식활동의 대상이 되는 개념(용어)간의 관계 표현한 지식구조 맵
5
1. 3) 시소러스 필요성 색인 작업 시 적절한 색인표목의 선택과 색인어의 통제를 위해 필요 검색 시
적절한 색인표목의 선택과 색인어의 통제를 위해 필요 검색 시 적절한 탐색어의 선택을 위해 필요 즉, 용어간의 계층적 관계나 기타 관련용어를 사용하여 보다 포괄적인 탐색을 수행. 또는 특정한 용어 사용하여 보다 한정된 탐색 함으로써 검색문헌 수를 알맞게 조절가능
6
2. 시소러스 구성요소 Descriptor Keyword word Non-Descriptor Stop-words
7
3. 시소러스 작성과정 (1) 주제영역 설정 (2) 시소러스의 특정성 수준과 전조합수준 결정
· 특정성 수준 : 색인어가 주제를 정확하게 표현 할 수 있는 능력 · 전조합수준 결정 : 복합개념을 표현하는 복합 용어를 시소러스에 어느 정도 포함시키는지에 대한 것
8
3. 시소러스 작성과정 (3) 시소러스의 형태 결정 · 자모순 시소러스 : 디스크립터를 자모순으로 배열한 것.
· 분류형 시소러스 : 자모순 시소러스에 분류체계를 갖춘 것. (4) 용어의 수집 용어의 수집원은 주로 문헌이 되는데 기본적으로 참고할 문헌은 다음과 같다. - 시소러스, 주제명 표목표, 분류표 - 사전류 - 전문분야 용어집 - 색인지, 초록지 등 - 편람, 목록, 교재, 디렉토리 등의 자료.
9
3. 시소러스 작성과정 (5) 용어의 표준화 ① 품사 : 일반적으로 명사(동명사포함)로 함.
개념을 정확히 표현할 수 있는 명사가 없을 경우에는 형용사를 채택. (예: manual) ② 단수와 복수 - 단수 표시: 과정이나 성질을 나타내는 언어나 물질명사. - 복수 표시: 사물이나 실체를 나타내거나 셀 수 있는 명사. * 우리나라는 모두 단수로 표시
10
3. 시소러스 작성과정 ③ 기입형식 - 두 개 이상의 단어로 구성된 복합표목인 경우는
기입형식은 자연언어 순으로 기입하는 직접기입형식 (예: higher education)과 자연언어의 역순으로 기입하는 도치기입형식(예: education, Higher)이 있음. - 대부분의 시소러스는 직접기입형식을 취함. 도치기입형식 취할 경우에는 직접기입형식의 표목으로 부터 참조를 내주는 것이 필요. (예, Higher Education See Education, Higher)
11
3. 시소러스 작성과정 ④ 약어, 외래어, 동형이의어등의 표기 - 약어는 원칙적으로 색인표목으로 선택하지 않으나
일반적으로 약어가 널리 통용되는 개념은 약어를 표목으로 사용(예: Unesco), 약어와 완전어는 상호 참조로 연결시켜 줌. 또한, 영국/미국식 철자의 선택, 대문자의 사용, 외래어의 표기에 있어서도 원칙을 정함. ⑤ 일반적으로 구두점을 사용하지 않음. 다만, 동형이의어의 구별을 위한 괄호나 도치표목의 경우 콤마(,)가 사용됨.
12
3. 시소러스 작성과정 (6) 용어의 상호관계 결정 ① 동등관계: 색인표목(descriptor)으로 채택되지 않는
용어는 USE참조표시에 의해 채택. USE, UF(Used For)로 표시. ② 계층관계 : 특정개념의 상위개념어 및 하위개념어 간의 관계를 말함. BT(상위), NT(하위)로 표시. ③ 연상관계 : 동등관계나 계층관계는 아니라도 개념적 으로 어떤 관련성이 있는 용어들간의 관계. RT로 표시.
13
용어의 구조 그림출처: 오롬윈 (
14
4. 시소러스 서비스 오딘(Odin)이란? 59만 이상의 시소러스 용어를 웹서비스 형태로 지원하는 시소러스 검색어 추천서비스
오딘 서비스는 검색자 개개인의 지식 범위를 확장하고 축소하여 검색결과의 재현율 및 정도율을 향상하여 도서관 고유의 서비스를 강화할 수 있도록 지원
15
4. 시소러스 서비스 오딘 서비스의 특징 · 59만 용어의 시소러스를 활용한 전문검색지원 시스템
· 시소러스를 이용한 검색어 추천, 검색어 확장,이용자 맞춤검색 서비스 · 기존 검색시스템의 수정 없이 검색의 효율성 향상 · SOAP을 이용한 XML Web Service로 모든 플랫폼 지원 · ASP (Application Service Provider) 기반 서비스
16
4. 시소러스 서비스 시스템 구성도 그림출처: 오롬윈 (
17
4. 시소러스 서비스 오딘의 주요기능 · 검색 시 동의어 확장 가능 ex) APEC = 아시아태평양경제협력체
전남 = 전라남도 / 춘원 = 이광수 기존 데이터에 대한 추가 입력 불필요 검색결과 출력 시 동의어 포함 여부 선택 가능 그림출처: 오롬윈 (
18
검색 적용 예 그림출처: 오롬윈 (
19
시소러스 구축 사례 그림출처: 오롬윈 (
20
5. 시소러스 발전방향 그림출처: 오롬윈 (
21
감사합니다
Similar presentations