시소러스 정보보호학과 06501028 임수미
목 차 1.시소러스란? 1) 유래 2) 정의 3) 필요성 2.시소러스 구성요소 3.시소러스 작성과정 4.시소러스 서비스 목 차 1.시소러스란? 1) 유래 2) 정의 3) 필요성 2.시소러스 구성요소 3.시소러스 작성과정 4.시소러스 서비스 5.시소러스 발전방향
1. 1) 시소러스 유래 라틴어 θησαυρ(보물)에서 유래한 말 Peter M. Roget이 영어 어휘를 내용상 분류 동의어,반의어 등 관련어를 엮어 시소러스라 명명함
1. 2) 시소러스 정의 시소러스(Thesaurus)란? 분류와 사전의 결합으로 “상위 및 하위개념 사이의 전후 관계를 명확히 하기 위해 공식적으로 조직, 통제된 색인어의 어휘” 실물적, 추상적 세계 개념대상의 대응 상징체계인 용어에 대한 상호간의 관계 표현한 지식베이스 인간의 학습, 탐구활동 등 제반 지식활동의 대상이 되는 개념(용어)간의 관계 표현한 지식구조 맵
1. 3) 시소러스 필요성 색인 작업 시 적절한 색인표목의 선택과 색인어의 통제를 위해 필요 검색 시 적절한 색인표목의 선택과 색인어의 통제를 위해 필요 검색 시 적절한 탐색어의 선택을 위해 필요 즉, 용어간의 계층적 관계나 기타 관련용어를 사용하여 보다 포괄적인 탐색을 수행. 또는 특정한 용어 사용하여 보다 한정된 탐색 함으로써 검색문헌 수를 알맞게 조절가능
2. 시소러스 구성요소 Descriptor Keyword word Non-Descriptor Stop-words
3. 시소러스 작성과정 (1) 주제영역 설정 (2) 시소러스의 특정성 수준과 전조합수준 결정 · 특정성 수준 : 색인어가 주제를 정확하게 표현 할 수 있는 능력 · 전조합수준 결정 : 복합개념을 표현하는 복합 용어를 시소러스에 어느 정도 포함시키는지에 대한 것
3. 시소러스 작성과정 (3) 시소러스의 형태 결정 · 자모순 시소러스 : 디스크립터를 자모순으로 배열한 것. · 분류형 시소러스 : 자모순 시소러스에 분류체계를 갖춘 것. (4) 용어의 수집 용어의 수집원은 주로 문헌이 되는데 기본적으로 참고할 문헌은 다음과 같다. - 시소러스, 주제명 표목표, 분류표 - 사전류 - 전문분야 용어집 - 색인지, 초록지 등 - 편람, 목록, 교재, 디렉토리 등의 자료.
3. 시소러스 작성과정 (5) 용어의 표준화 ① 품사 : 일반적으로 명사(동명사포함)로 함. 개념을 정확히 표현할 수 있는 명사가 없을 경우에는 형용사를 채택. (예: manual) ② 단수와 복수 - 단수 표시: 과정이나 성질을 나타내는 언어나 물질명사. - 복수 표시: 사물이나 실체를 나타내거나 셀 수 있는 명사. * 우리나라는 모두 단수로 표시
3. 시소러스 작성과정 ③ 기입형식 - 두 개 이상의 단어로 구성된 복합표목인 경우는 기입형식은 자연언어 순으로 기입하는 직접기입형식 (예: higher education)과 자연언어의 역순으로 기입하는 도치기입형식(예: education, Higher)이 있음. - 대부분의 시소러스는 직접기입형식을 취함. 도치기입형식 취할 경우에는 직접기입형식의 표목으로 부터 참조를 내주는 것이 필요. (예, Higher Education See Education, Higher)
3. 시소러스 작성과정 ④ 약어, 외래어, 동형이의어등의 표기 - 약어는 원칙적으로 색인표목으로 선택하지 않으나 일반적으로 약어가 널리 통용되는 개념은 약어를 표목으로 사용(예: Unesco), 약어와 완전어는 상호 참조로 연결시켜 줌. 또한, 영국/미국식 철자의 선택, 대문자의 사용, 외래어의 표기에 있어서도 원칙을 정함. ⑤ 일반적으로 구두점을 사용하지 않음. 다만, 동형이의어의 구별을 위한 괄호나 도치표목의 경우 콤마(,)가 사용됨.
3. 시소러스 작성과정 (6) 용어의 상호관계 결정 ① 동등관계: 색인표목(descriptor)으로 채택되지 않는 용어는 USE참조표시에 의해 채택. USE, UF(Used For)로 표시. ② 계층관계 : 특정개념의 상위개념어 및 하위개념어 간의 관계를 말함. BT(상위), NT(하위)로 표시. ③ 연상관계 : 동등관계나 계층관계는 아니라도 개념적 으로 어떤 관련성이 있는 용어들간의 관계. RT로 표시.
용어의 구조 그림출처: 오롬윈 (http://www.oromwin.com/)
4. 시소러스 서비스 오딘(Odin)이란? 59만 이상의 시소러스 용어를 웹서비스 형태로 지원하는 시소러스 검색어 추천서비스 오딘 서비스는 검색자 개개인의 지식 범위를 확장하고 축소하여 검색결과의 재현율 및 정도율을 향상하여 도서관 고유의 서비스를 강화할 수 있도록 지원
4. 시소러스 서비스 오딘 서비스의 특징 · 59만 용어의 시소러스를 활용한 전문검색지원 시스템 · 시소러스를 이용한 검색어 추천, 검색어 확장,이용자 맞춤검색 서비스 · 기존 검색시스템의 수정 없이 검색의 효율성 향상 · SOAP을 이용한 XML Web Service로 모든 플랫폼 지원 · ASP (Application Service Provider) 기반 서비스
4. 시소러스 서비스 시스템 구성도 그림출처: 오롬윈 (http://www.oromwin.com/)
4. 시소러스 서비스 오딘의 주요기능 · 검색 시 동의어 확장 가능 ex) APEC = 아시아태평양경제협력체 전남 = 전라남도 / 춘원 = 이광수 기존 데이터에 대한 추가 입력 불필요 검색결과 출력 시 동의어 포함 여부 선택 가능 그림출처: 오롬윈 (http://www.oromwin.com/)
검색 적용 예 그림출처: 오롬윈 (http://www.oromwin.com/)
시소러스 구축 사례 그림출처: 오롬윈 (http://www.oromwin.com/)
5. 시소러스 발전방향 그림출처: 오롬윈 (http://www.oromwin.com/)
감사합니다