1장 소개 목 차 1.1 동기 1.2 기본 개념 1.3 과거, 현재와 미래 1.4 검색 과정 1.5 교재의 구성

Slides:



Advertisements
Similar presentations
정보의 공유와 보호 정보의 공유와 관리 2. 정보 보호 기술과 지식 재산권.
Advertisements

Big Data & Hadoop. 1. Data Type by Sectors Expected Value using Big Data.
KARGER 서울대학교의학도서관 ,
최신정보검색론 Chapter 장 웹 탐색 목차 13.1 소개 13.2 도전 13.3 웹의 특성화 13.4 탐색 엔진 13.5 브라우징 13.6 메타 탐색기 13.7 건초더미에서 바늘 찾기 13.8 하이퍼 링크를 이용하여 탐색하기 13.9 연구 동향 및 쟁점.
Journal Citation Report Thomson Reuters 한국 지사. 해외전자정보 서비스 이용교육 Page Journal Citation Report 접속 RISS- 해외전자정보서비스이용교육 2 Journal Citation Reports 전 세계의 주요.
컴퓨터와 인터넷.
4D기술로 인한 책의 인터페이스 변화 : 디지로그북
컴퓨터 운영체제의 역사 손용범.
일반 요구 사항 비즈니스 요구사항 고객/정보/위치/상태 탐색방법 제품/서비스 홍보 및 광고 방법
그래픽스 및 웹 응용설계 자기소개 멀티미디어 학과 4학년 장정환.
인터넷의활용.
네트워크 기술을 통한 현재와 미래 소개.
뇌를 자극하는 Windows Server 2012 R2
이산수학 (2012년 2학기) : 강의 소개 담당교수: 류승택 (60주년 기념관: 18407)
인터넷 서비스.
MS-Access의 개요 1강 MOS Access 2003 CORE 학습내용 액세스 응용 프로그램은 유용한 데이터를
Entity Relationship Diagram
1. Windows Server 2003의 역사 개인용 Windows의 발전 과정
ASCE (American Society of Civil Engineers)
데이터베이스 및 설계 금오공과대학교 컴퓨터공학부 이 이섭.
컴퓨터과학 전공탐색 배상원.
CAS (Computer Algebra System) 소개
1. 현대 생활과 응용 윤리의 필요성 2. 윤리 문제의 탐구와 실천 3. 윤리 문제에 대한 다양한 접근
제 1장. 멀티미디어 시스템 개요.
1장. 데이터베이스 자료의 조직적 집합체_데이터베이스 시스템의 이해
간지 Ⅰ. 시스템소개 Autoway Groupware User Manual Ⅰ. 시스템 소개 | 시스템 소개.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
2장 모델링 2.1 소개 2.2 정보 검색 모델의 분류체계 2.3 검색 : 축적과 여과 2.4 정보 검색 모델의 형식 특성
상세검색 사용자 매뉴얼 1. 상세검색 화면소개 2. 키워드 조건 검색 3. 항목별 검색 4. 소재지, 인증 조건 검색.
제 10 장 의사결정이란 의사결정은 선택이다.
2장. 데이터베이스 관리 시스템 데이터베이스 관리 시스템의 등장 배경 데이터베이스 관리 시스템의 정의
퍼지이론(Fuzzy Theory) 지 은 희.
Endnote 이용 안내 2010 중 앙 도 서 관.
Adobe 제품 다운로드 및 설치 방법 안내 Adobe Creative Cloud Adobe License 권한을 받으신 분
뇌를 자극하는 Windows Server 장. 원격 접속 서버.
Information Retrieval (Chapter 1: Introduction)
USN(Ubiquitous Sensor Network)
American Society for Microbiology
2019년도 전자정보공학과 이수체계도 1학년(트랙) 2학년(트랙) 3학년(트랙) 4학년 1학기 2학기 1학기 2학기 1학기
Chapter 03. 관계 데이터베이스 설계.
04. DBMS 개요 명지대학교 ICT 융합대학 김정호.
KERBEROS.
데이터 베이스 DB2 관계형 데이터 모델 권준영.
KARGER 서울대학교의학도서관 ,8054.
단계1 단계2 단계3 단계4 단계5 단계별 제목 상세내용1 상세내용
ULRICHSWEB ㈜신원데이터넷.
CAS (Computer Algebra System) 소개
2 컴퓨터와 통신 기술 3 정보의 보호와 공유 정보의 보호 정보의 공유 금성출판사.
XML (eXtensible Markup Language) 개요
알고리즘 알고리즘이란 무엇인가?.
모바일인터넷기초 전산정보학부 모바일인터넷과 권 춘 우
고급 정보 검색 1. 개 요.
김정숙 (고려대학교 2014년) 국어국문학과 한국어학 석사 1기 이 드미뜨리
다차원 색인을 사용하는 실질적인 응용예제 컴퓨터 과학과 이 대 기.
메타검색 이용안내 전자자원 통합검색 2011 중 앙 도 서 관.
오라클 11g 보안.
지능 로봇 연구회 Korean Institute of intelligent systems.
멀티미디어시스템 제 4 장. 멀티미디어 데이터베이스 정보환경 IT응용시스템공학과 김 형 진 교수.
멀티미디어시스템 제 5 장. 멀티미디어 데이터베이스 개념 IT응용시스템공학과 김 형 진 교수.
학습내용 프로토콜 계층화 OSI 모델의 용어 및 기능 개체 서비스 접근점 (N) 프로토콜과 (N) 서비스 서비스 프리미티브
11장 배열 1. 배열이란? 1.1 배열의 개요 1.2 배열의 선언과 사용.
발표자 : 이지연 Programming Systems Lab.
.Net FrameWork for Web2.0 한석수
학부 컴퓨터공학부 교육과정 (학부) 2학년 4학년 3학년 1학년 1학기 2학기 IPP 자격과정 전공트랙
(Motion fusion based static and dynamic hand gesture recognition)
KARGER 서울대학교의학도서관
 6장. SQL 쿼리.
                              데이터베이스 설계 및 실습 #6 - SQL 실습 한국외국어대학교 DaPS 연구실                              
웹 사이트 분석과 설계 학과 : e-biz 경영학과 2-2 학번 : 이름 : 이재섭.
American Society for Microbiology
Presentation transcript:

1장 소개 목 차 1.1 동기 1.2 기본 개념 1.3 과거, 현재와 미래 1.4 검색 과정 1.5 교재의 구성 1.6 교재의 사용 1.7 참고 문헌 고찰 최신정보검색론 Chapter 1

1.1 동기 정보검색 (Information Retrieval: IR) 정보 항목들에 대한 표현, 저장, 조직, 접근 사용자가 관심 있는 정보에 대해 쉬운 접근을 제공 가상 사용자 정보 요구 예 다음과 같은 대학 테니스 팀에 대한 정보를 지니고 있는 모든 페이지(문헌)를 찾아라 미국 내 대학에서 운영되고 NCAA 테니스 토너먼트에 참가 단, 지난 3년간의 미국 내 순위와 팀 코치의 전자메일 또는 전화번호 포함 IR 시스템의 중요 목표 해당 IR 시스템의 질의(query) 형태로 변환 사용자에게 유용하거나 연관될 지도 모르는 정보를 검색 최신정보검색론 Chapter 1

1.1.1 정보와 데이터 검색 명확히 정의된 조건에서 모든 객체들을 검색 잘 정의된 구조와 의미를 가진 데이터 정보 검색 데이터 검색 (Data Retrieval: DR) 명확히 정의된 조건에서 모든 객체들을 검색 정규식이나 관계 대수 표현 잘 정의된 구조와 의미를 가진 데이터 관계형 데이터베이스 정보 검색 질의를 만족하는 데이터보다는 그 주제에 연관된 정보를 검색 자연언어 텍스트를 취급 잘 구조화되어 있지도 않으며, 의미적으로도 모호함 문헌 내용의 해석 문헌 텍스트로부터 구문/의미 정보를 추출하고, 이 정보를 이용해 사용자 정보 요구와 정합 사용자 질의와의 연관도에 따라 순위를 매김 연관성(relevance) 인식이 정보 검색의 핵심 IR 시스템의 주요 목표 사용자 질의와 연관된 모든 문헌을 검색 가능한 한 비연관 문헌을 줄임 최신정보검색론 Chapter 1

1.1.2 시대 중심에 위치한 정보 검색 정보 검색의 역사 ’60-’70년대: 텍스트 색인과 유용한 문헌 탐색 도구 ‘80년대 모델링, 문헌 분류 및 범주화, 시스템 구조, 사용자 인터페이스, 데이터 가시화, 여과, 언어 등을 포함 도서관 사서나 정보 전문가들만의 협소한 관심영역 ‘90년대 월드 와이드 웹의 등장 전례없는 규모로 생각과 정보의 공유를 가능 인류 지식과 문화의 보편적인 저장소 모든 사람이 접할 수 있는 새로운 출판 매체 주요 장애물 웹을 위해 잘 정의된 데이터 모델의 부재 정보의 정의와 구조가 저수준 유망한 해결책으로 웹 검색 부각 최신정보검색론 Chapter 1

1.1.3 교재의 초점 정보 검색에 관한 전반적인 연구 성과 컴퓨터 과학 입장 IR 시스템에서 사용되는 컴퓨터 알고리즘과 기술에 초점 인간중심으로 해석 도서관 사서나 정보과학 연구자의 관점 소개 정보검색과 관련된 다른 분야와 통합 기술: 텍스트/ 멀티미디어 검색, 사용자 인터페이스, 시각화 응용: 웹, 도서관 시스템, 디지털 도서관 최신정보검색론 Chapter 1

1.2 기본 개념 연관 정보의 효과적인 검색 요소 사용자 작업 검색시스템이 채택한 논리적 문헌 작업에 따른 사용자와 검색 시스템간의 상호작용 최신정보검색론 Chapter 1

1.2.1 사용자 작업 가져오기(pulling) 작업 정보와 데이터 검색 해당 시스템이 제공하는 질의언어로 변환 IR : 정보 요구의 의미를 담고 있는 단어 집합 DR : 정규식 전통적인 정보 검색 시스템 브라우징 시작시 목적이 명확하게 정의되어 있지 않고 사용 중에 목적이 바뀜 하이퍼텍스트 시스템 정보와 데이터 검색에 브라우징을 통합 아직 일반적이지 못하고 미래에나 가능 밀어넣기(push) 작업 사용자에게 유용한 정보를 주기적으로 추출하여 보내줌 정보 여과(filtering) 최신정보검색론 Chapter 1

1.2.2 논리적 문헌 전문(full text) 문헌에 포함된 모든 단어의 집합 가장 완벽한 형태의 논리적 문헌 높은 계산 비용을 수반 색인어나 키워드의 집합 문헌 텍스트로부터 직접 추출 대규모의 문헌 집합에서 대표 키워드 집합으로 축소 텍스트 작업(또는 변형) 불용어(stopword ; 관사나 접속사와 같은) 제거 스테밍(stemming ; 문법적으로 공통인 어원으로 변환) 명사 그룹(형용사, 부사, 동사 제거) 확인 압축 주제 색인자(정보과학 영역 전문가)에 의해 명기 작은 규모의 카테고리: 가장 간결한 형태의 논리적 문헌 낮은 수준의 검색 결과 최신정보검색론 Chapter 1

문헌의 논리적 상 전문에서 색인어 집합까지 최신정보검색론 Chapter 1

1.3 과거, 현재와 미래 1.3.1초기 연구 검색하고 사용할 목적으로 정보를 조직화 책의 목차 색인 연관 정보에 대한 지시자 역할을 해주는 선택된 단어나 개념 목록 분류체계 도서관학(또는 문헌정보학) 분야의 전문가들에 의해 대부분이 고안 대규모 색인을 자동으로 구축하는 것이 가능해짐 정보 검색의 두 관점 컴퓨터 중심 효율적인 색인, 고성능의 사용자 질의 처리, 순위결정 알고리즘이 중요 인간 중심 사용자 행태 연구, 사용자 주요 요구의 이해와 함께 어떻게 이런 것들이 검색 시스템의 조직과 동작에 영향을 미치는가가 중요 최신정보검색론 Chapter 1

1.3.2 도서관에서의 정보 검색 1세대 시스템 카드 목록과 같은 이전의 기술들을 자동화하는 차원 저자나 제목으로 검색 가능 2세대 시스템 주제어나 키워드, 좀 더 복잡한 질의 처리 등의 향상된 탐색 기능들이 추가 3세대 시스템 향상된 그래픽 인터페이스, 전자 형태, 하이퍼텍스트 기능 및 개방형 시스템 구조 등에 초점 최신정보검색론 Chapter 1

1.3.3 웹과 디지털 도서관 컴퓨터 기술 발전과 웹에 의한 변화 저비용: 매우 저렴하게 다양한 정보원의 접근이 가능 접근의 용이: 수많은 네트워크에로의 신속한 접근이 가능 출판의 자유: 대규모 출판 매체에 자유로운 접근이 가능 웹(디지털 도서관) 고수준의 상호작용(interactivity)이 가능한 매체 서비스 편의성 향상 해결해야 할 세 가지 중요 문제 동적 환경에서 양질의 검색을 제공 색인과 질의 응답 시간을 빠르게 제공 사용자 행태의 이해 새로운 정보 검색 전략의 설계와 전개에 영향 최신정보검색론 Chapter 1

1.3.4 실용적인 문제 보안과 사생활보호 전자상거래 보안상의 이유로 암호화나 자동 인증 형식을 제공 제3자에 의해 개인정보가 오용되는 것을 방어 저작권과 특허 웹상의 광범위한 데이터 유포와 저작권법이나 특허법과의 관계 대규모 디지털 도서관 설립과 전개 사업에 중요 기타 스캐닝 광학문자인식(OCR) 교차 언어 검색(질의언어와 검색된 문헌의 언어가 상이한 경우) 최신정보검색론 Chapter 1

1.4 검색 과정 최신정보검색론 Chapter 1

1.4 검색 과정(계속) 사용될 문헌 텍스트에 수행될 명령어 텍스트 모델(검색 대상 요소로서의 텍스트 구조) 텍스트 데이터베이스 정의(데이터베이스 관리자) 사용될 문헌 텍스트에 수행될 명령어 텍스트 모델(검색 대상 요소로서의 텍스트 구조) 텍스트 색인 생성 가장 결정적인 자료구조 대량의 데이터를 빠르게 검색 역파일(inverted file) 구조 최신정보검색론 Chapter 1

1.4 검색 과정(계속) 검색 사용자의 요구를 명기 텍스트 명령어와 동일하게 분석되고 변형 질의 연산(query operation) 적용 색인구조에 의해 검색 연관 가능성(likelyhood)에 따라 순위화 사용자 피드백(user feedback) 사용자의 관심에 정확히 부합되는 문헌들을 선택 Go to 3 최신정보검색론 Chapter 1

1.5 교재의 구성 최신정보검색론 Chapter 1

1.5.2 교재의 구조 최신정보검색론 Chapter 1

1.7 참고 웹 페이지 Brazil: http://www.dcc.ufmg.br/irbook Chile: http://sunsite.dcc.uchile.cl/irbook 정보 검색에 대한 주요 논문지 Journal of the American Society of Information Sciences(JASIS) ACM Transactions on Information Systems Information Processing & Management(IP&M, Elsevier) Information Systems(Elsevier) Information Retrieval(Kluwer) Knowledge and Information Systems(Springer) 학술회의 ACM SIGIR International Conference on Information Retrieval ACM International Conference on Digital Libraries(ACM DL) ACM Conference on Information Knowledge and Management(CIKM) Text REtrieval Conference(TREC) IRAL (International Workshop on Information Retrieval with Asian Languages) 한글 및 한국어 정보처리 학술대회 최신정보검색론 Chapter 1