최신정보검색론 Chapter 131 13 장 웹 탐색 목차 13.1 소개 13.2 도전 13.3 웹의 특성화 13.4 탐색 엔진 13.5 브라우징 13.6 메타 탐색기 13.7 건초더미에서 바늘 찾기 13.8 하이퍼 링크를 이용하여 탐색하기 13.9 연구 동향 및 쟁점.

Slides:



Advertisements
Similar presentations
Big Data & Hadoop. 1. Data Type by Sectors Expected Value using Big Data.
Advertisements

ReadyNAS Surveillance for x86 platform (Version ) NETGEAR.
Proprietary ETRI OOO 연구소 ( 단, 본부 ) 명 1 CDN 을 위한 캐시 시험 모듈 소프트웨어연구부문 빅데이터 SW 플랫폼연구부 분석소프트웨어연구실 ETRI Technology Marketing Strategy ETRI Technology Marketing.
Format String Attack! 포맷 스트링 공격 경일대학교 사이버보안학과 학년 남주호.
컴퓨터와 인터넷.
목 차 C# 언어 특징 .NET 프레임워크 C# 콘솔 프로그램 C# 윈도우 프로그램 실습 프로그래밍세미나 2.
정보 보안 개론과 실습 네트워크 해킹과 보안 3부 해킹 전 정보 획득 Chapter 10. 목록화.
일반 요구 사항 비즈니스 요구사항 고객/정보/위치/상태 탐색방법 제품/서비스 홍보 및 광고 방법
URLink 팀명: S.B.S. 팀원: 김보성, 박지수.
1. 신뢰할 수 있는 싸이트 등록 인터넷 익스플로러 실행 후 실행
컴퓨터의 응용-검색엔진 <컴퓨터의 응용> 교수명: 용환승 공학부, 이한아
인터넷 서비스.
MS-Access의 개요 1강 MOS Access 2003 CORE 학습내용 액세스 응용 프로그램은 유용한 데이터를
Ch.07-5 xml-rpc 사용하기 김상엽.
1. Windows Server 2003의 역사 개인용 Windows의 발전 과정
4장 질의 언어 목 차 4.1 소개 4.2 키워드 기반 질의 4.3 패턴 정합 4.4 구조 질의 4.5 질의 프로토콜
(개정판) 뇌를 자극하는 Red Hat Fedora 리눅스 서버 & 네트워크
웹 서버 동작 HTTP 클라이언트가 서버와 대화하는 방법과 데이터를 서버에서 클라이언트로 전송 하는 방법을 정의한 프로토콜
데이터베이스 및 설계 금오공과대학교 컴퓨터공학부 이 이섭.
"e특허나라" 서비스 안내 1. 시스템 개요 2. 주요 서비스 기능.
MICE IT 프로젝트 2011년 1학기.
1장 소개 목 차 1.1 동기 1.2 기본 개념 1.3 과거, 현재와 미래 1.4 검색 과정 1.5 교재의 구성
3.2 SQL Server 설치 및 수행(계속) 시스템 데이터베이스 master
FTP 프로그램 채계화 박재은 박수민.
제 2 장 WML 시뮬레이터 및 무선인터넷 서버 설치
고급 웹 개발 응용 프로젝트 2010년 1학기.
                              데이터베이스 프로그래밍 (소프트웨어 개발 트랙)                               퍼스널 오라클 9i 인스톨.
모바일 자바 프로그래밍 JDBC / WAP Ps lab 오민경.
홈페이지용 그림 활용법 그림 삽입 태그 <IMG> 배경 그림 다루기 그림과 문자열의 어울림
제 01 장 인터넷 프로그래밍 개요 학기 인터넷비즈니스과 강 환수 교수.
제 1장. 멀티미디어 시스템 개요.
1장. 데이터베이스 자료의 조직적 집합체_데이터베이스 시스템의 이해
11.텍스트를 위한 화일.
(인터페이스 상세 이용 방법 및 다운로드 (대출모드) 안내)
Method & library.
JA A V W. 03.
2장 모델링 2.1 소개 2.2 정보 검색 모델의 분류체계 2.3 검색 : 축적과 여과 2.4 정보 검색 모델의 형식 특성
2장. JSP 프로그래밍을 위한 환경구성 제2장.
27장. 모듈화 프로그래밍.
SAS Statistical Analysis System 통계패키지 실습 (2011년 1학기)
2장. 데이터베이스 관리 시스템 데이터베이스 관리 시스템의 등장 배경 데이터베이스 관리 시스템의 정의
HTTP 프로토콜의 요청과 응답 동작을 이해한다. 서블릿 및 JSP 를 알아보고 역할을 이해한다.
Day-27(Tue_10.16) 파일 서비스 설정 AD 가 설치된 환경에서 DHCP 설치 할 경우 권한 자격을 주어야함.
15장 컬렉션 프레임워크 Section 1 컬렉션 프레임워크의 개요 Section 2 리스트 Section 3 셋
USN(Ubiquitous Sensor Network)
8장 쿠키와 세션 한빛미디어(주).
웹디자인
Chapter 03. 관계 데이터베이스 설계.
BIC 사례 1 연관규칙과 분류모형을 결합한 상품 추천 시스템: G 인터넷 쇼핑몰 사례
World Wide Web 중앙대학교 안 봉 현
20 장 네트워킹과 인터네트워킹 장치 20.1 리피터(Repeaters) 20.2 브리지(Bridges)
인천대학교 웹과 인터넷 수업 개요 및 내용 소개.
(2)인터넷 서비스 1.전자 우편: 1)메일 계정 만들기 2)전자 우편 주소의 형식 3)주소록 관리하기 ①주소록 등록 ②전자 우편 그룹 활용 ③메시지 맺음말 ④전자우편 보내기 ⑤받은 전자 우편 확인 2.텔넷-원격 로그인: 1)텔넷 사용조건 ①TCP/IP에 따른 인터넷.
네트워크 환경 구축과 이미지 전송 호스트/타겟 통신 직렬 통신을 이용한 이미지 전송 수퍼 데몬 BOOTP 환경 구축
Cold Spring Harbor Laboratory Press 저널 이용 매뉴얼
클러스터 시스템에서 효과적인 미디어 트랜스코딩 부하분산 정책
다차원 색인을 사용하는 실질적인 응용예제 컴퓨터 과학과 이 대 기.
메타검색 이용안내 전자자원 통합검색 2011 중 앙 도 서 관.
Introduction to JSP & Servlet
4장. 데이터 표현 방식의 이해. 4장. 데이터 표현 방식의 이해 4-1 컴퓨터의 데이터 표현 진법에 대한 이해 n 진수 표현 방식 : n개의 문자를 이용해서 데이터를 표현 그림 4-1.
Viewing Advanced Web Pages
 파일 아카이브와 압축 명령 익히기.
시스템 인터페이스 Lab1 X-window 및 명령어 사용.
멀티미디어시스템 제 5 장. 멀티미디어 데이터베이스 개념 IT응용시스템공학과 김 형 진 교수.
9 브라우저 객체 모델.
프로그래밍 언어 학습을 위한 가상실습환경 창원대학교 이수현.
학부 컴퓨터공학부 교육과정 (학부) 2학년 4학년 3학년 1학년 1학기 2학기 IPP 자격과정 전공트랙
 6장. SQL 쿼리.
6 객체.
디지털광고 구동 원리 전중달 CTO.
Presentation transcript:

최신정보검색론 Chapter 장 웹 탐색 목차 13.1 소개 13.2 도전 13.3 웹의 특성화 13.4 탐색 엔진 13.5 브라우징 13.6 메타 탐색기 13.7 건초더미에서 바늘 찾기 13.8 하이퍼 링크를 이용하여 탐색하기 13.9 연구 동향 및 쟁점 참고 문헌 고찰

최신정보검색론 Chapter 소개 웹 탐색의 기본 형태 - 웹 문서 한 부분에 색인을 단 검색엔진 사용 - 웹 디렉토리를 사용 - 하이터 링크 구조를 이용 웹 통계와 모델 웹 탐색에 사용되는 도구 웹 그래프 구조 이용한 새로운 질의어 현재의 연구 동향과 쟁점

최신정보검색론 Chapter 도전 데이터와 관련된 문제점 - 분산 데이터 - 고율의 휘발성 데이터 - 대용량 - 비체계적이고 과다한 데이터 - 데이터의 질 - 이질적인 데이터 사용자와 관련된 문제점 - 어떻게 질의를 기술 - 시스템에 의해 제공되는 응답을 어떻게 해석

최신정보검색론 Chapter 웹의 특성화 웹의 평가 그림 13.1 웹의 성장

최신정보검색론 Chapter 웹 모델링 표 13.1 웹의 언어들 (p 418) 그림 13.2 파일 크기의 분포

최신정보검색론 Chapter 웹 모델링 ( 계속 ) X 바이트인 문서 찾을 확률 평균 =u 표준편차 = Pareto 분포 K,a= 분포의 매개변수

최신정보검색론 Chapter 중앙집중 구조 그림 13.3 전형적인 문서수집기 – 색인기 구조 13.4 탐색엔진

최신정보검색론 Chapter 분산구조 Harvest 의 분산 접근 방식의 문제점 - 웹 서버 부하가중 - 웹 트래픽이 증가 - 검색엔진 협동없이 정보가 독립적으로 모임

최신정보검색론 Chapter 사용자 인터페이스 인터페이스의 중요한 관점 - 질의 인터페이스 - 응답 인터페이스

최신정보검색론 Chapter 1310

최신정보검색론 Chapter 1311 질의에 대한 결과 위에서 아래로 알타비스타, 핫봇, 노던라이트, 익사이트

최신정보검색론 Chapter 순위화 탐색엔진들은 순위화를 위해 불리안과 벡터 모델의 변형 이용 순위화 알고리즘 - Boolean spread, vector spread, most-cited 활용화 순위화 기법 - WebQuery 웹페이지에 시각적 표시를 허용

최신정보검색론 Chapter 순위화 ( 계속 ) Kleinberg 제안, HITS 이용 –Hub –Authority PageRank : Google 순위화의 일부 PR(a) = pagerank, C(a)=a 의 나가는 링크들의 수 PR = pagerank

최신정보검색론 Chapter 웹 수집 웹 수집 기법 - URL 집합 - 넓이우선, 깊이우선 방식의 재귀적으로 이어지는 다른 URL 을 추가하는 것 너비우선 정책 - 현재 페이지가 링크한 모든 페이지 검사 - 관련 주제들에 의해 구조화된 사이트에 잘 맞음 - 웹 서버가 많은 긴급 요청들에 공격 받을 수 있다. 깊이우선정책 - 동일 페이지에서 같은 일을 재귀적으로 수행

최신정보검색론 Chapter 웹 디렉토리 장점 - 사용자가 찾는 것을 알면 응답은 유용 단점 - 분류가 충분히 분화가 안됨 - 모든 웹페이지가 분류되지는 않음 13.5 브라우징

최신정보검색론 Chapter 웹 디렉토리 ( 계속 ) 웹 디렉토리 URL 웹 사이트 수 범주 수 eBLAST LookSmart www.looksmart.co.kr Lycos Subjects a2z.lycos.com 50 - Magellan NewHoo www.newhoo.com Netscape - Search.com Snap Yahoo! 표 13.4 웹 디렉토리 내의 최상위 범주들 (p 434)

최신정보검색론 Chapter 탐색과 브라우징의 결합 WebGlimpse - 브라우징과 탐색을 결합한 도구 - 브라우징 중단 안하고도 사이트 탐색이 가능 - 개인 웹 페이지와 자주 찾는 URL 목록 색인 구축에 유용

최신정보검색론 Chapter 도움이 되는 도구 Alexa - 해당 사이트의 인기, 접근 속도, 참신성, 전반적인 품질 제공 - 사용자의 항해를 돕는 관련 사이트들을 제시

최신정보검색론 Chapter 메타 탐색기 메타 탐색기란 ? - 주어진 질의를 여러 탐색 엔진, 웹 디렉토리와 데이터베이스에 보내 거기에서 오는 응답들을 모아 통합하는 웹 서버 메타 탐색기의 장점 - 탐색 결과가 호스트, 키워드, 날짜 등과 같은 다른 속성에 의해 정렬 가능 - 단일 탐색 엔진 출력보다 더 많은 정보 출력 표 13.5 메타 탐색기 예 (p437)

최신정보검색론 Chapter 사용자 문제 질의 인터페이스와 사용자간의 문제 - 탐색하는 것의 의미를 정확히 이해 못함 - 논리적 상을 알지 못함 - 불리안 논리로 어려움을 겪음 표 13.6 웹에서의 질의 : 평균값 측 정 평균 값 범위 단어의 수 to 393 연산자의 수 to 958 각 질의의 반복 수 ∼ 1.5 백만 사용자 세션 당 질의 수 ∼ 173,325 질의 당 화면 수 ∼ 78,496

최신정보검색론 Chapter 몇몇 예들 장기 (shogi) 와 바둑 (go) 장기와 달리 바둑은 고유단어가 아니므로 색인시 올바른 의미를 담지 못할 수 있다. 재규어의 속도 고양이과에 재규어의 속도를 알고 싶지만 자동차 재규어의 속도를 나타냄

최신정보검색론 Chapter 사용자를 가르치는 일 경험적 규칙 아래와 같은 경험을 이용하여 검색엔진의 도움을 받을 수 있는 방법을 가르칠 수 있다. - 한정된 질의 - 광대한 질의 - 모호한 질의

최신정보검색론 Chapter 웹질의어 웹 질의 - 웹 페이지로부터 정보 추출 - 웹 사이트를 구축하고 재구조화로 확장 13.8 하이퍼링크를 이용하여 탐색

최신정보검색론 Chapter 동적 탐색과 소프트웨어 에이전트 동적탐색의 장점 - 웹의 현 구조에서만 탐색 - 탐색엔진의 색인에 저장된 것은 탐색 안함 - 전체 웹은 느림, 작고 동적인 웹에서 유용 소프트웨어 에이전트 - 중요논쟁 : 관련 정보원을 어떻게 결정, 검색 결과 어떻게 합치나

최신정보검색론 Chapter 연구 동향 및 쟁점 동향 - 모델링 - 질의 - 분산 구조 - 순위화 - 색인 - 동적 페이지 - 중복 데이터 - 멀티 미디어 - 사용자 인터페이스 - 브라우징

최신정보검색론 Chapter 연구 동향 및 쟁점 ( 계속 ) 중요한 쟁점 - 질의 탐색 엔진들 사이의 표준 프로토콜 - 인트라넷의 응용