5 장 웹 페이지의 검색 이 재 광 한남대학교 컴퓨터공학과
5.1 웹 검색 엔진의 유형 5.1.1 웹 인덱스 방식(Keyword 검색 방식) 5장 웹 페이지의 검색 5.1 웹 검색 엔진의 유형 5.1.1 웹 인덱스 방식(Keyword 검색 방식) 가장 일반적인 방식으로, 검색어를 포함한 웹 문서들을 검색 로봇이 주기적으로 인터넷 상의 정보를 검색하여 검색 엔진의 호스트 컴퓨터에 보내어 새로운 인덱스 데이터베이스 구성 로봇의 추출 방법과 효율성에 의해 검색 엔진의 성능 좌우 단점 검색결과가 너무 많아져 사용자의 판단을 흐리게 할 수 있음 특정 단어만의 검색에 의한 결과이므로 웹 문서의 신뢰도가 낮아짐 검색 연산자가 초보자에게는 어려움
AltaVista : http://www.altavista.co.kr/(한국) 5장 웹 페이지의 검색 웹 인덱스 방식의 대표적인 검색 엔진 AltaVista : http://www.altavista.co.kr/(한국) : http://www.altavista.com/(미국) Lycos : http://www.lycos.co.kr/(한국) : http://www.lycos.com/(미국) Excite : http://www.excite.com/ 네이버 : http://www.naver.com 심마니 : http://simmany.chollian.net/
5장 웹 페이지의 검색 웹 인덱스 방식 검색엔진의 정보 수립
5.1.2 웹 디렉토리 방식 (메뉴 검색 방식) 인터넷에 존재하는 웹 문서들을 주제별, 계층별로 정리하여 데이터베이스 구축 5장 웹 페이지의 검색 5.1.2 웹 디렉토리 방식 (메뉴 검색 방식) 인터넷에 존재하는 웹 문서들을 주제별, 계층별로 정리하여 데이터베이스 구축 검색 방법 : 나열되어 있는 분류 항목 중 가장 가까운 항목을 선택하여 따라가면 되므로 매우 쉽고 간단 검색 원리 : 사람이 직접 문서를 수집하고 관리 장점 : 웹 문서의 신뢰도가 높아짐 단점 : 검색결과로 얻는 웹 문서의 수가 비교적 적으므로 풍부한 검색 결과를 얻을 수 없음
5.1.3 통합형 검색 방식 웹 디렉토리 방식의 대표적인 검색 엔진 : http://www.yahoo.com 5장 웹 페이지의 검색 웹 디렉토리 방식의 대표적인 검색 엔진 Yahoo! : http://www.yahoo.co.kr(한국) : http://www.yahoo.com Argus Clearinghouse : http://www.clearinghouse.net 5.1.3 통합형 검색 방식 자신만의 인덱스 데이터베이스를 소유하지 않고 사용자가 입력하는 검색어들을 다른 검색 엔진들에게 보내고 이를 통한 검색 결과들을 사용자에게 보여 주는 방식 검색 방법은 웹 인덱스 방식과 매우 유사
MetaCrawler : http://www.metacrawler.com 5장 웹 페이지의 검색 통합형 검색 방식의 검색 엔진 MetaCrawler : http://www.metacrawler.com All In One : http://www.albany.net/allinone 모찾니 : http://www.mochanni.com/
5.2 Yahoo!를 이용한 검색 야후코리아 : http://www.yahoo.co.kr 5장 웹 페이지의 검색 5.2 Yahoo!를 이용한 검색 야후코리아 : http://www.yahoo.co.kr Yahoo! : http://www.yahoo.com 웹 검색엔진의 시초 웹 디렉토리 방식으로 주제별 분류가 잘 되어 있고 정보의 신뢰도가 높은 장점을 가짐 야후에 자신의 사이트 등록 신청을 할 수 있고, 확인 후 조정 과정을 거쳐 Yahoo Category에 추가됨 비교적 알기 쉬운 검색 옵션 제공, 논리 검색 지원 웹과 유즈넷, 전자우편 주소에 대한 검색 지원
5장 웹 페이지의 검색 Yahoo!의 초기 화면
5.2.1 웹 디렉토리 방식의 검색 예술, 비즈니스, 컴퓨터, 인터넷 등 14가지 분류 서비스 제공 5장 웹 페이지의 검색 5.2.1 웹 디렉토리 방식의 검색 예술, 비즈니스, 컴퓨터, 인터넷 등 14가지 분류 서비스 제공 주제별 항목들에 부가된 표시의 의미
1.[Recreation & Sports] 항목에서 [Travel] 선택 검색 예제) 유럽 철도 여행 스케줄 알아보기- 웹 디렉토리 방식 1.[Recreation & Sports] 항목에서 [Travel] 선택 2.[Train Travel] 선택
3.[European Rail Travel] 항목 선택 4.[Comprehensive European Train Schedules!] 선택
5.유럽 철도 시스템 데이터베이스 6.시간 및 노선 입력 7.검색 결과 보기
5.2.1 웹 인덱스 방식의 검색 기본 검색 입력란에 찾으려는 검색어를 입력하고 [Search] 버튼을 누름 검색 결과 5장 웹 페이지의 검색 5.2.1 웹 인덱스 방식의 검색 기본 검색 입력란에 찾으려는 검색어를 입력하고 [Search] 버튼을 누름 여러 검색어를 입력할 경우 빈칸으로 구분하면 AND 조건으로 찾아줌 검색 결과 검색어와 일치하는 영역의 목록이 나옴 일치하는 것이 없으면 web-wide, full-text document search를 수행하여 웹 사이트를 탐색
[Option]을 클릭하여 원하는 조건을 선택하거나 5장 웹 페이지의 검색 검색 조건 지정 [Option]을 클릭하여 원하는 조건을 선택하거나 Yahoo!에서 제공하는 advanced search syntax를 이용하여 검색어를 입력 야후의 검색 조건 지정 방법
“*” 연산자 사용 시 “*” 와 함께 쓰인 단어 자체는 검색해 주지 않음 주의할 점 “*” 연산자 사용 시 “*” 와 함께 쓰인 단어 자체는 검색해 주지 않음 예) “사이버*” : “사이버” 단어 검색 하지 않음 같은 우선 순위를 갖는 연산자를 함께 사용 시 왼쪽부터 처리됨 검색 예제) 마야의 피라미드 검색 - 웹 인덱스 방식 +t:pyramid -giza -egypt +maya 입력(제목에 이집트나 기자가 포함되지 않은 마야의 피라미드 검색)
5장 웹 페이지의 검색 검색 사이트 목록 검색한 홈 페이지 열람
5.3 AltaVista를 이용한 검색 한국 알타비스타 : http://altavista.co.kr 5장 웹 페이지의 검색 5.3 AltaVista를 이용한 검색 한국 알타비스타 : http://altavista.co.kr AltaVista : http://altavista.digital.com/ http://altavista.com 검색 엔진중 가장 뛰어나다고 평가됨 (1998 상반기) 특징 검색 속도가 빠르고 정확성이 높다. 광범위한 검색 범위와 연산자 및 필드 검색지원 유즈넷 검색 지원 , 대소문자 구별 단순 검색과 고급 검색으로 나누어서 지원 본문 전체 검색을 지원하는 동시에 문서의 전체 내용을 색인화 하여 데이터 베이스로 구축하고 있음
5장 웹 페이지의 검색 AltaVista의 초기 화면
웹과 유즈넷 중 검색 분야와 사용 언어를 선택하고 검색어 입력후 [Submit] 버튼 클릭 5장 웹 페이지의 검색 단순 검색 웹과 유즈넷 중 검색 분야와 사용 언어를 선택하고 검색어 입력후 [Submit] 버튼 클릭 자료의 우선 순위 검색어가 서두에 포함된 자료 검색어들이 서로 근접하여 포함되어 있는 자료 검색어가 가능한 여러 번 포함된 자료. Requiring / Excluding AltaVista의 단순 검색 옵션
AltaVista에서 조건 검색의 논리 연산자 5장 웹 페이지의 검색 조건 검색(Advanced Search) 랭킹과 날짜를 검색 조건으로 입력 할 수 있음 랭킹(Ranking) : 검색 결과의 나열 순위를 설정 Boolean Operation이 가능하나, +,-는 사용 할 수 없음 AltaVista에서 조건 검색의 논리 연산자
여러 검색어를 띄어 쓰기로 입력하면 OR 조건으로 처리 5장 웹 페이지의 검색 검색어 입력 요령 여러 검색어를 띄어 쓰기로 입력하면 OR 조건으로 처리 따옴표 안에 입력하면 검색어와 정확히 일치하는 자료를 검색 괄호 사용하여 우선 순위 부여 할 수 있음 소문자만을 입력하면 대 소문자 구분 없이 검색 세 글자 이상의 영문 뒤에 “*” 붙이면 그것으로 시작되는 단어를 검색 필드 제한 검색 : (필드명):(검색어)와 같이 입력하면 지정된 필드 또는 지정된 부분에서 검색어를 찾음, 검색의 정확성 높임
1. Advanced 검색(1970년도 노벨 문학상 수상자 검색)
2.해당 정보가 나타난 항목을 선택 (통상적으로 처음 부분에 있을 확률이 높음) 3.검색 결과를 통해 솔제니친이 수상자임을 알 수 있음
5.4 Lycos를 이용한 검색 Lycos : http://www.lycos.com 5장 웹 페이지의 검색 5.4 Lycos를 이용한 검색 Lycos : http://www.lycos.com 한국 Lycos : http://www.lycos.co.kr 카네기 멜론 대학의 마이크 L. 몰딘이 개발 Scout Indexer라는 검색 로봇을 탑재 특징 웹 뿐만 아니라 고퍼나 FTP의 문서나 파일가지 검색이 가능 홈페이지의 제목, 머리말과 더불어 각 파일의 첫 20줄과 중요한 100여개의 단어를 갖는 인덱스 데이터베이스를 500만개 정도 구축 검색어에 따라 그것이 등장하는 빈도수나 중요도 등을 자체 계산해서 일정한 점수를 매긴 후 상위 5%에 대해 알려줌
5장 웹 페이지의 검색 Lycos의 초기 화면
메뉴 방식의 검색 영역과 검색 방법을 지정 할 수 있음 5장 웹 페이지의 검색 단순 검색 Lycos의 단순 검색 연산자 Lycos Pro Search 메뉴 방식의 검색 영역과 검색 방법을 지정 할 수 있음 보다 정밀한 검색을 위한 확장 옵션과 논리 연산자 제공
5장 웹 페이지의 검색 Lycos의 Boolean 연산자
5.5 기타 외국 웹 검색 엔진 Excite : htttp://www.excite.com 5장 웹 페이지의 검색 5.5 기타 외국 웹 검색 엔진 Excite : htttp://www.excite.com Web Crawler : http://www.webcrawler.com HotBot : http://www.hotbot.com Go : http://www.go.com Mazellan : http://www.mckinley.com
5.6 심마니를 이용한 정보검색 심마니 : http://www.simmani.com 5장 웹 페이지의 검색 5.6 심마니를 이용한 정보검색 심마니 : http://www.simmani.com ㈜ 한글과 컴퓨터의 자연어 처리팀에서 개발한 한글정보검색 시스템 한글 검색을 가장 효과적으로 지원하는 검색 엔진 빠르고 정확하게 색인 및 순위별 내용 보기 제공 웹 인덱스 방식과 웹 디렉토리 방식 모두 지원
5장 웹 페이지의 검색 심마니의 초기화면
심마니의 분류 항목 : 심마니의 분류 항목 중 검색어와 일치하는 것을 5장 웹 페이지의 검색 검색 결과 심마니의 분류 항목 : 심마니의 분류 항목 중 검색어와 일치하는 것을 보여줌 심마니가 찾은 사이트 : 웹 디렉토리 방식의 검색결과를 보여줌 심마니가 찾은 웹 문서 : 심마니 로봇이 수집한 결과물로서 검색어가 들어있는 모든 웹 페이지들을 보여줌 신문 기사 : 6개 주요 일간지에서 검색한 결과를 보여줌 SEARCH.COM : 검색어를 Search.com에서 검색 Yahoo! :검색어를 야후에서 검색 AltaVista :검색어를 알타비스타에서 검색
확장 여부 : 질의어에 대해서 유의어를 확장시켜 검색 확장 안함(default) : 확장 없이 검색 [사랑 사랑] 5장 웹 페이지의 검색 검색 조건 쪽당 표시 : 한 화면에 출력하는 결과 개수 확장 여부 : 질의어에 대해서 유의어를 확장시켜 검색 확장 안함(default) : 확장 없이 검색 [사랑 사랑] 한글 확장 : 한글로만 확장 [사랑 : 사랑, 사모, 애정,…] 한영 확장 : 한글과 영어로 확장 [ 사랑 : 사랑, 사모, 애정, love, affection..] 발음 확장 : 발음 유사성에 의해 틀릴 수 있는 단어에 대하여 확장 검색. 다만 3음절 이상인 단어만 가능
5장 웹 페이지의 검색 연산자 : 한글 및 영어 방식을 모두 지원 심마니의 연산자
검색 예 : 심마니를 이용한 몽유도원도 검색 [안견 & 몽유도원도] 입력
사이트 목록 검색 사이트 분석 및 결론 도출
5.7 한미르를 이용한 정보검색 한국통신에서 제공하는 종합 검색 포털 사이트 서비스 : 분류항목별 검색 서비스 5장 웹 페이지의 검색 5.7 한미르를 이용한 정보검색 한미르 : http://www.hanmir.com 한국통신에서 제공하는 종합 검색 포털 사이트 기존의 정보탐정이라 불리던 검색엔진을 수정 및 개량 점보 검색 및 전화번호, 일본사이트 번역 서비스등 다양한 부가 서비스 제공 서비스 : 분류항목별 검색 서비스 웹 분류 웹 페이지 분류 신문기사 일본사이트 전화번호 멀티미디어 자료
5장 웹 페이지의 검색 한미르의 초기 화면 한미르의 연산자
화성 세계문화유산에 대한 정보 검색
5.8 모찾니(미스다찾니)를 이용한 정보검색 서비스 검색 엔진 자동 선택 기능 5장 웹 페이지의 검색 5.8 모찾니(미스다찾니)를 이용한 정보검색 미스다찾니 : http://www.mochanni.com 한글과 영문 검색 모두를 지원하는 대표적인 통합형 검색엔진 웹 정보 검색, 국내 중앙 일간지를 이용하여 신문 기사를 검색 서비스 검색 엔진 자동 선택 기능 한글 검색 : 마당발, 한미르, 까치네, 심마니,알타비스타 등 영문 검색 : AltaVista, EXCITE, Lycos등 한글+영문 : 한글 검색 엔진 이용 신문 정보 검색 : 한글 검색 엔진 이용 연산자 : 자체적으로 연산자를 지원하지는 않음
5장 웹 페이지의 검색 모찾니의 초기화면
5.9 기타 한글 검색 엔진 Naver : http://www.naver.com 멀티미디어 정보 검색 가능. 사용법도 간단함. 5장 웹 페이지의 검색 5.9 기타 한글 검색 엔진 Naver : http://www.naver.com 멀티미디어 정보 검색 가능. 사용법도 간단함. 다음 : http://www.daum.net/ 한글 포털사이트 검색엔진. 여러 가지 유용한 부가정보를 제공. 엠파스 : http://www.empas.com/ 최근에 개발된 한글 검색엔진으로 뛰어난 검색결과를 제공. Any Search : http://www.anysearch.com 신문, 웹에 대해서 한글과 영문 검색을 지원. Kor-Seek : http://www.kor-seek.com 한글 기준의 정보검색 방식을 채택함. Z I P! : http://www.zip.org 야후와 사용법이 비슷한 검색엔진임 아자(aZa!) : http://aza.nownuri.net 나우누리에서 제작한 인터넷 검색엔진.
5장 웹 페이지의 검색 5.10 전문 검색 엔진 5.10.1 분야별 전문 검색 엔진
5장 웹 페이지의 검색
5장 웹 페이지의 검색
5장 웹 페이지의 검색
5.10.2 메타(Meta)형 - Front-End형 검색 엔진 5장 웹 페이지의 검색 5.10.2 메타(Meta)형 - Front-End형 검색 엔진 All-In-One : http://allonesearch.com 11개 분야에 걸쳐 200여개의 검색엔진을 제공 SearchCom : http://www.search.com 24개 분야에서 300여개의 검색 엔진을 제공 여러 검색 엔진들을 한 곳에 모아 두고 마음에 드는 것을 선택해서 검색 할 수 있게 해주는 유형의 검색엔진 각 분야별로 전문 검색 엔진들을 제공하는 특징 : 보다 자세한 검색 가능 통합형 검색 엔진과의 차이 통합형 : 여러 검색 엔진들을 이용하지만, 통합형 검색 엔진 자체가 이를 규합하고 통제하며 판단 내리는 역할을 수행 메타형 : 단순하게 많은 종류의 검색 엔진들을 모아 놓은 형태
5장 웹 페이지의 검색 5.11 정보 검색의 과정 정보 검색 단계
검색의 보기) 호킹 박사 출생 연도와 최근의 강의 제목 1. 검색 엔진 선택 및 검색어 입력 2.검색 시작 및 검색 결과 분석
웹 페이지의 검색 3. 스티븐 호킹 박사의 홈페이지 4.스티븐 호킹 박사의 약력
웹 페이지의 검색 5. 스티븐 호킹 박사의 강의 사이트 6. 재검색
5.12 검색 엔진의 기능 비교 검색 엔진 비교 분석