정보 검색 시스템의 종류 :검색엔진 의공학과 04606029 신상교
Contents 검색엔진이란? 주제별 카탈로그 키워드 검색엔진 Front-End 지능형 검색엔진
검색 엔진 이란? 인터넷에서 정보를 검색하기 위해서는 원하는 정보를 가지고 있는 서버에 접속해야 한다. 하지만 서울에서 김서방 찾기 식으로 일일이 모든 컴퓨터를 기웃거린다는 것은 불가능하다. 인터넷에 많은 정보가 있다해도 정보 찾는데 엄청난 시간이 걸린다면 거의 대부분의 사람들은 지쳐서 포기하고 말 것이다.
검색 엔진 이란? 바로 이와 같은 어려움을 해결해주는 서버를 검색엔진이라고 한다. 즉, 어떤 컴퓨터에 무슨 정보가 들어있는지 알려주는 특별한 일을 해주는 웹 서버가 검색엔진이다. 전화번호부나 주소록과 같은 데이터베이스를 가지고 있는 컴퓨터라고 이해하면 된다. 인터넷에서의 정보검색은 거의 대부분이 검색엔진을 통해서 이루어진다고 해도 과언이 아닐 정도로 많은 사람들이 이용하고 있다.
검색 엔진의 종류 1. 주제별 카탈로그 2. 키워드형 검색엔진 3. Front-End형 검색엔진 4. 지능형 검색엔진(Inteligent Search)
주제별 카탈로그 인터넷에 있는 정보를 사회, 문화, 예술, 스포츠, 정치등 큰 주제에 따라 분류해놓은 목록을 제공하는 검색엔진을 주제별 카탈로그라고 부른다. 주제별 카탈로그는 해당 주제에 해당하는 각종 정보를 목록으로 제공하기 때문에 Directory 서버, 주제별 검색엔진, 메뉴검색, Subject-oriented searching 등으로 부르기도 한다.
주제별 카탈로그 주제별 카탈로그는 정보를 찾기 위한 특별한 주제어나 중심어를 뽑아낼 수 없는 상황일 때 사용하면 쉽게 해당정보에 접근할 수 있도록 도와주는 검색엔진입니다.
주제별 카탈로그 영문으로 Service되는 주제별 카탈로그 중 대표적인 것으로는 Yahoo! Galaxy WWW Virtual Library Point Communicaton City Net 한글로 제공되는 주제별 카탈로그에는 Yahoo! Korea Korea Directory
주제별 카탈로그 주제별 카탈로그는 자신이 찾고자 하는 정보에 대하여 주제어, 키워드, 중심어등을 모르더라도 대분류 정도만 알 수 있다면 쉽게 정보에 접근할 수 있다는 장점이 있으나, 원하는 정보에 접근하기까지 "대분류 →중분류 →소분류 →찾는정보"와 같이 여러 단계를 거쳐야 하므로 중간에 길을 잘못 설정하면 자신이 찾는 내용과 더욱 더 멀어질 가능성이 산재하고 있습니다.
주제별 카탈로그 그래서 주제별 카탈로그 중 상당수가 이러한 단점을 보완하기 위해 별도로 키워드 입력을 통한 검색기능을 제공하고 있습니다. 예를 들면 Yahoo!의 홈페이지에 들어서면 화면 윗부분에 검색어를 입력하는 상자가 있고, 그 아래부분에 주제별로 분류된 목록이 있는 것을 볼 수 있습니다.
키워드형 검색엔진 키워드형 검색엔진은 인터넷에 있는 홈페이지의 내용과 URL(Uniform Resource Locator;홈페이지 주소)을 자체 DataBase로 구축해둔 것을 말합니다. 키워드형 검색엔진은 찾으려고 하는 정보의 키워드(Keyword;검색어)를 입력함으로써 원하는 정보를 쉽게 검색할 수 있습니다.
키워드형 검색엔진 키워드형 검색엔진은 단 몇개의 키워드(검색어)를 입력하여 원하는 정보를 신속하게 찾을 수 있다는 장점을 가지고 있으나, 정확한 키워드를 뽑아낼 수 없는 상황에서 키워드검색을 실시할 경우, 엉뚱한 결과의 출력으로 많은 시간을 낭비하는 결과를 초래할 수 있습니다.
키워드형 검색엔진 키워드(Keyword)형 검색엔진의 대표적인 것으로는 AltaVista(http://www.altavista.digital.com) HotBot(http://www.HotBot.com) Infoseek Lycos Webcrawler Excite DejaNews 한글을 지원하는 키워드형 검색엔진으로는 네이버(NAVER) 심마니 코시크(Kor-seek) 마당발
키워드형 검색엔진 주제별 카탈로그가 자신의 단점을 보완하기 위해 키워드형 검색을 지원하듯이, 키워드형 검색엔진도 이같은 추세를 따르고 있습니다. 즉, 자신의 단점을 보완하기 위해 키워드형 검색엔진 대부분이 주제별 카탈로그 Service를 동시에 제공하고 있는 실정입니다.
키워드형 검색엔진 예를 들면 우리나라의 대표적인 키워드형 검색엔진인 심마니의 경우만 보더라도 그동안 키워드를 통한 검색방식만을 제공해오다 1996년 6월부터는 과학, 교육, 역사, 종교, 컴퓨터 등 16가지 분야로 나누어진 주제별 카탈로그를 지원하고 있으며, 라이코스, 익사이트, 웹크롤러, 알타비스타 등도 자체적으로 정리한 주제별 카탈로그를 제공하고 있습니다.
Front-End형 검색엔진 Front-End형 검색엔진이란 많은 검색엔진을 한 화면에 모아놓은 것을 말합니다. 즉, 자기 자신은 로봇, 스파이더, 크롤러 등을 이용한 정보 DataBase를 구축해 놓지 않고 여러가지 엔진의 '검색어 입력창'만을 따로 모아서 제공하는 것입니다.
Front-End형 검색엔진 예를 들자면 라이코스, 야후, 알타비스타등의 검색어 입력부분만을 따로 떼어 모아놓은 것으로 생각하면 됩니다. 다른 검색엔진으로 진입하는 전초기지 성격을 가진다하여 Front-End형 검색엔진이라고 부르고 있습니다.
Front-End형 검색엔진 Front-End형 검색엔진의 대표적인것으로는 All-In-One All Internet Searches Search.com CUSI(한국)
Front-End형 검색엔진 Front-End형 검색엔진은 각각의 검색엔진을 옮겨 다니면서 검색할 필요없이 한 화면 안에서 각각의 검색엔진을 이용할 수 있습니다. 또한 웹에 있는 HTML 문서만을 대상으로 검색하는 것이 아니라 공개소프트웨어나 뉴스그룹 또는 학술문서까지도 찾아주는 아주 넓은 검색영역을 갖고 있다는 장점이 있습니다.
Front-End형 검색엔진 그러나 자기 자신은 DataBase를 갖고 있지 않기 때문에 각각의 검색엔진에서 사용할 수 있는 여러가지 검색옵션을 모두 지원해 주지 못하고 있으며, 정교한 검색을 이끌어내는데 어느 정도 한계를 드러내고 있습니다.
지능형 검색엔진 지능형 검색엔진이란 로봇 에이전트를 이용하여 멀티쓰레드 기법으로 정보를 찾아주는 검색엔진을 말합니다. Fornt-End형 검색엔진은 각각의 검색엔진마다 하나씩의 검색어 입력상자가 제공되지만, 지능형 검색엔진은 검색어 입력상자가 하나만 있습니다. 그러면서도 수십개의 검색엔진을 통한 동시검색 기능을 제공하고 있습니다.
지능형 검색엔진 지능형 검색엔진은 한번의 키워드 입력만으로 다양한 검색엔진을 참조하여 검색을 진행하므로 간편한 정보찾기와 다양한 검색엔진에서의 출력결과를 얻을 수 있다는 장점이 있으나, 여러 개의 검색엔진을 참조하게 되므로 검색속도가 느릴 때가 많으며, 수 십개의 검색엔진에서 찾은 결과가 한 화면에 출력되므로 원하는 정보를 선별하는데 많은 시간이 소요된다는 단점이 있습니다.
지능형 검색엔진 일반적으로 많이 사용하는 지능형 검색엔진으로는 All 4 One IBM infoMarket EZ-Find at The River Metasearch MetaCrawler Savvy Search Starting Point
지능형 검색엔진 지능형 검색엔진은 '검색결과까지 모두 보여주는 형태', '키워드 입력만 자동으로 하는 형태'등 두 가지 타입이 있습니다. 검색결과까지 보여주는 지능형 검색엔진 '미스 다찾니'의 경우 검색어 입력창에 키워드를 입력하고 검색을 실시하면 심마니, 알타비스타, 코시크, 정보탐정, 뉴스검색엔진 등에 정보검색을 의뢰한 다음, 각 엔진별로 검색된 결과를 하나의 화면상에 모두 나타냅니다.
지능형 검색엔진 Savvy Search, IBM사의 InfoMarket, All 4 One 및 etaCrawler등이 이러한 동작형태를 취하고 있습니다.
검색어 입력까지만 수행하는 지능형 검색엔진 Starting Point 및 Metasearch, EZ-Find at The River는 하나의 검색어 입력창에 키워드를 입력하고 엔터키를 누르게 되면 여러 엔진의 검색어 입력창에 동시에, 동일한 검색어가 자동으로 입력되는 형태를 취하고 있습니다.
검색어 입력까지만 수행하는 지능형 검색엔진 원하는 검색엔진의 Search 단추만 눌러주면 해당 엔진의 검색결과가 나타나게 됩니다. 따라서 Front-End형 검색엔진과 같이 각각의 검색엔진에 일일이 키워드를 입력해 줄 필요가 없습니다.