MySeek 시스템 소개 ㈜마이씨크
2 Contents MySeek System 개요 MySeek System 기능도 MySeek System 기능 MySeek System 특징 MySeek 검색기능 MySeek 활용시 장점 Reference Site
3 MySeek System 개요 검색 응용프로그램 (C,Python,PHP,OOSQL 등 ) 질의처리기 공간 DB 검색엔진 멀티미디어 검색엔진 TEXT 정보 검색엔진 멀티미디어 객체 저장시스템 (OODBMS) DataBase 색인정보 오디세우스 Server 색인시스템 Cache Data 오디세우스 /Web Web Server(Apache,Netscape) MyRobot 인터넷망
4 색인정보 MySeek System 기능도 검색 프로그램 오디세우스 Knowledge DB 색인시스템 광고서버 MyAd Web Server 형태소분석 인터넷망 ODBMS 배너정보 광고주정보 메일서비스 MyMail 메일정보 DataBase MyRobot MyFilter myCategorizer 개발완료 개 발 중
5 MySeek System 기능 Product Name 기 능 MyRobot Html, sound, image, News Data 수집 Odysseus/Cosmos 대용량 객체지향 데이타베이스 및 저장시스템 Odysseus/Web 빠른 검색시스템 개발용 Tool MySeek 색인정보 이용한 Text, 멀티미디어, 뉴스 검색 MyFilter * 업무문서 (Ms Office, HWP, 아리랑 등 ) Text 문서로 변환 MyCategorizer * 카테고리분류 DB 이용하여 문서 자동 분류 MyAd Server * 배너 광고 관리 ( 광고주 / 배너 관리, 배너서비스, 통계 ) MyMail Server * 회원 대상 대량 메일발송 / 관리, DB 마케팅 * 는 현재 개발 중
6 MySeek System 특징 검색시스템 색인정보 및 문서 중요도에 따른 검색 정보검색기능 밀결합된 객체지향 SQL (Object-Oriented SQL: OOSQL) 기능 제공 데이터 저장 시스템 대용량 DB 지원 최대 8Tera DB 볼륨 지원, 무한대 확장 신속한 데이터 로딩 (Bulk Loading) 100 만 건 텍스트 정보 6 시간 이내 구축 실시간 인덱스 정보 Insert, Update, Delete 인덱스 변경 위해 시스템 정지 필요 없음
7 MySeek System 특징 인덱스 & 로딩 속도 데이터 : MySeek 페이지 정보 100 만 건 데이터 Size : 원본 (3GB) + 색인 DB(13GB) 데이타베이스 용량 : 16GB 시스템 : IBM RISC 450MHz * 6 CPU 색인시간 Initial Loading - 약 6 시간 Append Loading – 약 24 시간 JDBC Interface 제공 ODBC Interface 제공 View 기능 지원 C/C++ Interface 제공
8 MySeek System 특징 버퍼 일관성 보장 Multi Server 로 운영 시 한 서버의 버퍼 내용이 변경되면 나머 지 서버도 일률적으로 변경됨 동시성 제어 기능 볼륨 단위 Locking Rule Version Lock 의 개수 줄여 최적의 질의 성능 발휘 동시에 다수 읽기 질의와 소수 쓰기 질의 지원 읽기 위주의 시스템에 적합 레코드 단위 Locking Rule Version 동시에 다수 읽기 질의와 다수 쓰기 질의 지원 다 사용자 환경 안정성 증명 위해 2 년간 테스트 중 (2001 년 제공 )복구기능 시스템 비정상 종료시 DB 정보 자동 복구
9 MySeek 검색기능 부울 (Boolean) 질의에 의한 검색 부울연산 (AND, OR, NOT) 근접연산 (Within, Near) 절단검색 ( 좌, 우, 중간, 양측 ) W-Algorithm 에 의한 문서 순위 결정 구 분구 분구 분구 분표기법 기 능 부 울연 산부 울연 산 A & B A | B A + B A – B A * c A 와 B 가 동시에 나타난 문서를 검색 A 나 B 중 어느 하나만이라도 있는 문서를 검색 A 나 B 중 어느 하나만이라도 있는 문서를 검색 ( 중요도계산 ) A 단어는 있고 B 단어가 없는 문서 검색 A 단어의 중요도를 C 배 한다 절단 A* *A *A* A*B A 로 시작하는 단어가 있는 문서 검색 A 로 끝나는 단어가 있는 문서 검색 앞뒤에 A 를 포함한 단어가 있는 문서 검색 A 와 B 사이에 어떤 글자가 포함되어도 검색 근접 연산 A ^d B A ~d B A 와 B 사이 거리가 d 단어 이내인 문서 검색 (A,B 순차적 ) A 와 B 사이 거리가 d 단어 이내인 문서 검색 (A,B 순서 무관 )
10 MySeek 검색기능 자연어 질의에 의한 검색 검색어에 대한 유사도에 의한 순위결정 (Ranking) 시스템 특성에 맞는 Ranking Algorithm 적용 가능 부울연산자 동시 사용 가능 사용자 요구에 맞는 순위 결정 모델 적용 다양한 한글 자동 색인 형태소 단위 색인 한글 형태소 분석기 이용하여 명사, 형용사, 동사, 조사, 접미사 등 단순명사 뿐만 아니라 복합명사에 대해서도 별도 색인함으로써 빠른 검색 실현 어절단위 색인 불용어를 제외하고 어절, 단어를 색인하여 신조어 등 검색 가능
11 MySeek 검색 기능 기타 주요 기능 Inverted File 를 이용한 빠른 검색어 인덱스 검색 분할 색인 방식을 이용한 빠른 인덱싱 분야 제한 검색 검색 결과내 재검색 지원 자연어 검색을 위한 색인어 조회 기능 전문검색 기본 실시간 자료 삽입, 수정, 삭제 (System Non Stop) 자유로운 검색어 하일라이팅 검색된 문서의 질의 최적문단 추출 기능 다양한 플랫폼 (Unix, Windows N/T 등 ) 대용량 Data 신속한 처리 빠른 검색, 색인 및 데이터 Loading
12 MySeek 활용시 장점 최고의 검색기능 빠른 검색 / 색인속도 대용량 Data 신속처리 다국어지원 자연어지원 다양한 H/W 지원 Ranking Quality 최고의 검색기능 빠른 검색 / 색인속도 대용량 Data 신속처리 다국어지원 자연어지원 다양한 H/W 지원 Ranking Quality 순수 국내 기술 원천 소스 보유로 자유로운 Customizing 가능 한글처리 강점 정부구매사업 유리 다양한 검색시스템 요구 사항 수용 가능 순수 국내 기술 원천 소스 보유로 자유로운 Customizing 가능 한글처리 강점 정부구매사업 유리 다양한 검색시스템 요구 사항 수용 가능 정부기관, 언론사, 포탈사이트, 전자상거래, BtoB, 커뮤니티, KMS,EDMS 정부기관, 언론사, 포탈사이트, 전자상거래, BtoB, 커뮤니티, KMS,EDMS MySeek + KAIST
13 Reference Site 한국전자도서관 과학기술원 전자도서관
14 Reference Site 과학기술원 전자도서관
15 ㈜마이씨크는 순수 국산 기술을 토대로.. 항상 여러분의 곁에서 고객이 만족하는 시스템을 만들기 위해 오늘도 최선을 다하고 있습니다.