Doc No. IRS-ITRINITY-2011-0002
목차 1. iTrinity 검색시스템 개요 1 2. iTrinity 설치하기 3 3. iTrinity 시스템 구성도 9 12 5. 시스템 백업 및 장애대처 17 [ 부록 ] 21
1. iTrinity 검색시스템 개요 iTrinity 검색시스템 개요 급변하는 인터넷 환경과 늘어나는 정보시스템 내에서 대용량 자료의 검색은 이제 필수적인 요소로 자리 잡았다. iTrinity는 쉽고(Easy), 정확하고(Exact), 효율적인(Efficient) 검색을 목표로 개발된 대용량 검색엔진이다. 정형화된 데이터베이스 검색은 물론 , 비정형 파일 시스템 검색에 최적의 검색환경을 제공한다. 또한 다양한 형태의 파일 포맷 (아래한글, MS-OFFICE, 아리랑, PDF 등)을 실시간으로 색인 할 수 있는 문서 필터 기술을 제공한다. 검색엔진 및 관련 어플리케이션 기술은 하루가 다르게 발전하고 있으며 이러한 발전된 기술을 최대한 반영하여 개발된 엔진이다. iTrinity 검색엔진은 효율적인 색인을 위하여 4GB 용량의 색인 파일을 병렬로 연결하여 사용하는 멀티 Index DB 구조를 채택하여 색인 속도가 획기적으로 향상되었으며 대용량 데이터의 색인이 가능하다. 한국어, 한자, 일본어, 중국어, 영어, 독일어, 러시아어 등 25개 국어를 지원할 뿐만 아니라 Unicode 기반으로 개발되어 다양한 언어로 시스템을 변경하는데 아무런 제약이 없다. 또한 다양한 OS에 코드 수정 없이 사용이 가능하고 J2SE 를 지원하는 모든 WAS(Web Application Server)시스템과 호환된다. 또한 iDocuFilter 문서 필터(옵션 제공)와 연동하여 한글97(.hwp), 한글2000(.hwp), 한글2002(.hwp), 한글2005(.hwp), 한글2007(.hwp), MS-Word(.doc, docx), MS-PowerPoint(.ppt, pptx), MS-EXCEL(.xls, xlsx), Adobe Acrobat(.pdf), html, xml, 문서의 원문을 검색할 수 있다. 웹크롤러 iInfoCapture 와 연동하면 원하는 사이트의 원하는 자료를 수집하여 검색에 활용할 수 있는 시스템을 구축할 수 있다.
1. iTrinity 검색시스템 개요 제품 정보 출시일자 사용문의 및 기술지원 개발 및 배급사 정보 제품명 : iTrinity 버전 : 4.0 제품구성 : 설치 CD 1, 제품설명서(전자파일) 출시일자 2010. 12. 01 : iTrinity 4.0 개발완료 2010. 12. 15 : iTrinity 4.0 출시 사용문의 및 기술지원 사용 문의 소프트웨어 사용 중 궁금한 점이 있으시면 사용자 매뉴얼을 참고하시거나, 프로그램의 도움말 기능을 참고하시기 바랍니다. 기술지원 소프트웨어 사용 중 각종 기술 요청 및 오류 수정, 업데이트 요청 시 담당자에게 문의하시기 바랍니다 유지보수 기간 제품 구입일로부터 1년까지 기술 지원 및 업데이트 가능 주소 및 연락처 (152-775)서울시 구로구 구로3동 212-16 벽산디지털단지 1차 509호 Tel. 02-2107-78530 (대표전화) E-mail. irskorea@irskorea.co.kr 개발 및 배급사 정보 상호 : ㈜아이알에스소프트코리아 주소 : (152-775)서울시 구로구 구로3동 212-16 벽산디지털단지 1차 509호 홈페이지 : www.irskorea.co.kr 대표전화 : 02-2107-8530
2. iTrinity 설치하기
2. iTrinity 설치하기 하드웨어 설치 환경 소프트웨어 요구사항 최대 동시 사용자수 최소사양 CPU : Intel(R) Pentium(R) 4 CPU 2.00GHz 이상 RAM : 1GB SDRAM 이상 HDD : 100MB 이상 권장사양 CPU : Intel(R) Pentium(R) Core2 Duo 2.4GHz Quad-Core / 1067Mhz FSB RAM : 2GB SDRAM 이상 HDD : 10GB 이상 최소 및 최대 설치 공간 iTrinity 4.0 제품 설치 시 프로그램의 용량은 약 50MB이나, 검색 대상 자료의 용량을 산정하여 2배 이상 디스크를 확보할 것을 권장합니다. 최소 설치 공간 : 50MB 최대 설치 공간 : 10TB 사용자 PC 사양 HDD : 10G 이상 소프트웨어 요구사항 jdk 1.4 버전 이상 JSP & Servlet 컨테이너가 동작하는 모든 웹서버 JDBC driver 가 제공되는 데이터베이스(검색 대상에 DB가 포함 된 경우) jdk 1.4 버전 이상 지원되는 Windows 2000 Server, Windows 2003 Server, Windows 2008 Server jdk 1.4 버전 이상 지원되는 Linux ( Kernel 2.5.0, Kernel 2.6.0), Sun (Solaris 8, Solaris 9, Solaris 10) , HP (HP-UX 9, HP-UX 10, HP-UX 11), IBM (AIX 5, AIX 6, AIX 7) 서버 지원 최대 동시 사용자수 최대 동시 사용자수 : 1024명
2. iTrinity 설치하기 시스템 설치 (사용자 설치): 1. 설치 서버에 itrinity 디렉토리를 생성 2. 설치 cd 의 itrinity 디렉토리의 파일을 설치 디렉토리로 복사함 3. 설치완료 설치 디렉토리 정보 bin 실행 모듈, 배치 색인 스크립트 conf 시스템,관리자,엔진 설정 파일 dic 사전관리 doc 관리자, 개발자 매뉴얼 inxDB 색인 파일 lib jar 파일 logs 로그파일 orgDB 문서필터로 필터되기 전의 원본 문서 파일 txtDB 문서필터로 필터 완료된 텍스트 파일 web 웹 페이지 및 자바 소스 파일 web / admin 관리자화면 web / css Style sheet 파일 web / images Image 파일 web / include JSP 파일에서 include 하는 공통으로 사용되는 파일 web / js JSP 에서 사용하는 JavaScript 파일 web / search 검색 JSP 파일 web / WEB-INF 검색엔진 관련 class 파일
2. iTrinity 설치하기 bin conf(Property 파일 정보) 주요 파일 정보 rebuild.sh 일괄배치 색인 실행 프로그램 iDocuFilter MS오피스,한글 등의 문서파일을 텍스트파일로 변형시켜주는 문서필터 conf(Property 파일 정보) db.properties Jdbc 설정관련 정보 예) #ORACLE(오라클인 경우) default.driver=oracle.jdbc.driver.OracleDriver default.url=jdbc:oracle:thin:@localhost:1521:ORCL default.id=oracle_uid default.password=oracle_pwd engine.properties 검색엔진에서 사용하는 검색 카테고리 개수, 최대 색인 프로세스 개수, 검색어하이라이트 출력 관련 정보 예)검색 카테고리의 수가 4개 이고, 프로세스의 수가 100개, 검색결과 중 검색어하이라이트를 파란색으로 출력하고자 했을때 inx.dbsize = 4 inx.maxJobCount = 100 search.highlight= blue log.properties 로그정보 출력에 대한 정보 user.properties 관리자 admin 계정 등록 정보 기본계정은 admin/admin 으로 등록되어 있다. admin.login_id=admin admin.login_password=admin
2. iTrinity 설치하기 logs web/search(검색 사용자 페이지) 주요 파일 정보 exe_logs.log 색인관련 정보를 담고 있는 가장 최근의 로그파일 web/search(검색 사용자 페이지) search.jsp 통합검색 페이지 search_common.jsp 함수사용 등 검색에서 공통으로 사용하는 페이지 search_detail.jsp 상세검색페이지 search_content.jsp 검색결과 항목 페이지 search_error.jsp 검색 중 발생하는 에러 출력 페이지 search_header.jsp 검색결과 중 카운트를 표시해주는 페이지 search_list.jsp 더 많은 검색결과를 볼 때 사용하는 페이지
2. iTrinity 설치하기 색인 실행 방법(bin) 주요 파일 정보 전체색인 실행(인자값 없음) rebuild.sh 전체색인 실행(인자값 없음) conf/engine.properties에 정의된 검색카테고리의 개수만큼 모두 순차적으로 색인을 실행한다. Windows 계열은 rebuild.bat 파일 실행 검색카테고리번호 conf/engine.properties에 정의된 검색카테고리의 개수 내에서 특정 검색카테고리만 색인 실행 예)rebuild.sh 1 1번으로 정의된 검색카테고리만 색인 실행
3. iTrinity 시스템 구성도
3. iTrinity 시스템 구성도 iTrinity Information Retrieval System 주요 시스템 구성도 IndexSearcher QuerySubclass QueryParser Thread Manager Reporting Scheduler Stemmer StripParser Event Monitor Scheduler Batch Loader DB Gateway Search Coordinator Index Coordinator DB Gateway Index manager Search manager Dictionary manager Body manager Admin Manager Search Thread User Admin Index File System Index Files Index Files Index Files Config Files Log Files
3. iTrinity 시스템 구성도 Admin Manager : iTrinity의 모든 프로세스 관리 주요 시스템 구성 Admin Manager : iTrinity의 모든 프로세스 관리 Index Manager 인덱스 테이블의 생성 및 수정, 삭제 등 관리 Search Manager 검색 사용을 위한 메모리, 동시 사용자 등 관리 Dictionary Manager 명사사전, 불용어사전, 시소러스사전 등 관리 Body manager Trinity 상태 모니터링, 조치 Search Coordinator : Index Manager에서 생성된 DB로 검색요청을 처리 IndexSearcher 사용자 검색 요청 발생 시 Index DB와 연계 유지 관리 QuerySubclass 사용자에 의해 주어진 검색식을 질의 문장에 맞게 변환 QueryPaser 사용자에 의해 주어진 검색식을 처리하여 가장 적합한 자료를 전달 SearchThread 다수 사용자 발생 시 쓰레드 생성으로 로드밸런싱 유지 Index Coordinator : Index Manager에서 정의한 색인방식으로 색인 Reporting Indexing 로그 관리 Scheduler Indexing 주기 관리 Stemmer 각 언어별 문장내 색인어 추출 StripPaser 전자문서 색인 시 전자문서내 Text 추출 IndexThread 대량의 색인 발생 시 멀티인덱싱 처리를 위한 쓰레드 생성 DB Gateway : 상용 DBMS Gateway 제공 iDocuFilter (옵션) : 한글97(.hwp), 한글2000(.hwp), 한글2002(.hwp), 한글2005(.hwp), 한글2007(.hwp), MS-Word(.doc, docx), MS-PowerPoint(.ppt, pptx), MS-EXCEL(.xls, xlsx), Adobe Acrobat(.pdf), html, xml 문서 필터 InfoCapture (옵션) : 웹 정보 수집기
4. iTrinity 기능
4. iTrinity 기능 iTrinity의 기능은 총 31개의 기능으로 구성되어 있습니다 기능요약 대분류 기능 중분류 기능 기능설명 기본검색 카테고리 검색 검색결과를 특정업무나 분야에 따라 분류한 카테고리별 검색 검색어 입력박스 사용자의 검색 키워드를 입력받아 검색을 실행 결과 내 검색 검색된 검색결과 내에서 다시 검색을 수행 상세검색 검색조건을 다양하게 입력/선택하여 검색 검색정렬 검색결과를 원하는 정렬형태로 정렬하여 출력 연관검색어(시소러스) 입력된 키워드와 연관된 키워드를 출력 검색결과 더보기 해당 카테고리의 검색결과를 전체 화면에 출력 검색결과 상세페이지 전문가용 상세검색 화면 출력 검색결과 미리보기 URL 이동 없이 결과 페이지를 출력 검색결과표시 검색된 데이터의 제목, 내용, 작성자, 작성일, 첨부파일을 출력 인기검색어 특정 기간동안 검색이 많이 된 키워드를 순위에 따라 출력 내가 찾은 검색어 내가 검색했던 키워드들이 최근순으로 10개가 출력 검색대상 제목, 내용, 제목과 내용, 작성자, 첨부파일 별로 검색대상을 선택 검색 결과수 검색결과 페이지에 보여줄 검색결과 개수를 지정 작성일 원하는 작성일을 기간별로 선택하여 검색 연산자 AND, OR 같은 검색연산자를 지정하여 검색 검색연산자 AND 두 개 이상의 키워드를 모두 포함하는 문서 검색 OR 두 개 이상의 키워드 중 하나라도 포함된 문서 검색 NOT 두개 이상의 키워드에서 특정 키워드를 포함하지 않은 문서 검색 문장검색 입력된 문장과 동일한 문장을 포함한 문서 검색 인접어검색 두 개의 키워드가 특정 단어만큼 떨어져 있는 문서 검색 절단검색 키워드 일부만 포함하고 있는 문서 검색
4. iTrinity 기능 기능요약 대분류 기능 중분류 기능 기능설명 색인기능 증분색인 검색대상 시스템의 증가 또는 삭제된 자료를 색인 전체색인 검색대상 시스템의 자료 전체를 색인 관리기능 검색엔진 테스트 검색시스템의 정상작동 여부를 확인 등록된 색인 관리 색인된 카테고리의 건수 및 디스크 사이즈를 출력 색인 로그관리 색인 시 발생한 성공 / 실패 여부 로그를 출력 인기검색어 관리 인기검색어 리스트 및 히트수를 출력 불용어관리 검색에서 사용하지 않는 키워드를 등록 JVM 관리 JAVA 가상 머신의 메모리 사용량을 출력 사용자 관리 관리자 화면에 로그인할 사용자 등록
4. iTrinity 기능 시스템 제한사항 시스템 성능 항목 제한 내용 항목 내용 입력 키워드 길이 한글 영문포함 80바이트 이내로 제한 화면당 검색결과 출력 개수 최대 100건으로 제한 인기검색어 저장주기 최근 일로부터 7일간의 검색 키워드가 저장 시스템 성능 항목 내용 색인 성능 Pentimum 2.4 GHz의 1 CPU 환경에서 프로세스당 초당 0.2MByte 의 색인 처리 검색 성능 MS Explorer 7.0에서 쿼리당 평균 반응 시간 (1 초이하) 메모리 사용 쿼리당 메모리 사용 (1MByte 미만) CPU 사용 Pentimum 2.8 GHz의 1 CPU 환경에서 쿼리당 CPU 사용 (1.5 % 미만) 디스크 사용 검색엔진 설치 디스크 사이즈 (30M Byte) 색인파일의 크기 : 원본 텍스트 파일의 1.5배 아래한글 색인 시 파일 크기의 평균 20% 정도를 색인 디스크 필요 성능시험 서버 테스트 환경 서버 사양 OS : Fedora release 9 Kernel : Linux Kernel 2.6.25-14.fc9.i686 on an i686 (1) Memory : 1G CPU : Intel 2.4GHz (2M Cashe) Hard Disk : 7200RPM EIDE / 160G 사용자 PC 사양 OS : MS XP (Service Pack 3) Memory : 2G CPU : Intel 2.21GHz Hard Disk : 5400RPM SATA / 150G
4. iTrinity 기능 기본 검색시스템 화면 기본 검색시스템은 아래와 같이 구성되어 있으며 웹브라우즈에서 실행됨.
5. 시스템 백업 및 장애대처
5. 시스템 백업과 장애대처 시스템 백업 색인파일 백업은 색인된 인덱스 정보만 백업하며 전체백업은 인덱스 정보와 검색엔진 전체를 백업합니다. 백업 시 백업 디렉토리에 대한 쓰기 권한이 있어야 하며 디스크 할당이 충분한지 확인해야 합니다. 작업구분 설 명 색인파일 백업 색인 파일 디렉토리를 백업합니다. 백업대상 디렉토리 : itrinity_home/inxDB 백업명령어 : inxBackup.sh target_directory Windows Server 계열은 InxBackup.bat 실행명령 사용 시스템 전체백업 검색엔진이 설치된 계정 (~itrinity) 전체를 백업합니다. 백업대상 디렉토리 : bin, conf, doc, inxDB, lib, web 백업명령어 : allBackup.sh target_directory Windows Server 계열은 allBackup.bat 실행명령 사용 백업시 주의사항 백업 명령어의 target_directory에 itrinity 계정에 쓰기 기능이 허용되어야 함. 디스크 용량을 확인하여 백업에 필요한 충분한 공간이 있어야 함. 시스템 복구 색인파일의 복구는 백업된 색인 파일을 inxDB 로 복사하여 복구를 수행 함. 전체 시스템의 복구는 백업된 전체 파일을 복사하여 복구를 수행 함.
5. 시스템 백업과 장애대처 유지보수 사항 iTrinity 제품의 오류발생 시 복구 및 문제해결 등의 유지보수 활동을 통해 시스템의 정상상태를 유지하고, 환경변화에 따른 사용자 요구의 변화를 수용하기 위한 지속적인 활동을 지원합니다. 작업구분 설 명 하자보수 최종 검수 확인 후 12개월 무상 지원 무상 지원 기간 이후는 유상 지원 응용 소프트웨어에 새로운 기능을 추가 시에는 상호 합의하여 결정 패키지 소프트웨어의 버전 갱신이 필요한 경우 - 무상 지원 기간 동안은 무상 지원 - 유상 지원 기간에는 유상 유지보수 계약에 의해 지원 24시간 무 정지 시스템 유지보수를 위한 담당자 지정 운영 기술이전 응용 소프트웨어 - Source Code 제공 - 실행 모듈 제공 - 기술이전은 무상 제공 패키지 소프트웨어는 실행모듈만 제공 백업시 주의사항 백업 명령어의 target_directory에 itrinity 계정에 쓰기 기능이 허용되어야 함. 디스크 용량을 확인하여 백업에 필요한 충분한 공간이 있어야 함.
5. 시스템 백업과 장애대처 장애대처 Q : 키워드를 입력해도 서버에서 응답이 없습니다. A : 검색엔진이 설치된 WAS 의 실행 여부를 확인하세요. WAS가 실행되지 않으면 검색결과 화면이 출력되지 않습니다. Q : 색인이 진행이 안됩니다. A : 디스크 사이즈를 확인하세요. 디스크가 Full 이 되면 색인이 진행되지 않습니다. Q : 검색결과에서 원문보기를 클릭하면 해당 문서 없음으로 나오거나 “404 NOT FOUND” 오류가 발생합니다. A : 홈페이지나 검색대상 시스템의 리뉴얼이 색인 정보에 반영되지 않아서 발생한 문제입니다. 재색인 작업을 통해서 해결이 가능합니다. 본사 유지보수 팀으로 연락바랍니다. Q : 어제 등록된 자료가 검색이 안됩니다. A : 검색대상 DB를 조회하여 색인 작업을 수행합니다. 색인 작업 수행시 DB 가 정상적으로 운영이 되었는지 확인바랍니다. DB 연결 오류 발생시 LOG 파일에 오류가 기록됩니다. Q : 데이터베이스 서버를 증설할 예정입니다 A : 본사 유지보수 팀으로 연락바랍니다.
부록 iTrinity 4.0 소프트웨어 인증 안내 소프트웨어 품질 인증 (GS 인증) iTrinity 4.0 은 한국산업기술시험원(KTL)에서 요구하는 제품 유형별 필수 기능을 제공하고 있으며, GS 인증을 취득하였습니다. 인증 기관 : 한국산업기술시험원 (KTL) 인증 번호 : 인증 취득일 : 인증 범위 기본검색기능 상세검색기능 검색연산자 관리기능 iTrinity 4.0 인증 관련 서류(시험 성적서, 인증서 등)를 원하시는 경우, 다음의 연락처로 문의하시기 바랍니다. 상호 : ㈜아이알에스소프트코리아 주소 : (152-775)서울시 구로구 구로3동 212-16 홈페이지 : www.irskorea.co.kr 대표전화 : 02-2107-8530
마지막 쪽