정보검색 시스템 평가 및 테스트 컬렉션 개발 조영환, 박혁로, 이준호 정보과학회지 1998.8.

Slides:



Advertisements
Similar presentations
NO MORE LINE 1(일촌) 조. 목차목차 사업 목적 No More Line 이란? No More Line 분석 마 케팅 수 익구 조 제 작 비 용.
Advertisements

개인의견 차가있을수있음 훈훈한남자 배우 TOP 5. 5 위는 박보검 웃을때보이는 치명적인 미소 꺄 ~~~ 5위5위.
기업 인사담당자가 밝힌 면접 합격 비법 취업포털 사람인 ( 기업 인사담당자 397 명 조사 )
영남본부 현안사항 노동조합. -1- 현황 및 문제점 ( 단위 : 개 ) 가. 문제점 1) 현장구역과 회수업무 병행 - 공중전화유비보수, 모뎀회수 업무 2) 토, 일, 공휴일, 야간 근무 - KT 에서는 야간 및 휴일근무 부정적.
Korea information Society Development Institute KISDI 김 동 욱 원장 환경행정 3.0 세미나.
의료자원 규제현황과 개선방향 자원평가실. 의료자원 관리 개요 규제개혁 토론과제.
자동차 보험회사의 마케팅 전략 소비자주거학과 김나영 소비자주거학과 조현희 소비자주거학과 송민정 중어중문학과 강선미 회계학과 안종현.
직무에 대한 이해 및 직무정보 탐색 임영찬 취업강사 ‘ 이공계성공취업스토리 ’ 운영자, ‘ 뽑히는이공계취업 ’ 저자.
Contents 사 업 개 요 S T P 전략 마케팅 전략 I II III 사업추진 계획 IV.
 조견표 제 안 요 청 사 항제 안 요 청 사 항관련목차페이지 I. 제안개요 사업추진의 배경과 필요성 및 목표 I 사업 수행 전략, 조합 사업을 통한 수익창 출 지원 전략 등 기술 I.4 4 시스템 구축 방안 개요 및 타 IT 기업과 차 별화되는 특징 등.
OK-BANK CMS 대표전화 : 서울시 강남구 대치동 금융솔루션개발 OK-BANK 신안정보통신 자동이체 제안서.
프로필 □ 기본 인적 사항 □ 학력 사항 - 성명: 한두성 - 주소: - 메일: 핸드폰:
국가문화유산 종합정보시스템 구축사업 ( 2003년 11월 문 화 관 광 부.
국가지리정보체계 구축사업 추 진 현 황 건설교통부.
플랜티넷[075130] 자녀가 있는 가정이라면… 높은 영업이익률… 독점의 매력...
(4) 우리 나라의 이상과 목표 2. 국가의 중요성과 국가 발전 중학교 2학년 도덕
루틴스(EVA-EDMS)제품소개서 EVA(Enterprise Value Approach_기업자산 가치로서의 접근)
자동차 보험회사의 마케팅 전략 소비자주거학과 김나영 소비자주거학과 조현희
MO/MT를 활용한 Call Center 제안
연 합 남 전 도 회 월 례 회 1부 예배- 찬 송 장 다같이 2011년 1월 2일 1부 예배- 찬 송 장 다같이 기 도
사 업 계 획 2011년 제1호 - 2월 1일 2011 주 안에서 소통하며 화합하고 참여하며 헌신하는 남신도회
업무 프로세스 및 체크리스트
휴먼 배너 (Mobile LED) 제안.
Smart Media Board 구축 및 운영 제안서
학생용 Web Manual
1. 근접경호의 개념 경호대상의 신변을 보호하기 위하여 지근거리에서 실시하는 호위활동을 말하며 경호행위의 마지막 보루이다.
“Total system for preventing Information outflow from inside
사업 목적 사업 개요 세부 내용 운영 시스템 사업 전망 추진 일정 수익 모델 옵션 사항 협력 회사 2p 3p 8p 14p 20p 23p 26p 27p 28p.
Battery Share 사 업 제안서 (2012/08/15 초안) ㈜WAYSPACK.
회사 소개서 ㈜ 트 리 포 스.
Digital Forensic의 동향과 전문인력양성방안
정부3.0 자문회의(세미나) 도시철도공사 방문을 진심으로 환영합니다 2014 정보화분야 2014년 5월 15일(목) 14:00
동호회 구축 제안서 인터넷전문가그룹 4biz.
2007. Database Term Project Team 2 윤형석, 김희용, 최현대 우경남, 이상제
그린 마일리지(상벌점제) 디지털시스템 활용 방안 광주광역시 교육청.
“통합관제시스템 구축방안”
고성능 컴퓨터 관리를 위한 클러스터 플랫폼 개발
독도 바로알기 2. 사료와 지도로 보는 독도.
'경영평가정보시스템 구축' 경영평가단 설명회
'경영평가정보시스템 구축'
웹사이트 구축 견적서 Hyunbum Entertainment Co., LTD.
Edus 충남 통합인증을 위한 교과부 표준보안 모듈 설치 안내 (smart.edus.or.kr)
“통합관제시스템 구축방안”
Korea Digital Media High School
2018년 착수 포스코 연구과제 연구비 편성 기준 ■ 2018년 국내 대학 / 연구기관 요율 기준 : 전년과 동일
서 울 정 보 시 스 템 (02) 북집(BookZip) 지식N요약 DB 국내서 요약, 해외서 Preview, Global Trend, Media 브리핑 ‘모바일 서비스 이용방법 서 울 정 보 시 스.
시설공사 관리 시스템 활용 Manual 2-1(시공업체 교육용)
교육과정과 주요업무.
UniERP 로그인화면
나의 삶과 금융경제 설계전략 당신의 인생은 안녕하십니까 Team . 승승장구.
표준화 임원코칭 ③ 전략적 사고 2009年 05月 20日 先進標準化팀 SD경영연구소.
모두가 행복한 교육, 미래를 여는 창의인재 2015 개정교육과정 서울숭인초등학교 교사 이소정.
환경관리 규정 - 목 차 – 1.적 용 범 위 9.환경관리 교육 2.목 적 10.환경 점검
소프트웨어 개발보안 설명 및 예시 ‘ (수) 22: 기 배주진.
2015년도 스마트공장 지원사업에 대한 사업비 타당성 평가
( Personnel Decision Support System )
제안 목적 고객성향 분석으로 매출 증대 유사업체 분석으로 신상품 홍보 원가요소 분석 및 피드백으로 원가율 관리
청각기관의 구조와 기능2 옥정달.
1. 기술 및 제품 설명 > 제품 개요 발표자료 작성 방법 <발표자료 작성 방법>
수 업 계 획 1. 단원지도계획 2. 수업설계서 3. 학습지 4. 형성평가지 5. 참고자료 6. 참고사이트 7. 제작자
<사계>중 ‘봄’감상하기 음 악 6학년 3. 봄 (1/2) [제작의도] [활용방법] 초기회면 수업 내용 제시 화면
12장. 침해사고 조사 절차.
자료정제 사용자 교육 (교무업무 부문) 차세대 나이스 구축을 위한 장소: 광주광역시교육과학연구원 대강당 일정
성공적인 입사지원서 작성법 제이비커리어 교육수석 소 은 선.
1학년 신입생 학부모교실 안내사항 2019년 3월 6일 1학년부장 김희선.
홈페이지 제안서
우리나라의 최신무기 천 천 초 등 학 교 6학년 1반 16번 현 승 호.
2012년 공동네트워크화구축 지원사업 표지1.
연구장비 공동활용 지원사업 신청서작성 매뉴얼(참여기업)
Deployment Diagram (배치 다이어그램)
Presentation transcript:

정보검색 시스템 평가 및 테스트 컬렉션 개발 조영환, 박혁로, 이준호 정보과학회지 1998.8

시스템 평가를 위한 기본 모형 정보검색 시스템 질의-검색 평가 기준 부적합한 평가항목 문서의 등록, 저장, 검색 포함 정확률과 재현율 부적합한 평가항목 상용의 정보검색 시스템에서 제공하는 부가적인 기능 Web 인터페이스 에이전트 기능 Z39.50 프로토콜 디렉토리 서비스 시스템 도입자의 목적에 의존, 지속적인 추가가 가능

시스템 구성을 위한 S/W, H/W, Media, Interaction의 지원 상용의 정보검색 시스템 도입시 검토 사항 색인어 추출의 품질 및 색인에 소요되는 시간 대량의 데이터에 대한 적재 경험 및 적재 시간 시스템 구성을 위한 S/W, H/W, Media, Interaction의 지원 지식관리, 계정 관리 등의 검색 보조기능

정보검색 시스템을 구축하는 관점에서의 평가항목 정보검색 시스템을 구축하는 관점에서의 평가항목 일반적인 평가 항목 기능적 점검 항목 성능적 평가 항목 작업에 따른 평가항목 색인어 추출에 관련된 평가 항목 문서의 등록에 관련된 평가 항목 정보 질의에 관련된 평가 항목 정보 관리에 관련된 평가 항목

기능적 점검항목(1) 색인어 추출 필수적 기능 부가적인 기능 띄어쓰기 오류를 포함한 경우에 대한 처리 한자를 한글로 변환하는 기능 다양한 종류의 코드로 된 원문의 처리 분야별 명사 사전의 제공 시스템/사용자/불용어 사전의 제공 복합명사 분리 기능 한영 혼합 색인어 추출 기능 품사별로 색인어를 선택하는 기능 색인어의 타입을 정의하는 기능 미등록어 추정 기능 부가적인 기능 띄어쓰기 오류를 포함한 경우에 대한 처리 사전 표제어를 표준 색인어로 변환하는 기능

기능적 점검항목(2) 문서 등룍 필수적 기능 부가적인 기능 원문 화일 포멧에 대한 검사 논리적 문서 모음(Collection)의 개념이 제공 원문 화일 포멧에 대한 검사 제공되는 원문에 대한 필터의 종류 다양한 색인어 추출 방식 지원 필드별로 색인어 추출 방식을 지정하는 기능 추출된 색인어를 후통제하는 기능 On-Line 방식으로 문서를 등록/수정하는 기능 부가적인 기능 동시에 여러 프로세스가 문서를 등록하는 기능 문서의 등록과 검색이 동시에 이루어지는 기능 DB의 이상적 사태에 대한 동일성 유지 기능 논리적 문서 모음에서 이질적인 문서 형식을 지원

기능적 점검항목(3) 정보 질의 필수적인 기능 부가적인 기능 질의 표현과 저장된 문서 표현의 일치 표준 질의어 형식을 지원 좌/우 절단된 색인어 지원 색인어간의 위치 관계 연산자 지원 정형 필드와 비정형 필드 지원 문서 집합에 대한 가중치 부여 기능 검색 결과를 질의에 따라 순서화하는 기능 이전의 검색 결과 집합에 대한 history 지원 이전의 질의문을 피드백하는 기능 결과에 검색어가 특정 마크로 표시되는 기능 부가적인 기능 검색된 문서의 요약 기능 질의에 사용된 단어의 의미 이해 질의를 고려하여 문서를 요약하는 기능 사용할 시소러스를 선택하는 기능

기능적 점검항목(4) 정보 관리 필수적인 기능 부가적인 기능 사용자 / 불용어 사전관리기 지원 시소러스 관리기 지원 저장된 문서의 On-Line Update 기능 색인, 저장, 검색, 관리에 대한 지침서 제공 구조적으로 정돈된 API를 제공 쉬운 인스톨을 제공 시스템의 모니터링 기능 지원 변경중인 문서에 대한 정보 제공 부가적인 기능 사용자의 계정 관리 기능 지원 사용자의 세션에 대한 로그 작성 시스템 프로세스의 부하 조정 기능 지원 색인 정보의 관리 기능 지원

성능적 평가 항목 정보검색 시스템의 성능적 평가는 시스템 운영에 대한 예측을 충족시키는지에 대한 판단의 측면에서 다루어져야 한다.

성능적 평가항목(1) 색인어 추출 대량 색인어 추출 속도 소량 색인어 추출 속도 사전 표제어의 크기 색인어의 정확성 1 Mega Byte 문서를 처리하는 시간 소량 색인어 추출 속도 1 KiloByte 문서를 처리하는 시간 사전 표제어의 크기 품사별 단어의 개수 색인어의 정확성 전문가의 색인어와 자동 색인어 비교 색인어 추출의 견고성 최악의 경우 테스트 문서에 대한 색인

성능적 평가항목(2) 문서 등록 색인어별 문서 등록 속도 건수별 문서 등록 속도 최대 동시 문서 등록 프로세스의 수 10만 keyword에 대한 등록 속도 건수별 문서 등록 속도 1K 크기의 10만 문서에 대한 등록 속도 최대 동시 문서 등록 프로세스의 수 프로세스의 수와 등록 속도의 증가 비율 건수 증가에 대한 등록 시간의 감소율 초기 10%부터 점진적으로 속도 증가 함수 문서 수정 속도 1개의 문서를 N번 수정하는 시간 원문 대비 색인 정보의 비율 색인 필드의 전체 크기와 색인 정보 저장 공간 최대로 저장이 가능한 전체 DB의 크기 최대로 저장이 가능한 1Kbyte 문서의 개수

성능적 평가항목(3) 정보 질의 단일 키워드에 대한 검색 속도 검색된 문서중에서 질의에 적합한 문서의 비율 성능적 평가항목(3) 정보 질의 단일 키워드에 대한 검색 속도 결과가 각각 10건/10000건인 색인어 100회 검색된 문서중에서 질의에 적합한 문서의 비율 결과의 top 20에 포함된 정도 적합한 문서 중에서 검색된 문서의 비율 최대 동시 검색 프로세스의 수 프로세스의 검색 속도의 증가 비율

테스트 컬렉션의 중요성 개발중인 검색 기법의 성능 평가 검색 효과(Retrieval Effectiveness) 향상 색인어 가중치 자연언어 처리 적합성 피드백 등을 이용 개발중인 검색 기법의 성능 평가 테스트 컬렉션 이용

테스트 컬렉션 개발 현황 국내의 경우 한글 문서들로 구성된 테스트 컬렉션의 필요성은 인식. 한글 테스트 컬렉션은 KT 컬렉션과 KRIST 컬렉션이 있다.

정보검색용 테스트 컬렉션의 구성 문서 집합 질의 집합 질의에 적합한 문헌 리스트

문서 집합과 질의 집합 문서집합 질의 작성 테스트 컬렉션 구축에 있어서 가장 기본적인 요소 다양한 분야의 문서들로 문서 집합을 구성 다양한 크기의 문서들로 구성 질의 작성 여러 분야에 골고루 분포

적합 문헌 후보 리스트 생성 각각의 질의에 대하여 풀링 방법(Pooling Method) 테스트 컬렉션의 문서 집합에 포함된 모든 문서들을 읽고 적합성 여부를 판단. 풀링 방법(Pooling Method) 다수의 정보검색 시스템들을 사용하여 검색을 수행하고, 각각의 시스템에 의해 높은 순위를 부여받은 문서에 대해 적합성 여부를 판단하는 방법.

적합 문헌 선정 적합 문헌 후보들을 사람이 직접 검토 사람마다 다를 수 있기 때문에 각각의 적합 문헌들을 합집합 또는 교집합 중 어느것을 사용해도 무관.

결론 정보검색 시스템의 중요성이 급증 사용자들의 요구사항 정리 정보검색 시스템 평가 인터넷, 인트라넷을 통한 정보 서비스 활성화 사용자들의 요구사항 정리 정보검색 시스템 개발의 방향 제시 정보검색 시스템 평가 한글 테스트 컬렉션의 개발이 시급