정보검색 시스템의 성능 평가 정보 검색 시스템 색인어 추출 시스템 문서 범주화 시스템 문서 요약 시스템 질의응답 시스템.

Slides:



Advertisements
Similar presentations
제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
Advertisements

조사자 : 이준호 담당선생님 : 박문열 선생님. 1. 선정동기 2. 작도란 ? 3. 작도의 규칙과 기본작도 4. 정삼각형과 정사각형의 작도 5. 정오각형의 작도 6. 정오각형 작도 그리기 순서 7. 3 대 작도 불능 문제 8. 결론 9. 느낀점 10. 자료 출처.
출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
4장 배열과 함수 한빛미디어(주).
학 과 : 토목공학과 담당교수 : 김 수 용 분반,조 : 301분반,4조 조 이 름 : 다 크 호 스
재료수치해석 HW # 박재혁.
예비보고서1 : 8개의 푸시버튼 스위치가 있다. 이 스위치에 각각 0~7개까지의 번호를 부여하였다고 하자
작도에 대하여 조사자 : 이준호 담당선생님 : 박문열 선생님.
구간추정 (Interval Estimation)
MS-Access의 개요 1강 MOS Access 2003 CORE 학습내용 액세스 응용 프로그램은 유용한 데이터를
데이터베이스 및 설계 금오공과대학교 컴퓨터공학부 이 이섭.
SSCI 저널 리스트 보기 및 Impact Factor 확인하는 법
Learning Classifier using DNA Bagging
테이블 : 데이터베이스를 구성하는 요소로 같은 성격에 정보의 집합체. 레코드 : 하나의 정보를 가지고 있는 컬럼의 집합체
NLP Lab. 세미나 발표자:이주호 2007년 7월 18일 수요일
TCM PROGRAM 개요.
정보검색 테스트 컬렉션 HANTEC 구축 사례
Communication and Information Systems Lab. 황재철
인권의 이해.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
Simulating Boolean Circuits on a DNA Computer
Chapter 07. 기본 함수 익히기.
<소스코딩(Source Coding)> 제4장 가변길이 코드
Progress Seminar 선석규.
Grade Server Team14. Attention Seeker
TREC (Text Retrieval Conference) 소개
2018 YTN ∙ HUFS 학생영어토론대회 - 대회규정 준수 및 심사결과 동의서
C 프로그래밍 C언어 (CSE2035) (Chap11. Derived types-enumerated, structure, and union) (1-1) Sungwook Kim Sogang University Seoul, Korea Tel:
프로그래밍 개요
피임이란?.
군집 분석.
문제 2명의 사형수가 있다. 둘에게는 검정색 모자와 흰색 모자를 임의로 씌우는데, 자기가 쓴 모자의 색은 절대로 알 수가 없다. 서로 상대의 모자색만을 볼 수 있고, 이들이 살기 위해선 자신의 쓴 색의 모자를 맞춰야 한다. 단, 둘 중 한명만이라도 자신이 쓴 모자의 색을.
Can Automatic Calculating Machine Be Said To Think?
Technology Strategy : An Evolutionary Process Perspective
학습 주제 p 일률 측정하기.
‘Chess’를 읽고 컴퓨터공학부 배상수.
Term Projects 다음에 주어진 2개중에서 한 개를 선택하여 문제를 해결하시오. 기한: 중간 보고서: 5/30 (5)
밀도 (1) 부피가 같아도 질량은 달라요 ! 밀도의 측정 밀도의 특징.
디케Dike-정의의여신 Footer Text 4/21/2019.
두 모집단에 대한 검정.
문서 요약 (Text Summarization)
웹사이트 분석과 설계 (화면 설계) 학번: 성명: 박준석.
논문작성을 위한 연구모형 설정 양동훈.
선택형 및 실험평가 문항 제작 2007 중등 심화 연수 By K.Y Lee
하나의 商행위에 같은 번호의 영수증이 두 개가 발급되었으며, 각 영수증의 발행시각 하차시각 승차거리 가 서로 다르다.
TCM PROGRAM 개요.
김정숙 (고려대학교 2014년) 국어국문학과 한국어학 석사 1기 이 드미뜨리
물리 현상의 원리 TIME MACHINE.
바넘효과 [Barnum effect] 사람들이 보편적으로 가지고 있는 성격이나 심리적 특징을 자신만의 특성으로 여기는 심리적 경향. 19세기 말 곡예단에서 사람들의 성격과 특징 등을 알아 내는 일을 하던 바넘(P.T. Barnum)에서 유래하였다. 1940년대 말 심리학자인.
문서 클러스터링 일본언어문화학과 서동진.
비열.
Flow Diagram IV While.
척도의 속성 - 목 차- 자료수집과정 척도의 속성 -명목척도 -서열척도 -등간척도 -비율척도 -리커트척도 3.Data(자료)
11장 배열 1. 배열이란? 1.1 배열의 개요 1.2 배열의 선언과 사용.
웹 사이트 분석과 설계 [디자인 리서치] 학번: 이름 : 홍지애.
의미론적 관점 * TV에서 ‘푸른 빛이 아닌 청자빛’이란 표현을 들었을 경우
우리는 오늘도 동영상을 봅니다. 7조 (김예지, 민지선, 제해솔).
상관계수.
Numerical Analysis Programming using NRs
통계학 R을 이용한 분석 제 2 장 자료의 정리.
p 감수 분열로 자손 남기기 학습 주제 [개구리 동영상] [매미 동영상]
Ch 07. 조사 도구 개발 조사 도구 개발 과정 조사주제 •가설 정의 개념화•조작화 척도 질문지 구성-원칙과 양식
2011학년도 졸업작품 주제 발표 -카메라 기반 제스처 인식 UI-
 6장. SQL 쿼리.
문제의 답안 잘 생각해 보시기 바랍니다..
Progress Seminar 신희안.
진리표를 이용한 타당성 증명 진리표(truth table) : 단순 문장들이 진리값을 상이하게 가질 수 있는 가능한 모든 경우를 남김없이 열거한 표 (ex) 오늘은 날씨가 맑거나 비가 올 것이다. 오늘은 날씨가 맑다 비가 온다 오늘은 날씨가 맑거나 비가 올 것이다. T.
6 객체.
Text Clustering G 조한얼.
피보나치수열에 대하여 한림초 5학년 신동오.
Presentation transcript:

정보검색 시스템의 성능 평가 정보 검색 시스템 색인어 추출 시스템 문서 범주화 시스템 문서 요약 시스템 질의응답 시스템

정보검색 평가척도 Precision Recall F-Measure E-Measure

색인어 추출 시스템 평가 재현율 정확률

문서 범주화 시스템(1/3) Category Ranking System Precision Recall 11-point average precision 전체 테스트 문서 집합에 대한 global 한 evaluation을 하기 위해 각 문서별로 재현율에 따른 정확률을 측정한 뒤 전체 문서 집합에 대해 평균을 내어 산출

문서 범주화 시스템(2/3) Binary Classifier Macro Averaging Precision/Recall 모든 범주들에 대해 동일한 weight 를 부여하는 결과 Micro Averaging Precision/Recall 모든 문서들에 대해 동일한 weight 를 부여하는 결과 범주들의 분포에 엄연히 차이가 존재하므로 Micro Averaging 기법이 Reasonable 하며 대부분 이를 사용

문서 범주화 시스템(3/3) F-measure and BEP Break Even Point Precision과 recall이 같게 된다면 그때의 같은 값이 BEP 같게 할 수 없다면 Precision 과 recall이 가장 가까워 질 때, 두 값을 평균한 값이 BEP F-measure(by C.J. van Rijsbergen) Precision과 Recall의 조화평균(F1)

문서요약시스템(1/2) Adhoc Task Categorization Task 지시적(indicative), 사용자주도(user-driven) 요약에 초점 평가자에게 문서와 사용자질의를 주고, 주어진 문서가 질의에 적합한지의 여부를 결정하도록 한다. 문서는 full-text source일 수도 있고 요약일 수도 있다. 평가자에게는 둘중 어느것인지 알려주지 않는다. Categorization Task 포괄적 요약(generic summary)에 초점 평가자에게 문서를 주고 그 문서와 관련있는 하나의 범주를 선택하도록 한다. 범주와 범주에 대한 설명 제공. Full-text source를 보고 미리 구해둔 적합성에 대해, 요약을 보고 내린 적합성 판단의 정확도를 평가한다.

문서요약시스템(2/2) Question-answering Task Acceptability Task 정보적 요약(informative summary)에 초점 각 문서에 관련된 주제를 이해하고, 그 주제의 모든 필수적인 관점들을 가능한한 짧은 요약에 포함할 수 있어야 한다. 어떤 한 주제에 대해 리포트를 작성하려는 정보 분석가를 지원하기 위해 고안됨. Acceptability Task Full-text에 비해 요약이 얼마나 받아들일만한지에 대해 전반적으로 측정한다. 평가자는 full-text 문서와 요약을 모두 읽어보고, 요약이 만족할만한지 결정하도록 한다. 만족도의 기준?

질의응답시스템(1/3) TREC에서의 question 평가 fact_based question short-answer question 평가 : assessor들이 답으로 제출된 각각의 string을 읽고 binary decision을 한다. 매우 제약을 가한 question임에도 불구하고, answer은 context에 의존했으며, assessor들은 특정한 answer string이 옳은지에 대해 서로 다른 견해를 보였다.

질의응답시스템(2/3) Creating the question set Assessor training Goal : to have the test set represent a wide spectrum of subjects and question types Assessor training The rational for using human assessors : to incorporate the perceptions of the end-users of the technology into the evaluation to the greatest extent possible. Judging the test set 하나의 답에 대해 서로 다른 세 명의 assessor가 judge를 하였다. Scoring the result

질의응답 시스템(3/3) Assessor들간의 견해 차이 정답에 대한 일관된 기준을 만드는 것은 의미가 없다. 예) When did NIXON die? -> April 22 Assessor둘은 정답으로 판단했지만, 한 사람은 연도가 명시되지 않아 틀린 것으로 판단하였다. 정답에 대한 일관된 기준을 만드는 것은 의미가 없다. 정답 기준은 question에 따라 다르다. 예) When으로 시작하는 의문문이라 하더라도, 연도를 명시 해야 하는 경우, 날짜만 명시해도 되는 경우, 세기만 명시해도 되는 경우 등 question마다 정답에 대한 기준이 다르다. 정답 기준은 answer을 받아들이는 사람에 따라 다르다.