5장 질의 연산 5.1 소개 5.2 사용자 연산 피드백 5.3 자동 지역 분석 5.4 자동 전역 분석 5.5 연구 동향 및 쟁점 5.6 참고 문헌 고찰 최신정보검색론 Chapter 12.

Slides:



Advertisements
Similar presentations
비즈쿨 - 정 성 욱 - - 금오공고 비즈쿨 - 정 성 욱 1. 나는 각 단원들의 활동들에 성실하게 참여 하겠습니다. 우리의 다짐 2. 나는 나와 전체의 발전을 위해 각 멘토들의 지도에 순종하겠습니다. 3. 나는 각 단원들을 숙지함으로써 비즈니스 마인드를 함양하고 자신의.
Advertisements

노인복지론 담당교수 : 최 병태 교수님 학과 : 보건복지경영학과 학번 : 이름 : 김 태인 날짜 :
작품을 통해 살펴본 전통사회와 현대사회의 갈등 인문학부 손명학 공학계열 김능배 사회체육 김영수 현대사회와 사회학.
폭력. 폭력이란 무엇인가 우상의 눈물 물리적인 폭력 ( 최기표 ) VS 지능적인 폭력 ( 임형우, 담임선생님 )
3 월 월 례 회 / 개원 8 주년 행사 드리겠습니다 사랑을, 만들겠습니다 기적을. 개 회부 서 별 업 무 보 고부 서 별 업 무 보 고직 장 금 연 선 포폐 회국 민 의 례 차 례 신 규 직 원 소 개 개 원 기 념 행 사 원 장 인 사공 지 사 항.
P300 학습 주제 6-5. 이온의 이동 확인하기 1. 수산화 나트륨 수용액에 건전지를 넣으면 건전지의 (-) 극과 (+) 극에서 각각 수소기체와 산소기체가 발생한다. 그 이유는 ? [ ]
2015 학년도 정시 1 차 | 뮤지컬스쿨 실기고사 안내. 1. 실기고사 2. 실기고사에 참여하려면 고사시각을 사전에 예약해야합니다. - 수험생은 원하는 시각을 선택하여 예약해야 하며, 예약을 하지 않을 경우 임의대로 고사시각이 배정됩니다. - 배정된 고사시각은 변경이.
1 박 2 일 !!! 인천마장초등학교 유수아. 1 박 2 일 멤버 인기순 위 1 위 이승기 2 위 엄태웅 3 위 은지원 4 위 김종민, 이수근 ※인터넷에서 본것이기 때문에 사람에따라 서 다를 수 있다. ※
노령화/저성장/위험사회의 청년 -지속가능한 삶을 위한 조건과 연대 2015년 12월 3일 대구사회 혁신 아카데미 조한 혜정.
2014년도 주요법령 개정사항 (월) ~ (금) 대한전문건설협회 강원도회.
광고론 제 2장: 광고의 경제적 효과 및 규제.
석관중앙교회 5남전도회 석 관 중 앙 교 회 회원 소식 통권 05-04호 발행일 : 2005년 04월 회 장 : 장진호 집사
전인교육형 융합프로그램의 효율적 운영 신흥초등학교 교장 양재필.
Next Chapter 6 초연결사회에서 살아남는 법- 적자생존
지역사회복지론 1조. 요양보호시설에 대해서 황성국 임재형 이동영
- 예∙결산 및 기본재산 운영 신뢰도 제고를 위한 실태점검, 결산지원사업 -
좋은 강의 국제관계학과 정연식.
미국경제의 신용위기가 한국경제에 미치는 영향
Kim Yang Ki 돈,뜨겁게 사랑하고 차갑게 다루어라 Kim Yang Ki
성공적인 주40시간제 정착을 위한 기업의 대응전략
2014학년도 중학교 교육과정 편성시 유의사항 울산광역시교육청 교육과정운영과 한 상 철.
14주차 1교시 강화계획 [학습목표] 1. 강화계획의 정의를 안다 [학습내용] 1. 단순한 강화계획 2. 간헐적 강화 3. 복합 계획 4. 선택과 대응법칙 [사전학습] 강화계획이 일어날 수 있는 사례를 생각해본다.
연장근로와 야간·휴일근로 김영호 노무사 나눔 노사관계연구소 소장 연세대 일반대학원 박사 수료 고려사이버대 법학과 외래교수
I 문학의 개념과 역할 1. 문학의 개념 (1) 언어 예술로서의 문학 (2) 소통 활동으로서의 문학
신입생 예비대학 안내 2007학년도 2. 장 소 : 에버랜드(행사기간 자유이용권 지급) 4. 세부행사 일정
RENO 검출기 stainless tank 제작 가 견적 (거산 , 한성 비교)
4. 목적론적 윤리와 의무론적 윤리 01. 경험주의와 이성주의 01. 경험주의와 이성주의 02. 결과론적 윤리와 공리주의
5장 회로망의 정리 및 해석법 5.1 회로망의 용어 5.2 직·병렬 회로망 5.3 사다리회로망 5.4 분압기의 부하
XA-CHA-RI CHƯƠNG TRÌNH ĐỐ KINH THÁNH (CHÚA NHẬT 18/12/2016) ***
Red Bull 에너지 저장 장치 부품 박성도 배준하 배지송
Information Retrieval (Chapter 5: 질의연산)
프리젠테이션 활용 및 데이터활용 Chapter 6 인쇄 미리 보기와 인쇄 김 정 석
보관하역론 5. 재고관리 2.
Chapter 8 손실 압축 기법 8.1 소개 8.2 왜곡측정 8.3 빈도 왜곡 이론 8.4 양자화 8.5 변환 부호화
개항기 조선과 동아시아 박 범 한국역사입문Ⅱ.
산청군 시천면 반천리 3-2 외1필지(공장용지, 도로)
패턴인식 개론 Ch.10 비모수 밀도 추정법.
군집분석.
Kirchhoff의 법칙.
Chapter. 2 세포의 구조와 기능 오세은 신보람 김세희 김민국.
칼빈의 생애와 개혁자로의 변모 사학과 김종식.
국제의료관광 관련 법, 제도.
Si원소 함유량에 따라 물리적, 기계적, 화학적 성질이 크게 영향을 받음
예산안 원가 구분 금액 총 제작비 대비 원가세부항목 기획개발비 270,000, % 기획비 120,000,000
분임조 활동 (주) 세 기.
안경렌즈의 발달 과정 조원 : 김선영, 류성욱, 신상수, 이정숙, 오대성.
야채 듬뿍 월남쌈 센텀초등학교 요리교실 강사 : 전지원.
CHAPTER 06 청소년의 행동문화 : 폭력(따돌림), 위험행동, 참여.
대구의 부도심 대구의 주요축 동대구 부도심 4조 강민석 / 박성균 / 최은지/ 황재현/김예지.
기업회생 절차.
2. 윤리학의 원리와 적용 가. 상대주의와 절대주의.
남아메리카 선교 김수정, 이하정 전희진, 장성경.
김민정 전기저항 옴의 법칙 이 프레젠테이션은 PowerPoint의 새로운 기능에 대해 안내하며, 슬라이드 쇼에서 가장 잘 보입니다. 이 슬라이드에서는 PowerPoint 2010에서 만드는 프레젠테이션에 대한 설명을 제공합니다. 더 많은 예제 서식 파일을.
강의 프레젠테이션 현대 사회와 미디어 12강. 미디어 문화.
기술 진화와 진보.
사도행전 13장 22절 말씀 –아멘 다 윗 을 왕 으 로 세 우 시 고 증 언 하 여 이 르 시 되 내 가 이 새 의 아 들
CHAPTER 9-1 한국의 사회복지정책 - 사회보험제도 -
2. 기업의 재무상태.
18 화폐공급과 화폐수요.
기초학력향상 지원사이트 Ku-Cu - 활용안내 -
경찰행정과 세미나 결과를 공개해야한다. VS 비공개로 해야한다. 경찰의 근무성적평정 제도.
180도Ⅱ는 회복과 개선에 중점을 둔 SYSTEM입니다 How to Use 180도 시스템 - \768,830
국가별 의료문화적 특성 이해.
영상으로 읽는 한국사 02 삼국은 서로를 한 ‘민족’으로 생각했나? - 삼국통일의 의미-.
Chapter 2. 경영분석을 위한 재무제표 재무제표의 공시.
삶을 풍요롭게 만드는 의사소통.
시민으로서의 권리와 의무 사회(일반사회) 중학교 2학년 2학기 Ⅶ. 사회생활과 법규범
Chapter 1 인간행동의 이해와 사회복지실천
경찰학 세미나 제 5 강 경찰관직무집행법 2조 5호의 의미 신라대학교 법경찰학부 김순석.
Presentation transcript:

5장 질의 연산 5.1 소개 5.2 사용자 연산 피드백 5.3 자동 지역 분석 5.4 자동 전역 분석 5.5 연구 동향 및 쟁점 5.6 참고 문헌 고찰 최신정보검색론 Chapter 12

5.1 소개 질의어 확장과 가중치 재계산으로 처음 질의를 개선하는 방법들을 소개 - 사용자 피드백 정보를 이용하는 방법 - 처음 검색된 문헌 집합 - 문헌 집합 전체에서 추출된 정보를 이용하는 방법 벡터 및 확률 모델에 있어서 사용자 연관 피드백 방법 지역 분석에 대한 두 가지 방법 두 가지 전역 분석 방법 최신정보검색론 Chapter 12

5.2 사용자 연관 피드백 연관 피드백 : 질의 재작성 방법 적합성 피드백의 장점 연관 피드백 : 질의 재작성 방법 적합성 피드백의 장점 - 사용자는 문헌 연관성 정보만 제공 - 연관 피드백 과정의 자세한 사항은 알 필요가 없음 - 전체 검색 프로세스를 이해하기 쉬운 작은 단계로 분할함 - 용어의 강조, 다른 용어의 중요도를 감소를 위해 통제된 과정을 제공 최신정보검색론 Chapter 12

5.2.1 벡터 모델에서의 질의 확장 및 용어 가중치 재부여 5.2.1 벡터 모델에서의 질의 확장 및 용어 가중치 재부여 연관 문헌인 경우 - 연관 문헌들의 용어-가중치 벡터와 서로 유사한 사실을 이용 비연관 문헌인 경우 - 연관 문헌들의 용어-가중치 벡터와는 다른 벡터라고 가정함 질의 q의 처리에 대한 추가적인 용어 정의 Dr : 검색된 문헌 중에서 사용자에 의해 연관 문헌으로 판단된 문헌 집합 Dn : 검색된 비연관 문헌 집합 Cr : 컬렉션 내 모든 문헌 중 연관 문헌 집합 |Dr|, |Dn|, |Cr| : 각 집합 Dr, Dn, Cr의 문헌 수 : 조절 상수 최신정보검색론 Chapter 12

5.2.1 벡터 모델에서의 질의 확장 및 용어 가중치 재부여 (계속) 5.2.1 벡터 모델에서의 질의 확장 및 용어 가중치 재부여 (계속) 최적 질의 벡터 수정된 질의 을 계산하는 세가지 방법 최신정보검색론 Chapter 12

5.2.2 확률 모델에서의 용어 가중치 재부여 질의 q와 유사한 문헌들을 확률 순위화 원칙에 의해 동적으로 순위화함 문헌 dj와 질의 q의 유사도 초기 검색을 위한 가정들 - P(ki|R)값은 모든 용어 ki에 대해 상수 값(보통 0.5) - 용어 분포 확률은 전체 컬렉션 분포로 근사함 최신정보검색론 Chapter 12

5.2.2 확률 모델에서의 용어 가중치 재부여 (계속) 확률P(ki|R)와 P(ki| )의 비교 (근사함) 5.2.2 확률 모델에서의 용어 가중치 재부여 (계속) 확률P(ki|R)와 P(ki| )의 비교 (근사함) |Dr|,|Dr,i|가 매우 작아지는 문제로 조정 계수(0.5)를 합함 최신정보검색론 Chapter 12

5.2.2 확률 모델에서의 용어 가중치 재부여 (계속) 조정 계수 0.5는 불만족스러운 결과를 생성할 수 있음 5.2.2 확률 모델에서의 용어 가중치 재부여 (계속) 조정 계수 0.5는 불만족스러운 결과를 생성할 수 있음 ni/N 또는 (ni-|Dr,i|)와 같은 다른 조정 계수를 제안 이 연관 피드백 과정의 주요 장점 - 피드백 과정이 질의 용어의 새로운 가중치 계산과 직접적 연관 - 이진 색인, 색 인어 독립성을 가정시 용어 가중치 재부여가 최적화 단점 - 피드백 과정에서 문헌 내 용어 가중치가 고려되지 않음 - 이전 질의에서의 용어 가중치가 무시됨 - 질의 확장이 없음 최신정보검색론 Chapter 12

5.2.3 확률적 용어 가중치 재부여의 변형 확률화 순위와 식 Croft의 초기 검색과 피드백 검색에 다른 수식을 제안 - 는 정규화된 문헌 내의 출현 빈도 - 인수 C, K는 각 컬렉션에 맞게 조정 - 자동 색인된 컬렉션에서는 C가 초기에 0으로 지정 최신정보검색론 Chapter 12

5.2.3 확률적 용어 가중치 재부여의 변형 (계속) Croft가 제안한 피드백 검색에서 Fi,j,q 식 확률적 용어 가중치 재부여 변형 방법의 장점 - 문헌 내 출현 빈도를 고려 - 정규화된 출현 빈도를 사용 - C, K상수를 도입하는데 매우 큰 융통성을 제공 단점 - 더 복잡한 수식을 사용 - 질의 확장이 없음 최신정보검색론 Chapter 12

5.2.4 연관 피드백 방법들의 평가 Rocchio식을 이용한 검색 성능 향상 평가 - 이 문헌들은 검사하였기 때문에 이러한 평가는 비현실적임 현실적인 방법 - 잔여 컬렉션만을 고려하는 것 잔여 컬렉션을 대상으로 재현율-검색률 측정이 일반적 최신정보검색론 Chapter 12

5.3 자동 지역 분석 전역적 방법 - 컬렉션 내 전체 문헌을 사용 - 용어 연관성을 나타내는 전역적 유사 소서러스 구조를 작성 - 사용자는 자신에게 제시된 이 구조를 이용 - 질의 확장을 위한 용어를 선택 지역적 방법 - 질의 q에 의해 검색된 문헌들을 이용 - 질의 시간에 질의 확장을 위한 용어를 선택 - 사용자의 도움이 필요 없음 - 지역 클러스터링, 지역 문맥 분석 방법 최신정보검색론 Chapter 12

5.3.1 지역 클러스터링을 통한 질의 확장 정의 이 전략의 지역적 성질 현재 질의에 의해 검색된 문헌만을 대상으로 작업 검색된 문헌의 내용에 접근해야 할 필요성이 빈번하게 발생 이 지역 전략을 웹 환경에 적용하는 것은 비현식적 V(s)는 공집합이 아니며, 전체 단어의 부분 집합으로 서로 문법적 이형태 (variants) 단어들을 모은 집합이라고 하자. V(s)의 정규 형태 s를 스템(stem)이라고 한다. 예를 들어 V(s)={polish, polishing, polished}이라면 s=polish가 된다. 주어진 질의 q에 대해, 검색된 문헌 집합 Dl을 지역 문헌 집합이라고 하고 이 지역 문헌 집합에 나타나는 서로 다른 모든 집합 Vl을 지역 어휘라고 부른다. Vl집합으로부터 추출된 서로 다른 모든 스템의 집합을 Sl로 표시한다. 최신정보검색론 Chapter 12

5.3.1 지역 클러스터링을 통한 질의 확장 (계속) 연관(association)클러스터 연관 계수를 정규화 문헌 내에서의 어떤 스템 si의 빈도를 f si,j로 표시한다. 는 |Sl|행과 |Dl|열로 구성된 연관 행렬이며, mij= f si,j 은 의 도치(transpose) 행렬이며, 행렬 은 지역 스템간 연관 행렬이 된다. 의 각 요소 는 스템 와 의 연관도 c u,v를 나내며 다음과 같이 구할 수 있다. 최신정보검색론 Chapter 12

5.3.1 지역 클러스터링을 통한 질의 확장 (계속) 지역 연관 클러스터 질의 시간에 효과적으로 계산될 수 있다는 것을 의미함 연관 행렬 의 u번째 행(즉, 스템 의 모든 용어를 표시하는 행)을 고려해보자 U번째 열을 받아 모든 (v는 지역 스템을 정의역으로 하며, 이다) 값들 중 가장 큰 n개의 값을 반환하는 함수를 (n)이라고 하자. 그러면 (n)은 스템 의 지역 연관 클러스터를 정의하게 된다. 만약 가 식 5.6을 이용하여 계산되면 연관 클러스터는 정규화되지 않았다고 하며, 식 5.7을 이용하여 계산되면 연관 클러스터는 정규화되었다고 한다. 최신정보검색론 Chapter 12

5.3.1 지역 클러스터링을 통한 질의 확장 (계속) 메트릭(Metric)클러스터 다르게 연관 계수를 정규화 (5.9) 두 키워드 ki와 kj 사이의 거리 r(ki, kj)를 한 문헌 내에서 두 키워드 사이에 출현하는 단어의 수로 정의한다. 만약 두 키워드 ki, kj가 같은 문헌에 출현하지 않으면 이다. 지역 스템간 메트릭 연관 행렬 는 다음과 같이 되는데 s의 각 요소 는 스템 와 사이의 연관도 c u,v를 나타낸다. 즉, 최신정보검색론 Chapter 12

5.3.1 지역 클러스터링을 통한 질의 확장 (계속) 지역 메트릭 클러스터의 정의 메트릭 연관 행렬 의 u번째 행렬(즉, 스템 에 대한 모든 연관을 나타내는 행)을 입력으로 하여, 모든 (v는 지역 스템을 정의역으로 하며, 이다) 값들 중 가장 큰 n개의 값을 반환하는 함수를 (n)이라고 하자. 그러면 (n)은 스템 의 지역 메트릭 클러스터를 정의하게 된다. 만약 가 식 5.8을 이용하여 계산되면 메트릭 클럴스터는 정규화되지 않았다고 말하며, 식 5.9를 이용하여 계산되면 메트릭 클러스터는 정규화되었다고 한다. 최신정보검색론 Chapter 12

5.3.1 지역 클러스터링을 통한 질의 확장 (계속) 스칼라(Scalar)클러스터 을 스템 와 의 연관 계 을 스템 와 의 연관 계 수벡터라고 하자. = ( )를 스칼라 연관 행렬이라고 하면, 각 는 다음과 같이 정의 된다. (5.10) (n)을 식 5.10에서 정의 된 모든 ( )값 중 가장 큰 n개의 값을 반환하는 함수라고 하면 Su(n)은 스템 의 스칼라 클러스터를 정의하게 된다. 최신정보검색론 Chapter 12

5.3.1 지역 클러스터링을 통한 질의 확장(계속) 대화적 탐색 명시 최신정보검색론 Chapter 12

5.3.2 지역 문맥 분석을 통한 질의 확장 지역 문맥 분석 방법 : 전역 분석의 아이디어를 검색된 지역 문헌에만 적용한 예 전역분석과 지역 분석을 결합한 것 - 전역 분석 방법 : 전체 컬렉션을 이용하여 용어 연관 관계를 탐색하는 것 지역 문맥 분석 과정 - 현재 질의를 사용하여 상위 n개의 단락을 검색 - 해당 개념과 전체 질의와의 유사도 sim(q,c)를 계산 - m개의 상위 순위 개념이 원래 질의에 추가 - 각 개념에 1-0.9*i/m의 가중치가 부여 - 원래 질의 q에 있던 용어들은 가중치를 2로 부여함 (강조) 최신정보검색론 Chapter 12

5.3.2 지역 문맥 분석을 통한 질의 확장 (계속) 각 연관 개념 c와 원래 질의 q사이의 유사도 sim(q,c) N: 상위 순위 단락의 수 최신정보검색론 Chapter 12

5.4 자동 전역 분석 컬렉션 전체 문헌으로부터 추출된 정보를 이용하여 질의를 확장 이 절에서 소개하는 방법은 컬렉션 전체 문헌을 이용하여 작성된 유사 시소러스 구조를 사용 시소러스를 작성하는 방법과 질의 확장을 위한 용어 선택 방법은 매우 상이함 최신정보검색론 Chapter 12

5.4.1 유사도 시소러스를 이용한 질의 확장 정의 앞에서와 같이, t는 전체 컬렉션의 용어 수, N은 컬렉션 내의 총 문헌 수, fi,j 를 문헌 dj에서의 용어 ki의 빈도, tj를 문헌di의 색인어 수라고 하자. 또, itfi 를 문헌 di의 역 용어 빈도라고 하면 itfi는 역문헌 빈도 정의와 비슷하게 다음과 같이 정의된다. (5.11) (5.12) 최신정보검색론 Chapter 12

5.4.1 유사도 시소러스를 이용한 질의 확장 (계속) 전역 유사 시소러스 질의 확장의 3단계 색인 용어를 표현하기 위해 사용된 개념 공간상에 질의표시 각 용어 kv에 대한 전체 질의에 대한 유사도 sim(q,kv)계산 sim(q,kv)에 따라 정렬한 상위 r개의 용어를 사용/질의 확장 색인 용어 벡터의 개념 공간상에 표시 질의 q에 대해 다음과 같은 용어-개념 공간상의 벡터 가 부여된다. 여기서 wi,q 색인어-질의 쌍 [ki,q]에 부여된 가중치이며, 식5.11의 색인어-문헌 가중치와 비슷하게 계산된다. 최신정보검색론 Chapter 12

5.4.1 유사도 시소러스를 이용한 질의 확장 (계속) 각 용어 kv와 사용자 질의와의 유사도 sim(q,kv) 최신정보검색론 [그림 5.2] 질의 중심 Qc로부터 주어진 용어 Kv까지의 거리는 각각의 질의 용어로부터 Kv까지 의 거리와 매우 다를 수 있다 최신정보검색론 Chapter 12

5.4.1 유사도 시소러스를 이용한 질의 확장 (계속) 최신정보검색론 Chapter 12

5.4.1 유사도 시소러스를 이용한 질의 확장 (계속) 최신정보검색론 Chapter 12 [그림 5.3] 완전 링크 알고리즘을 이용해 작성된 세 클러스터 계층(클러스터간 유사도는 타원 내 숫자로 표시) 최신정보검색론 Chapter 12

5.4.2 통계 시소러스를 이용한 질의 확장 완전 링크(complete link) 알고리즘 - 각 문헌을 다른 클러스터에 둠 - 모든 클러스터 쌍 사이의 유사도를 계산 - 클러스터간 유사도가 가장 큰 클러스터 쌍 [Cu,Cv]를 결정 - 두 클러스터 Cu, Cv를 통합 - 정지 조건을 검사 - 클러스터 계층을 반환 최신정보검색론 Chapter 12

5.4.2 통계 시소러스를 이용한 질의 확장 (계속) 전역 시소러스의 클래스를 구성하는 용어의 선택 - 클래스 임계값, 클래스 문헌 수, 역 문헌 빈도 최소값 인수를 얻음 - Cu와 Cv 가 한 시소러스 클래스를 생성하려면 sim(Cu,Cv)가 임계값 보다 커야 함 - NDC 인수를 사용하여 대상 클러스터의 크기를 제한함 - 한 클러스트 내중 오직 저빈도 문헌에서만 시소러스 클래스 용어가 선택 최신정보검색론 Chapter 12

5.4.2 통계 시소러스를 이용한 질의 확장 (계속) 각 시소러스 클래스 C에 대한 평균 용어 가중치 시소러스 클래스 가중치 최신정보검색론 Chapter 12

5.5 연구 동향 및 쟁점 최신 정보 시스템의 그래픽 인터페이스에 바로 적용 그러나 대화성이 중요하므로 피드백 정보를 얻는 새로운 기술이 요구됨 전역 분석 기술은 질의에 제공된 지역 문맥을 활용함 중요한 연구 과제 - 지역 분석, 전역 분석, 시각 표시 장치와 대화적 인터페이스를 조합하는 문제 중요한 쟁점 - 사용자로 하여금 문헌 공간을 시각적으로 항해하는 문제 - 질의 작성을 돕는 단서를 제공하는 문제 최신정보검색론 Chapter 12

5.6 참고 문헌 고찰 1960년 Maron, Kuhn[547]: 사용자 질의를 확장의 초기 연구 1965년 Rocchio[678]: 질의 확장과 가중치 재계산 연구 1976년 Robertson, Sparch Jones[677]: 초기 확률 모델 1978년 Harper, van Rijabergen: 확률적 질의 확장을 위해 클러스터링 기술을 이용 1983년 Croft[198]: 문헌 내 용어 빈도를 위해 확률식에 C, K 인수를 도입 Voorhees[793], Crouch, Yang[200], Qui, Frei[655]의 실험 : 전역 분석을 이용한 질의 확장이 일관성 있게 검색 성능을 개선 1977년 Attar, Fraenkel[35]: 지역 분석을 통한 질의 확장 논의 1996년 Xu, Croft[838]: 지역 문맥 분석 Qui, Frei[655]: 전역 유사 시소러스를 통한 질의 확장 Crouch, Yang[200]: 전역 통계 시소러스를 통한 질의 확장 최신정보검색론 Chapter 12