검색 상세

확장 불리언 정보검색 모델을 위한 적응적 적합성 피드백 방법

Adaptive Relevance Feedback Method For Extended Boolean Retrieval Model

  • 발행기관 아주대학교 대학원
  • 지도교수 김민구
  • 발행년도 2005
  • 학위수여년월 2005. 2
  • 학위명 박사
  • 학과 및 전공 일반대학원 컴퓨터공학과
  • 본문언어 한국어

초록/요약

적합성 피드백 방법은 사용자 질의어와 검색 성능을 향상시키기 위해 사용자로부터 이전 검색된 문서 집합에 대한 적합성 판단 정보를 이용하는 전반적인 모든 방법을 의미한다. 일반적으로 모델에따라 다르지만 적합성 피드백 방법은 질의어에 새로운 단어를 추가하여 질의어 확장하는 것과 질의어에 존재하는 단어의 가중치를 조정하는 것 또는 둘다를 포함하는 것으로 생각할 수 있다. 그러나 확장 불리언 검색 모델에서 적합성 피드백은 이것들 뿐만 아니라 질의어에 있는 단어들을 적절하게 불리언 연산자(AND/OR)로 연결시켜야 한다. 많은 연구가들이 이러한 문제를 해결하고자 노력하여 몇가지 방법을 제안하였다. 하지만 대부분 방법들은 불리언 모델에 기반하여 질의어를 확장하여 확장 불리언 모델에는 적합하지 않을 수 있다. Salton과 그의 동료들은 확장 불리언 모델을 위한 DNF(disjunctive normal form) 방법이라 불리는 적합성 피드백 방법을 제안하였다. 그렇지만 이 방법도 다른 방법과 비슷하게 질의어를 확장하는데 중점을 두었을 뿐 질의어에 포함된 용어의 가중치를 조정하는 것에 대하여 소홀하였다. 또한 질의어를 확장할 때 몇가지 문제를 갖고 있다. 이 논문에서는 기존 불리언 적합성 피드백 방법의 문제점들을 극복하기 위해 계층적 클러스터링 기법을 이용한 적합성 피드백 방법을 제안한다. 또한 확장 불리언 모델에서 신경망을 기반으로 질의어의 용어 가중치를 조정하는 방법을 제안한다. 그리고 두개의 실험 데이터 집합인 TREC 1의 DOE 컬렉션과 Web TREC 10 컬렉션을 이용하여 제안한 방법의 성능을 평가하겠다.

more

초록/요약

The relevance feedback process uses information obtained from a user about a set of initially retrieved documents to improve subsequent search formulations and retrieval performance. In extended Boolean models, the relevance feedback implies not only that new query terms must be identified and re-weighted, but also that the terms must be connected with Boolean And/Or operators properly. Salton et al. proposed a relevance feedback method, called DNF (disjunctive normal form) method, for a well established extended Boolean model. However, this method mainly focuses on generating Boolean queries but does not concern about re-weighting query terms. Also, this method has some problems in generating reformulated Boolean queries. In this paper, we investigate the problems of the DNF method and propose a relevance feedback method using hierarchical clustering techniques to solve those problems. We also propose a neural network model in which the term weights used in extended Boolean queries can be adjusted by the users' relevance feedbacks.

more

목차

목차
감사의 글 = I
요약 = II
목차 = III
그림 차례 = V
표 차례 = VI
제1장 서론 = 1
제1절 연구 배경 = 1
제2절 연구 목적 = 3
제3절 연구 내용 = 4
제2장 관련 연구 = 6
제1절 확장 불리언 정보 검색 모델 = 6
제1항 P-Norm 확장 불리언 정보 검색 모델 = 6
제2절 적합성 피드백 방법 = 9
제1항 Dillon 방법 = 9
제2항 DNF 방법 = 12
제3장 제안된 확장 불리언 모델을 위한 적합성 피드백 = 16
제1절 계층적 클러스터링 적합성 피드백 방법 = 16
제1항 클러스터 트리 만드기 = 18
제2항 논리합 정규형(Disjunctive Normal Form)의 확장 불리언 질의어 생성 = 22
제2절 가중치 조정을 위한 신경망 모델 = 25
제1항 확장 불리언 표현을 위한 신경망 구조 = 27
제2항 활성 함수와 학습 규칙 = 31
제4장 실험 결과 및 분석 = 35
제1절 실험 데이터 및 실험 환경 = 35
제1항 TREC 데이터 집합 (DOE 집합과 Web TREC 10 집합) = 35
제2항 실험 환경 = 41
제2절 평가 방법 = 41
제3절 실험 결과 1 = 42
제4절 실험 결과 2 = 46
제1항 클러스터 트리의 최대 깊이와 최소 문서 수 실험 = 46
제2항 불리언 질의어의 용어 및 절의 가중치 조정을 위한 학습 횟수 실험 = 62
제3항 제안한 적합성 피드백 방법과 DNF 방법의 비교 실험 = 71
제5장 결론 및 향후 연구 과제 = 84
참고 문헌 = 86
ABSTRACT = 91

more