검색 상세

일반화된 패턴을 이용한 관계 추출 시스템

Relation Extraction System Using Generalized Patterns

  • 발행기관 아주대학교 정보통신 전문대학원
  • 지도교수 박승규, 김민구
  • 발행년도 2005
  • 학위수여년월 2005. 8
  • 학위명 석사
  • 학과 및 전공 정보통신전문대학원 정보통신공학과
  • 본문언어 한국어

초록/요약

텍스트 형태의 문서에는 많은 종류의 가치 있는 정보가 포함되어 있다. 특히, 단어와 단어간의 관계 정보는 QA(Question and Answer)시스템에서 정확한 정보를 제공해 줄 수 있으며[7] 시멘틱 웹의 기반을 형성하는 온톨로지를 구성하는 데에 사용될 수 있다[16]. 따라서 문서에서 이러한 관계를 찾는 방법에 대한 연구가 활발하게 진행되고 있다. 그러나 문서의 양과 단어간의 관계가 많기 때문에 모든 관계를 사람이 찾아낼 수는 없다. 따라서 사람의 참여를 최소한으로 하는 자동 패턴 추출에 대한 연구가 필수적이다. 자동으로 관계를 찾는 대부분의 시스템이 패턴을 이용하고 있다. 패턴은 자동으로 관계를 찾는 시스템의 핵심으로 실제 문서에서 관계를 추출할 때 쓰이게 된다. 패턴은 관계가 실제 문서에서 실현되는 모습을 말한다. 예를 들어, “X 는 Y이다.”라는 문장에서 “~는 ~이다.”라는 것은 is-a관계를 나타내는 패턴이다. Is-a즉, 상·하위 관계가 문장에서 “~이다”를 통해 표현된 것이다. 관계 추출 시스템은 이러한 패턴을 이용하여 문서에 존재하는 관계를 자동으로 추출할 수 있다. 시스템에서 사용하는 패턴이 정확할수록 추출된 관계 정보도 정확해진다. 그러나 정확한 패턴을 생성하는 데에는 많은 어려움이 따른다. 본 논문에서는 문서상에 존재하는 많은 관계들을 찾기 위해 자동으로 패턴을 찾는 시스템과 다양한 형태의 패턴을 수용하기 위해 단순화된 패턴을 적용하는 방법을 제안한다. 본 연구에서는 자동으로 패턴을 찾는 기존의 시스템과 제안한 방법을 근거로 한 시스템을 구현하여 상, 하위 관계에 있는 단어들을 찾고, 각각의 성능을 비교 평가할 것이며 실험을 통해 발견된 문제점에 대해서도 분석하고 해결책을 제시한다.

more

목차

목차
제 1 장 서론 = 4
제 2 장 관련 연구 = 6
제 1 절 관계 추출 기법 = 6
제 1 항 언어적(Linguistic)기법 = 7
제 2 항 통계적 기법 = 9
제 2 절 단순화된 패턴 기법 = 10
제 1 항 SP+PRP 시스템 = 10
제 3 장 일반화된 패턴을 이용한 관계 추출 기법 = 13
제 1 절 패턴의 생성 및 관계 추출 방법 = 13
제 2 절 일반화된 패턴을 이용한 관계 추출 시스템의 설계 및 구현 = 14
제 1 항 Translating 프로세스 = 15
제 2 항 시드 Tuple 검색 = 16
제 3 항 일반화된 패턴의 생성 = 18
제 4 항 새로운 시드 Tuple의 생성 = 19
제 4 장 실험 및 분석 = 22
제 1 절 실험 자료 및 환경 = 22
제 2 절 실험 및 결과 분석 = 24
제 5 장 결론 및 토의 = 27
참고문헌 = 29

more