검색 상세

거대 XML의 효과적인 동적 Labeling을 위한 질의 기법

Ad-Hoc Query Scheme of Dynamic Labeling for Large XML Processing

초록/요약

오늘날 XML은 높은 상호운용성과 확장성으로 de-facto 데이터 표현법으로 사용되고 있다. XML의 높은 확장성은 거대 데이터를 표현 및 저장하기 위한 방법으로도 사용이 되고 있으며, 이에 따라 저장된 거대 XML 데이터에 대해 질의(query)를 하기 위한 질의의 분산 처리에 관해서도 많은 연구가 이루어져 왔다. 그러나 기존 거대 XML의 분산 query 환경에 동적 labeling을 적용함에 있어 query가 갖는 특정한 엘리먼트를 가리키는 표현적 특징 때문에 하나의 노드에서 query로 찾고자 하는 엘리먼트 수보다 사용되는 데이터의 수가 많아 처리 시간 지연 문제를 가진다. 이러한 처리 시간의 지연은 끝내 동적 labeling 성능을 저하하는 문제를 유발하기 때문에 효율적인 동적 labeling을 위한 query 방법이 필요하다. 본 논문에서는 동적 labeling을 위한 query 처리 시간의 단축을 위해 prefix 기반의 XML labeling이 적용된 label을 이용하여 ad-hoc query 방법과 XML 데이터의 분할 방법 및 데이터 관리 테이블을 제안한다. 이때 본 논문은 동적 labeling을 위한 query를 특정하여 처리하는 방법을 제안하기 때문에 “특별한 목적을 위해”라는 의미의 ad-hoc이라는 형용사를 사용하여 본 제안 방법을 표현한다. 제안하는 ad-hoc query 방법은 찾고자 하는 엘리먼트의 label을 이용하여 해당 엘리먼트의 부모 및 조상 엘리먼트를 검증하며, 위 과정을 통해 query에 사용된 데이터양만큼의 연산 횟수를 갖는다. 또한 ad-hoc query 과정에서 사용되는 데이터 관리 테이블은 query 처리에 필요한 데이터를 전체 노드에서 찾지 않고 찾고자 하는 엘리먼트를 저장한 노드 내에서 찾을 수 있도록 한다. 이와 같은 방법을 통해 동적 labeling을 위한 query를 처리할 때 기존의 XML query 분산 처리 방법보다 적은 비교 연산 횟수로 처리 시간을 단축시킬 수 있다. 제안 방안의 효과를 검증하기 위해 실험을 진행하였다. 그 결과 같은 연산 횟수를 갖는 상황에서 본 제안 방법이 기존 방법보다 30% 더 긴 처리 시간을 보였지만, 본 제안 방법의 ad-hoc query 방법과 데이터 관리 table 인한 비교 연산 횟수 감소를 통해 평균 78.87% 더 짧은 처리 시간을 보였다. 그러나 제안 방법은 일반적인 query 처리할 때 비교 연산 횟수가 증가하여 매우 큰 처리 시간을 보이는 한계점이 있다.

more

목차

제1장 서론 1
제1절 연구배경 및 필요성 1
제2절 연구 내용 및 논문 구성 2
제2장 배경 4
제1절 XML 동적 Labeling 4
1 XML Labeling 4
2 XML 동적 Labeling 5
제2절 거대 XML의 분산 Query 7
1 Xin Bi의 거대 XML의 분산 Query 연구 7
2 Hongjie Fan의 거대 XML의 분산 Query 연구 9
제3절 분산 데이터 관리를 위한 메타 데이터 테이블 11
제3장 동적 Labeling을 위한 Ad-hoc Query의 처리 방법 12
제1절 XML 데이터 분할 및 데이터 관리 테이블 13
1 XML 데이터 분할 13
2 파티션 label 범위 관리 테이블 15
제2절 동적 Labeling을 위한 Query 처리 17
1 기본 Query 17
2 분기점이 있는 Query 19
제3절 동적 Labeling 적용 과정 21
제4장 실험 23
제1절 실험 환경 및 조건 23
제2절 실험 결과 25
1 XML Labeling 및 Upload 오버헤드 26
2 Query 후보를 찾는 과정의 오버헤드 비교 26
3 동적 labeling 적용시 생기는 파티션을 찾는 오버헤드 27
4 동적 labeling을 위한 Query 성능 28
5 다수의 결과를 반환하는 일반적인 Query 31
제5장 결론 34

more