검색 상세

다차원 프레셰 거리 기반 종단자료 군집분석

Clustering for Longitudinal Data Based on Multidimensional Fréchet Distance

초록/요약

각 개체가 궤적의 형태를 이루는 종단자료에 대한 K-평균 군집분석에서는 궤적 간 유사성을 측정할 수 있는 궤적 거리함수가 필요하다. 기존 K-평균 종단자료 군집분석 알고리즘들은 자체 거리함수 구조 등의 제약으로 현실의 다양한 종단자료를 분석하는 데 한계가 있었다. 특히, 한정된 차원의 궤적만 취급할 수 있다는 것이 대표적이었다. 이에 본 논문에서는 다변수 종단자료로부터 그려지는 다차원 궤적도 다룰 수 있는 새로운 K-평균 종단자료 군집분석 알고리즘을 제안하였다. 이는 궤적 간 유사성을 타당하게 측정한다고 알려진 프레셰 거리(Fréchet distance) 함수를 다변수로 구성된 종단자료도 처리할 수 있는 구조로 K-평균 군집분석 알고리즘에 도입한 것이 특징이다. 이를 통해 궤적 차원의 제약뿐만 아니라 궤적 간 시점 통일 제약 등 기존 알고리즘들이 가지고 있던 여러 가지 한계점을 해결할 수 있었다. 가상의 3차원 궤적에 대한 군집분석 시뮬레이션과 실제 임상 데이터에서의 군집분석 결과를 활용한 검증 과정에서도 본 논문에서 제안한 신규 알고리즘이 기존 알고리즘들에 비해 종합적으로 우수한 성능을 보임을 확인할 수 있었다.

more

초록/요약

A K-means clustering for longitudinal data in which each object forms the form of a trajectory requires a trajectory distance function to measure similarity between the trajectories. The existing K-means clustering for longitudinal algorithms had limitations for analyzing various longitudinal data in reality due to restrictions such as their own distance function structure and etc. In particular, it was typical that only a limited dimension of trajectory could be handled. Thus, in this paper, a new K-means clustering for longitudinal data algorithm that can also deal with multidimensional trajectory drawn from multi variable longitudinal data was proposed. This algorithm is characterized by introducing the ‘Fréchet distance’ function, known to measure the similarity between trajectories, into the K-means clustering algorithm with a structure that can also handle multi-dimensional trajectories. Through this, it was possible to solve various limitations of existing algorithms, such as constraints like time-unification between trajectories, as well as the dimensional constraints. The verification process by clustering simulation on virtual 3-dimensional trajectories and utilizing the results of clustering in actual clinical data also confirmed that the new algorithm proposed in this paper showed overall superior performance compared to the existing algorithms.

more

목차

제1장 서론 1
제2장 배경 이론 3
1. K-평균 종단자료 군집분석 3
2. 프레셰 거리 4
제3장 기존 방법론 6
1. KmL 알고리즘 6
2. kmlShape 알고리즘 7
제4장 제안 방법론 8
1. 다차원 프레셰 거리 K-평균 종단자료 군집분석: MFKmL 8
2. MFKmL 다차원 프레셰 거리 9
3. MFKmL 다차원 프레셰 평균 궤적 12
제5장 검증 실험 방법 16
1. 가상 데이터 적용 방법 16
2. 실제 데이터 적용 방법 17
제6장 검증 실험 결과 19
1. 가상 데이터 적용 결과 19
2. 실제 데이터 적용 결과 24
제7장 결론 31
1. 시사점 31
2. 한계 및 후속연구 32
참고문헌 33

more