검색 상세

사용자 위치 기반 데이터를 활용한 패턴분석 및 장소 분류에 관한 연구

초록/요약

시간적, 사회적 제약으로 인해 사람들의 이동 경로가 제한된다는 사실로 미루어봤을 때, 사용자의 위치 정보는 보다 구체적으로 사용자의 성향을 표현하고, 행동 패턴을 관찰할 수 있는 중요한 자료가 된다. 본 논문에서는 위치 기반 데이터를 활용하여 유의미한 정보를 분석하기 위하여 두 가지 관점에서 위치 데이터 분석을 진행하였다. 먼저, SNS인 인스타그램 텍스트 데이터를 활용하여 여행 트렌드를 분석하였다. 시간대 별 여행자의 이동 패턴을 파악해 특정 시간대에 방문횟수가 많은 장소를 알아내어 의미 있는 패턴 정보를 파악하였다. 패턴을 분석하기 위한 방법으로 LDA를 활용하였는데, 분석 결과 일반 태그 분석에 비해 상관관계가 더 높은 해시태그들이 군집화 되어 지역을 구분하고 지역과 관련된 키워드를 잘 뽑아내는 데 더 효과적이다 는 것을 확인할 수 있었다. 다음으로 통신사의 통화량 데이터를 토대로 지역별 업종 이용 현황 파악을 진행하였다. 시계열 데이터를 수집하여 HMM 알고리즘을 적용한 결과, 시간의 흐름에 따라 각 업종이 어떤 경향을 보이는 지를 파악하였고, 입력 데이터의 차원을 높여, 나타날 수 있는 관찰 값의 경우의 수를 늘리는 새로운 방법을 시도해보았다. 또한 지역구 별로 분류된 모델을 활용하여, 4차원의 새로운 데이터가 나타났을 때, n=15를 적용하여 80%의 분류 정확도를 이끌어낼 수 있었다. 본 연구를 통해 텍스트 기반의 위치 정보 및 시계열 데이터를 가공하여 지역 별로 나타난 패턴을 탐색하고, 이러한 패턴이 타당성을 가지고 있는지 거리 비교 및 분류를 통해 검증한다. 이를 통해 특정 지역에서 관찰 가능한 경향성에 대한 타당성을 입증하며 지역에 관한 패턴을 정리한다.

more

목차

1 서 론 1
1.1 연구 배경 1
1.2 연구 목적 2
1.3 관련 연구동향 3
1.4 프로세스 흐름도 및 논문의 구성 4
2 텍스트 마이닝을 위한 데이터 전처리 방법 6
2.1 텍스트 데이터 전처리 방법 6
2.2 LDA 기법 소개 7
2.3 시계열 데이터 전처리 방법 9
2.4 HMM 기법 소개 11
3 인스타그램 사용자의 여행 패턴 분석에 관한 연구 14
3.1 LDA 기법 적용방안 14
3.2 사용 데이터 및 실험 절차 16
3.3 LDA를 활용한 여행 패턴 분석 18
3.4 성능 평가 22
3.4.1 ‘태그만 활용’ VS ‘LDA를 활용한’ 위치 분류 22
3.4.2 LDA 분류와 태그 분류 수치 비교 23
4 위치 기반 데이터를 활용한 패턴 분석 및 장소 분류 25
4.1 HMM 기법 적용방안 25
4.2 사용 데이터 및 실험 절차 27
4.3 HMM을 통한 사용자 패턴분석 및 장소 분류 30
4.3.1 패턴 분석 30
4.3.2 테스트 데이터 분류 성능 확인 36
5 결론 및 향후 연구방향 38
참 고 문 헌 40
ABSTRACT 43

more