검색 상세

Seq2Seq 기반의 주기 가변형 교통정보 예측모델 개발

Development of a Variable step Traffic information prediction model using Seq2Seq

초록/요약

본 연구는 교통정보의 정확성과 일관성을 저하시키는 교통정보 결측 문제 해결을 위해 시작하였다. ITS에서 교통정보 결측 보정은 주로 시간적 추세 보정방법을 사용하고 있으나, 연속된 결측이 발생할 경우 정확도는 낮아지는 문제점을 가지고 있다. 데이터 결측 분석 결과 1시간 이상 결측이 빈번하게 발생하고 있지만, 시스템의 문제로 기인하여 결측문제 해결에 관심이 적은 상황이다. 교통정보 결측을 해결하기 위해서는 2가지 측면의 접근이 필요하다. 첫째, 연속된 시간으로 발생하는 문제해결을 위해 특정 단일 시간의 예측(Single Step)이 아닌 다양한 연속된 시간의 예측(Multi-Step)이 필요하다. 둘째, 비정기적, 불규칙적으로 발생하기 때문에 시간대에 종속 받지 않고 안정적인 예측정확도가 필요하다. 위의 두 요구사항을 해결하기 위해서 긴 문장을 예측하는 자연어처리 기법인 Seq2Seq 기법을 적용하였다. 기존 RNN 기반의 예측모형은 단일시간 예측에 높은 정확도를 보이지만, 예측길이가 길어질수록 시간종속성의 문제로 예측력이 저하되는 문제를 가지고 있다. Seq2Seq는 과거정보를 처리하는 인코더와 인코더 정보를 해석하는 디코더로 구성하여 시간종속성의 문제를 해결하고 장기예측에 강점을 가지고 있다. 문자데이터 처리와 문장해석을 위해 개발된 Seq2Seq를 ITS에 적용할 수 있고, 결측보정에 필요한 2가지 요구사항을 해결할 수 있도록 구조를 개선하였다. 최종적으로 손실함수의 손실값을 최소화하는 하이퍼 파라미터를 분석하여 최적의 모델을 선정하였다. 분석결과 링크별로 예측오차의 차이가 발생하였지만, MAE는 2.5km/h ∼6.6km/h, RMSE는 3.8 ∼ 9.8로 분석되었다. 예측시간을 3시간, 12시간, 24시간으로 분석한 결과 예측시간 차이에 따라 오차의 증가는 나타나지 않았으며, 예측시간 내에서 예측주기가 길어짐에 따라 오차량이 MAE는 시간당 0.06, MAPE는 시간당 0.27% 증가하는 추세가 분석되어 예측시간이 길어져도 오차는 미세하게 증가하는 것으로 분석되었다. 비교모형과 예측정확도를 비교한 결과 링크의 특성과 예측시간에 따라 타 모형이 일부 좋은 예측력이 분석되기도 하였으나 6시간 예측을 기준으로 개발모델의 MAE가 4.38km/h, LSTM의 MAE가 4.41km/h, 이동평균은 7.64km/h, 24시간 예측은 개발모델의 MAE는 4.81km/h, LSTM은 5.08km/h, 이동평균은 4.98km/h로 개발모델의 예측정확도가 우수한 것으로 분석되었다. 시간에 따라 예측력의 차이는 개발모델이 시간당 0.26% 예측오차가 증가하는 반면, LSTM은 시간당 0.41%, 이동평균은 0.41%로 비교모델에 비해 예측주기가 길어짐에 따라 예측오차가 적게 증가하는 것으로 분석되었다. 본 연구에서는 교통정보 결측의 요구사항인 장기시간 예측이 가능하며, 시간에 종속받지 않고 예측주기가 길어져도 예측정확도가 안정적인 예측모델을 개발하였다. 실제 ITS로 수집되는 데이터를 통해 적용 가능성도 확인하였기에 교통정보의 정확성과 일관성을 향상시켜 더욱 도로운영의 효율성 향상에 기여할 것으로 기대한다.

more

목차

제1장 서 론 1
제1절 연구 배경 및 목적 1
제2절 연구의 범위 4
제3절 연구내용 및 방법 6
제2장 이론적 고찰 8
제1절 교통정보 결측 현황 8
제2절 교통정보 예측모형 연구 13
제3절 Sequence to Sequence (Seq2Seq) 34
제4절 선행연구 시사점 및 차별성 41
제3장 모델개발 방법론 및 모델개발 44
제1절 모델개발 방법론 정립 44
제2절 데이터 수집 49
제3절 데이터 전처리 및 데이터 셋 구성 59
제4절 최적 모델 파라미터 분석 65
제5절 선정모델 예측 정확도 분석 74
제4장 모델의 평가 87
제1절 평가 방법론 87
제2절 비교모형 선정 89
제3절 평가 결과 92
제4절 개발모델의 적용 방안 103
제5장 결론 및 향후 연구 110
제1절 결 론 110
제2절 한계점 및 향후 연구 112
참고 문헌 114

more