검색 상세

머신러닝을 이용한 이동통신 데이터 기반 교통량 추정 모형 개발 : 일반국도를 중심으로

A Study on the Development of Traffic Volume Estimation Model based on Mobile Communication Date using Machine Learning


The purpose of the study is to develop an optimal mobile communication-based National Highway traffic volume estimation model using ensemble-based machine learning algorithm. This model is developed to secure the accuracy of traffic volume information comparable to existing detectors through traffic volume information calculated through mobile communication log data, and estimate the traffic volume for sections where it was difficult to collect traffic information. Through the machine learning algorithm, it was analyzed that the applicability of the traffic volume estimation results for the VDS (Video-based detection systems) operation and non-operation section as well as the possibility of evaluating VDS condition based on the estimated traffic volume. Based on information such as traffic volume measured through mobile communication data and VDS data(labeling data), the LightGBM model was selected as the optimal model for estimating traffic volume as a result of comparison and analysis on the ensemble-based model including linear regression model. As a result of evaluating the traffic volume estimation performance, 96 points that VDS controllers installed, for National Highways 1, 3, and 6 using LightGBM, MAPE was 8.49 and the traffic volume estimation accuracy was analyzed to be 91.51% in the entire detection area. The roads where VDS was not installed, the MAPE was 9.0 for route 1, 2.8 for route 3, 10.4 for route 6, and traffic estimation accuracy was analyzed to be 92.6%(the average MAPE 7.4). It meant that the LightGBM model was sufficiently applicable to the section where VDS installation was difficult or was not operated. Also, it was found that the detector condition could be evaluated with LightGBM model.



본 연구는 이동통신 로그 데이터를 통해 산출된 교통량 정보를 활용하여 기존 검지기에 준하는 교통량 정보의 정확도를 확보하고, 교통정보 수집이 어려운 구간 등을 대상으로 교통량을 추정하기 위해, 최근 활용도가 높은 머신러닝 기반의 앙상블 기법을 검토하여 최적의 이동통신 기반 교통량 추정 모형을 개발하는 것이다. 이를 통해 영상식 VDS 운영 구간뿐만 아니라 VDS가 운영되지 않는 구간에 대한 교통량 추정 결과의 적용성 평가와 함께, 교통량 추정값으로 VDS의 운영상태를 판단하고 평가하는데 활용할 수 있는지 검토하였다. 이동통신 데이터를 기반으로 계측된 교통량 등의 정보를, VDS 실측 데이터와 함께 회귀모형을 포함한 앙상블 기반 모형에 적용하여 비교·분석한 결과, LightGBM 모형이 교통량 추정의 최적모형으로 선정되었다. LightGBM을 활용하여 국도 1, 3, 6호선의 검지영역 96개소를 대상으로 교통량 추정 성능을 평가한 결과, 전체 검지영역의 경우 MAPE 8.49로 교통량 추정 정확도가 91.51%로 분석되었다. VDS가 설치되지 않은 구간을 대상으로 분석한 결과 MAPE는 1호선 9.0, 3호선 2.8, 6호선 10.4, 평균 MAPE 7.4로, 교통량 추정 정확도는 92.6% 수준으로 분석되어 VDS 설치가 어려운 구간에서도 LightGBM 교통량 추정 모형이 적용 가능하였다. 또한 영상식 VDS 운영상태를 평가할 수 있는지에 대한 검토를 수행한 결과 VDS 운영상태를 평가하는데 LightGBM 교통량 추정 모형의 활용이 가능함을 확인하였다.



제1장 서 론 1
제1절 연구 배경 및 목적 1
제2절 연구의 범위 5
1. 공간적 범위 5
2. 시간적 범위 6
3. 데이터 수집의 범위 6
제3절 연구 내용 및 방법 7
제2장 이론적 배경 9
제1절 관련 기술 9
1. 교통량 추정의 정의 9
2. 기존 교통량 추정 기술 10
3. 교통량 등 교통정보 수집 기술 12
4. 이동통신 기반 빅데이터 분석 기술 13
5. 머신러닝 모형 이론 17
제2절 국내 ․ 외 선행연구 사례 28
1. 차량 검지기 교통량 등 정확도 평가 연구 28
2. 교통량 등 교통변수 추정 및 예측 연구 32
3. 머신러닝 기반 교통 분석 연구 37
제3절 연구의 차별성 및 시사점 39
제3장 모형개발 방법론 및 데이터 전처리 41
제1절 모형 개발 방법론 41
1. 교통량 추정모형 개발 방법론 41
2. 데이터 전처리 및 데이터셋 구성 방법론 43
제2절 데이터 전처리 및 데이터셋 구성 44
1. 데이터 전처리 44
2. 데이터셋 구성 53
제4장 머신러닝 기반 교통량 추정모형 개발 60
제1절 교통량 추정모형 개발 방법론 60
제2절 데이터셋의 분리 62
제3절 머신러닝 최적모형 선정 64
1. 학습 데이터셋을 통한 모형별 최적화 수행 64
2. 최적모형 선정 69
제5장 모형의 평가 73
제1절 평가 방법론 73
제2절 모형의 평가 76
1. 평가 범위 및 대상 76
2. 개발모형의 평가 77
제6장 결론 및 향후 연구과제 104
제1절 결론 104
제2절 향후 연구과제 107
참고문헌 109
