기상데이터를 활용한 4단계 고속도로 통행속도 예측모형 개발
Development of a Four-Stage Highway Traffic Speed Prediction Model Using Weather Data
- 주제(키워드) 휴리스틱 예측모형 , 고속도로 통행속도 예측 , 기상데이터 융합 , 다단계 예측 구조 , 패턴 기반 예측
- 주제(DDC) 629.04
- 발행기관 아주대학교 일반대학원
- 지도교수 이철기
- 발행년도 2026
- 학위수여년월 2026. 2
- 학위명 박사
- 학과 및 전공 일반대학원 교통공학과
- 실제URI http://www.dcollection.net/handler/ajou/000000035788
- 본문언어 한국어
- 저작권 아주대학교 논문은 저작권에 의해 보호받습니다.
초록/요약
본 연구는 고속도로 본선 구간을 대상으로 교통속도 예측 정확도를 향상시 키기 위해, 기상데이터를 정량적으로 활용한 휴리스틱 기반 예측모형 (HWISE, Heuristic Weather-Integrated Speed Estimation)을 개발하고, 그 성능을 기존 예측모형과 비교·검증하는 것을 목적으로 한다. 이를 위해 2018 년부터 2023년까지 수집된 전국 고속도로 본선 50개 구간, 총 651개 링크의 5분 단위 통행속도 자료와 기상청 ASOS 관측·예보자료를 통합하여 분석을 수행하였다. 고속도로 교통속도는 요일·휴일 구조와 기상조건 등 다양한 외생요인의 영 향을 동시에 받는 변동성이 큰 시계열 특성을 지니며, 단순 시간 반복 기반 예측이나 단일 참조 방식만으로는 변동성이 큰 시간대에서 안정적인 예측이 어렵다. 본 연구에서는 이러한 한계를 보완하기 위해, 계절성·요일성·특정일 구조를 정규화하는 보정 절차와 함께 일자 유형, 교통 상황, 기상조건을 단계 적으로 반영한 참조집단 기반 예측 구조를 설계하였다. HWISE는 참조일자 선별, 대표값 산정, 보정계수 적용으로 이어지는 규칙 기반 절차를 통해 예측 의 안정성과 해석 가능성을 함께 확보하도록 구성되었다. 예측 성능 검증을 위해 통계 기반 방식인 Seasonal Historical Average (SHA) 모형과 시계열 학습 기반 LSTM 모형을 비교모형으로 선정하였으며, 모든 모형은 동일한 데이터 환경과 평가 기준 하에서 비교하였다. 성능 평가 는 단기 예측(예측일 기준 1~3일, 24시간)을 중심으로 Accuracy, RMSE, 오 차 분산 지표를 활용하여 수행하였다. 분석 결과, HWISE는 월평균, 평일·주말, 공휴일 및 명절 등 다양한 조건에 서 SHA와 LSTM 대비 가장 높은 정확도와 낮은 오차 변동성을 안정적으로 유지하였다. 특히 오전(07~08시)과 오후(17~18시) 첨두시간대와 같이 교통 변 동성이 크게 증가하는 구간에서도 예측 안정성이 유지되는 특성이 확인되었 다. 반면 SHA는 외생요인이 크게 변동하는 조건에서 오차가 확대되는 경향 을 보였으며, LSTM은 단기 변동성이 큰 구간에서 RMSE와 분산이 증가하 여 예측 안정성이 상대적으로 낮은 것으로 나타났다. 추가적으로 본 연구에서는 동일한 예측 구조를 유지한 상태에서 기상 반영 수준을 달리한 변형 모형(HWISE-S)을 구성하여, 강우 조건에 따른 예측 성 능 변동을 사례 분석을 통해 비교하였다. 분석 결과, 강우가 집중적으로 발생 한 조건에서는 강우 유형에 부합하는 참조일자의 수가 제한되면서 시간대별 예측 성능의 변동성이 확대되는 경향이 나타났다. 이러한 조건에서는 기상 반영을 완화하여 참조일자 수를 확보한 HWISE-S가 상대적으로 안정적인 예측 성능을 나타냈다. 반면 일반적인 교통 운영 조건에 해당하는 저강우 또는 무강우 환경에서는 참조일자의 수와 유사성이 충분히 확보되어, 기본 구조를 유지한 HWISE가 기상 정보를 반영한 예측을 통해 평균 정확도를 소폭 향상시키는 동시에 RMSE와 오차 분산을 낮추는 경향이 확인되었다. 또한 맑은 날과 같이 기상 변동성이 크지 않은 조건에서는 두 모형이 활용하는 참조일자 구성이 유사하 게 형성되어, 전반적인 예측 성능 차이는 크게 나타나지 않았다. 본 연구는 기상·시간·휴일 정보를 구조적으로 통합한 참조 기반 예측체계가 단기 교통속도 예측에서 높은 성능과 안정성을 동시에 확보할 수 있음을 실 증적으로 제시한다. 또한 복잡한 학습 기반 모형에 의존하지 않고도, 데이터 특성과 변동 구조를 반영한 휴리스틱 접근이 실무적 활용성과 설명 가능성 측면에서 효과적인 대안이 될 수 있음을 보여준다. 이러한 결과는 향후 고속 도로 교통예보 체계의 고도화와 기상 연계 교통관리 전략 수립을 위한 기초 자료로 활용될 수 있을 것이다.
more목차
제 1 장 서 론 1
제1절 연구 배경 및 목적 1
제2절 연구의 내용 및 범위 3
제2장 관련 이론 및 연구 고찰 6
제1절 교통예측의 개념 및 이론적 배경 6
제2절 기상요인의 교통영향 및 예측모형 적용 연구 8
1. 기상요인과 교통특성의 상관관계에 관한 연구 8
2. 기상정보 융합 기반 교통예측 연구 10
제3절 교통·기상 데이터의 고도화 및 융합 연구 13
1. 교통·기상 데이터의 통합 및 구조화 연구 13
2. 외부데이터 융합 및 변수선정 방법론 연구 14
제4절 기존 예측모형의 한계와 휴리스틱 연구 16
1. 통계적⋅딥러닝 기반 예측모형의 한계 16
2. 휴리스틱 기반 예측모형 연구 17
제5절 문헌고찰 시사점 19
제 3 장 데이터 기반 구조화 및 설계 원리 21
제1절 데이터 개요 및 원천 구조 21
1. 고속도로 교통데이터의 구조 22
가. 데이터 출처 및 선정 범위 22
나. 자료의 공간·시간 구조 22
다. 분석대상 본선 50개 구간 23
2. 교통데이터 기초 통계 특성 26
3. 기상자료의 구성 30
가. ASOS 관측자료 30
나. 단기예보 자료(예측일 기준 1~3일) 30
다. 기상자료 요약 31
4. 시·공간 정합의 필요성 31
5. 통합 데이터셋 최종 구조 32
제2절 교통데이터 전처리 32
1. 전처리 설계 원칙 및 처리체계 33
2. RawData 적재 및 본선 링크 필터링 34
3. 데이터 이상치 제거 36
가. 이상치 판단 기준 36
나. 요일·시간대 기준 적용 38
다. 공휴일의 별도 처리 38
라. 전처리 단계에서의 역할 39
4. 돌발상황 발생 구간 결측 처리 39
가. 돌발상황정보 API 구성 39
나. 돌발정보와 속도자료의 매칭 절차 40
다. 결측 처리의 필요성 40
라. 전처리 단계에서의 역할 41
5. 링크–시간 전 시점 기준 틀 구성 및 매칭 41
6. 1차 결측 보완 (시간 축 보정) 42
7. 2차 결측 보완 (공간 축 보정) 44
8. 결측치 추가 검증 및 재보완 45
제3절 기상데이터 전처리 및 변수 정제 47
1. 데이터 소스 및 표준화 47
2. 기상정보 상관분석 48
3. 요인분석을 통한 주요 기상요소 도출 49
가. 요인분석 기반 주요 기상요인 축약 49
나. 날씨 수준 분류 및 집단 간 교통속도 차이 검증 52
다. 풍속 수준 분류 및 집단 간 교통속도 차이 검증 54
라. 강우량 수준 분류 및 집단 간 교통속도 차이 검증 57
4. 기상요인 수준 분류의 최종 정리 59
제4절 기상-교통 통합 데이터셋 구축 63
1. 시간 기반 입력데이터 구조화 및 표준 스키마 정립 63
가. 일자·시간 메타정보 표준화 63
나. 시간 정보 세분화 및 스키마 정리 64
다. 통합 데이터 품질 66
2. 링크–기상 시·공간 정합 및 구간단위 통합 67
가. 기상관측자료 통합 및 권역 매칭 67
나. 시간 해상도 조정 및 기상요소 수준화 67
다. 링크단위 병합 및 구간 기반 공간 재구성 68
3. 통합 입력 스키마 정리 69
제5절 대표값 산정 기준 및 중앙값 선정 근거 71
1. 대표값 산정의 필요성 71
2. 대표값 산정 방식의 비교 71
가. 평균값의 한계 71
나. 최대값·최빈값의 활용 어려움 72
다. 중앙값의 장점 73
3. 참조집단 규모 설정의 근거 73
가. 규모가 작을 때의 문제점 73
나. 중간 규모에서의 안정성 74
다. 보수적 안정성을 고려한 10일 설정 74
4. 본 연구에서의 적용 방식 75
제 4 장 HWISE 예측모형 개발 77
제1절 휴리스틱 기반 예측모형의 위치와 개발 방향 77
1. 국가교통센터 통계 예측모형 78
가. 국가교통센터 통계모형의 구조 및 운영 방식 78
나. 통계기반 예측모형의 한계 80
2. 휴리스틱 기반 예측모형의 필요성과 개념 81
가. 휴리스틱 기반 예측 필요성 81
나. 휴리스틱 기반 예측모형의 개념 83
3. 휴리스틱 기반 예측모형의 발전 과정 84
4. 본 연구의 차별성 및 개발 방향 86
가. 기존 연구 대비 본 연구의 차별성 86
나. 본 연구의 예측모형 개발 방향 87
제2절 예측방향 및 알고리즘 개념 구조 88
제3절 보정계수 산출 및 적용 91
1. 보정계수의 정의와 산출 개념 91
2. 데이터 필터링 및 이상치 처리 92
3. 월별 보정계수 산출 93
4. 요일별 보정계수 산출 95
5. 품질관리 및 신뢰도 검증 96
6. 보정계수 적용 및 데이터 정규화 98
제4절 참조집단 선정 99
1. 1차 참조집단 (일자 유형 기반 선별) 99
2. 2차 참조집단 (교통상황 기반 분류) 100
3. 3차 참조집단 (기상조건 기반 분류) 101
4. 최종 참조일자 선정 102
제5절 예측속도 산출 및 갱신 구조 104
1. 예측속도 산출 및 통행시간 환산 104
2. 예측대상 및 산출 범위 106
제 5 장 비교분석 및 결과 107
제1절 비교분석 개요 107
1. 비교모형 선정 108
2. 통계모형(SHA) 109
가. 동일 조건 기반 자료 구성 원리 109
나. 최근성 기반 참조집단 선정 방식 110
다. 중앙값 기반 대표값 산정 방식 110
라. 예측값 도출 구조 110
3. LSTM 모형의 예측 구조 111
가. 입력자료 구성 및 예측지평 정의 111
나. 범주형 자료의 처리 및 표준화 구조 111
다. 시계열 윈도우 구성 방식 112
라. 모형 구조 및 하이퍼파라미터 설정 113
마. 예측값 생성 및 시간대 집계 구조 114
바. 비교모형으로서의 위치 115
4. 분석 구간 및 기간 116
5. 평가 지표 116
가. 속도 기반 예측체계와 평가용 시간 환산 117
나. 평균절대백분오차(MAPE) 및 Accuracy 117
다. 평균제곱근오차(RMSE) 117
라. 오차 분산(Variance) 118
마. 다층적 평가 기준 적용 118
6. 분석 절차 119
제2절 단기 예측 결과 120
1. 분석 방법 120
2. 월평균 분석 121
가. 월평균 정확도 비교 122
나. 월평균 RMSE 비교 122
다. 월평균 분산(Var) 비교 123
라. 종합 해석 124
3. 평일 평균 분석 125
가. 평일 평균 정확도 비교 125
나. 평일 평균 RMSE 비교 126
다. 분산(Var) 비교 126
라. 종합 해석 127
4. 주말 평균 분석 128
가. 주말평균 정확도 비교 128
나. 주말평균 RMSE 비교 129
다. 주말평균 분산(Var) 비교 129
라. 종합 해석 130
5. 공휴일 평균 분석 131
가. 공휴일 평균 정확도 비교 131
나. 공휴일 평균 RMSE 비교 132
다. 공휴일 평균 분산(Var) 비교 133
라. 종합 해석 133
6. 소결 134
제3절 기상 조건에 따른 예측 성능 변동 분석 135
1. 분석 개요 135
2. 고강우일 예측 성능 분석 (2022년 8월 9일) 136
3. 저강우일 예측 성능 분석 (2022년 7월 13일) 139
4. 강우 조건에 따른 예측 성능 비교 141
5. 소결 142
제 6 장 결론 144
1. 연구 요약 144
2. 연구의 주요 결과 145
3. 실무적 시사점 146
4. 학술적 기여 147
5. 연구의 한계 및 향후 연구 148
6. 결론 149
참고 문헌 152
ABSTRACT 156

