검색 상세

정형 및 비정형 교통사고데이터를 활용한 인공지능 기반 교통사고 심각도 예측 모형 개발

Development of an artificial intelligence-based traffic accident severity prediction model using structured and unstructured traffic accident data

초록/요약

본 연구는 교통사고 심각도 예측 모형 개발 시 교통사고 정형데이터와 비정형데이터를 모두 고려해야 한다는 점을 제언한다. 교통사고 정형데이터는 주로 사고 발생 이전 상황을 다루며, 비정형데이터는 주로 사고 발생 과정의 위험요인을 다룬다. 따라서, 사고 상황에 대한 복합적인 원인을 다각적으로 분석하기 위해서는 두 데이터를 모두 고려한 사고 심각도 예측 연구를 수행해야 한다는 점을 강조한다. 또한, 기존의 통계적 방법에서 벗어나 머신러닝 및 딥러닝 등 인공지능 기반 예측 모형을 구축함으로써 예측력 향상 및 영향요인과 관련된 잠재적 사고 심각도 파악 등을 목표로 한다. 연구를 수행하기 위해 정형 및 비정형데이터를 통합한 통합데이터셋을 구축 하고 종속변수인 사고 심각도를 예측(분류)하기 위한 인공지능 모델로써 다항 로지스틱 회귀모형, XGBoost, BERT를 선정하였다. 각 모델에 대해 정형, 비정형, 통합데이터셋에 대한 모델링을 각각 수행하고, 평가지표 F1-Score를 사용하여 모델 성능을 평가하였다. 데이터 구분(정형, 비정형, 정형 및 비정형 통합 데이터)에 따른 전체 모델의 예측 성능 평가 결과에서 정형 및 비정형 통합데이터를 활용한 모델의 성능이 가장 우수했다. 또한, 통합데이터를 활용한 세 개 모델 간 예측 성능을 비교한 결과 BERT 모델이 F1-Score 0.80로 비교 모델 에 비해 가장 우수한 성능을 보였다. 이에 따라, 정형 및 비정형 통합데이터를 활용한 BERT 모델의 예측 결과에 기반한 기여도 분석에 따라 교통사고 심각도 등급별 주요 원인을 추출한 결과, 정형데이터 관련 사고 발생 이전 요인과 비정형데이터 관련 사고 발생 과정에 대한 위험요인이 모두 도출되었다. 즉, 정형 및 비정형데이터를 모두 고려한 BERT 모델을 사용하여 교통사고 심각도를 예측하는 것이 모델 성능과 사고원인 분석 측면에서 모두 우수하다는 결론을 도출하였다. 연구 결과를 토대로 사고자료 관리의 질적 향상을 통해 교통 안전도 향상에 기여할 수 있을 것으로 기대된다. 향후 연구에서는 활용데이터의 시간적 및 공간적 범위를 확대하고, 변수 최적화를 위한 시행착오(trial-and-error)의 범위를 확대하여 빅데이터 기반 최적의 예측 모형으로 고도화해야할 것으로 사료된다.

more

목차

제1장 서론 1
제1절 연구의 배경 및 목적 1
1. 연구의 배경 1
2. 연구의 목적 3
제2절 연구의 방법 및 절차 4
제2장 관련 연구 고찰 6
제1절 이론적 고찰 6
1. 다항 로지스틱 회귀 모형 6
2. XGBoost 7
3. BERT 8
제2절 선행 연구 고찰 9
제3절 시사점 및 연구의 차별성 15
제3장 자료 수집 및 분석 16
제1절 자료 수집 및 구축 16
1. 교통사고자료 수집 16
2. 교통사고자료 전처리 16
제2절 기초통계분석 21
제4장 모델 구축 및 평가 23
제1절 모델 선정 23
제2절 모델 구축 24
1. 개요 24
2. 다항 로지스틱 회귀 모형 24
3. XGBoost 25
4. BERT 26
제3절 모델 성능 평가 30
1. 평가 지표 선정 30
2. 모델 예측 결과 31
제4절 결과 해석 및 시사점 도출 37
제5장 결론 및 향후 연구 43
제1절 연구의 결론 43
제2절 연구의 한계점 및 향후 과제 45

more