검색 상세

데이터 마이닝 앙상블 모델을 이용한 교통사고 분석

Analysis of Traffic Accidents using Data Mining Ensemble Model

초록/요약

데이터 마이닝은 대용량의 데이터 속에서 의미 있는 패턴이나 규칙을 찾아내어 유용한 지식으로 활용하기 위하여 데이터를 탐색하고 분석하는 과정이다. 본 연구에서는 데이터 마이닝 기법들을 활용하여 교통사고 피해자의 상해 심각도 수준을 예측하는 모델을 구축 하였다. 상해 심각도는 ‘상해 없음’, ‘상해 가능’, ‘불구 없음’, ‘불구 있음’, ‘치명적 상해’, ‘알 수 없음’ 등의 6 단계의 수준으로 구분되는데, ‘상해 없음’은 전체 데이터의 70% 정도를 차지하지만, ‘치명적 상해’는 전체 데이터의 1% 정도밖에 차지하지 않는 등 상해 심각도가 심한 불균형 분포를 보이고 있다. 이러한 불균형 데이터에 대해서 데이터 마이닝 기술을 단순하게 한 번 적용하여 모델을 구축하고 예측을 수행하는 것은 모델의 적중률 면에서 신뢰성을 확보할 수가 없다. 그러므로 본 연구에서는 상해 심각도의 수준에 따라 데이터 마이닝 기법을 맞춤식으로 적용하여 상해 심각도 수준을 예측하는 앙상블 모델을 구축 하였다. 본 연구에서 구축한 앙상블 모델을 미국 NASS의 GES 2008년 교통사고 데이터에 적용하여 성능을 평가하였는데, 불균형 데이터임에도 불구하고 각 상해 심각도 수준별로 적중률이 비교적 균형을 이루는 결과를 보였다.

more

목차

<목 차>

제 1 장 서 론
제 1 절 연구의 배경 ..................................................... 1
제 2 절 연구의 목적 및 방법 .......................................... 2
제 3 절 논문의 구성 ..................................................... 3

제 2 장 이론적 배경
제 1 절 기존 문헌 연구 ................................................. 4
제 2 절 의사결정나무 ................................................ 14
제 3 절 인공신경망 .................................................... 17
제 4 절 불균형 데이터 (Imbalanced Data) ..................... 23
제 5 절 ROC 곡선 ...................................................... 24

제 3 장 예측 모델 구축
제 1 절 사용 데이터 및 속성 선정 ................................. 27
제 2 절 모델 데이터 집합의 구성 .................................. 29
제 3 절 기본 모델 ...................................................... 30
제 4 절 앙상블 모델 ................................................... 31
제 5 절 Threshold를 조정한 앙상블 모델 ....................... 37
제 6 절 Undersampling을 적용한 앙상블 모델 ................ 41

제 4 장 모델 성능평가
제 1 절 Evaluation Data Set 적용 ................................. 50
제 2 절 성능 해석 ...................................................... 51

제 5 장 결론 및 향후 연구 과제
제 1 절 연구 결과 및 의의 ........................................... 54
제 2 절 연구의 한계점과 향후 연구 방향 ........................ 55

[참고문헌] ................................................................. 57

more