거대 언어 모델 기반 교통사고 서술문 분석을 통한 차대보행자 자율주행차 안전성 평가용 상황 시나리오 생성 연구
Large Language Model-Based Semantic Analysis of Traffic Accident Narratives for Generating Functional Automated Vehicle–Pedestrian Safety Evaluation Scenarios
- 주제(키워드) LLM , 자율주행 , 평가 시나리오 , 교통사고
- 발행기관 아주대학교 일반대학원
- 지도교수 윤일수
- 발행년도 2026
- 학위수여년월 2026. 2
- 학위명 석사
- 학과 및 전공 일반대학원 D.N.A.플러스융합학과
- 실제URI http://www.dcollection.net/handler/ajou/000000035735
- 본문언어 한국어
- 저작권 아주대학교 논문은 저작권에 의해 보호받습니다.
초록/요약
본 연구는 경찰청 교통사고 기록 652,195건 중 차대보행자 137,432건의 교통사고 서술문 데이터를 활용하여 차량과 보행자의 거동 정보를 정교하게 추출하고, 이를 기반으로 자율주행차 안전성 평가용 상황 시나리오를 생성하는 방 법론을 제시한다. 먼저 전처리 과정에서 1,774건의 대표적 서술문을 선별하여 거대 언어 모델(large language model, LLM)을 학습 데이터로 구축하였으며, fine-tuning을 통해 차량 거동, 보행자 거동, 보행자 위치를 예측하는 과정에서 91.6%의 정확도를 확보하였다. 이후 학습된 모델을 전체 차대보행자 교통사고 데이터에 확장 적용함으로써 기존 term frequency-inverse document frequen cy(TF–IDF) 기반 분석이 반영하지 못하던 문맥적 의미와 상호작용 패턴을 체계적으로 해석할 수 있었다. 도출된 의미 기반 거동 정보를 활용하여 보행자 위치, 차량의 진행 상태, 도로 구간 특성을 기준으로 총 57개의 자율주행차 안전성 평가용 상황 시나리오 를 구축하였다. 또한 equivalent property damage only(EPDO)를 적용하여 각 상황 시나리오의 교통사고 심각도를 정량적으로 평가하고 우선순위를 도출함으 로써 상황 시나리오 기반의 위험도 구조를 마련하였다. 본 연구는 비정형 교통사고 서술문을 LLM 기반 의미 추론으로 구조화하고, PEGASUS 프레임워크에 부합하는 상황 시나리오로 생성할 수 있음을 실증했다는 점에서 의의를 갖는다. 연구 결과는 자율주행차 기능 검증, 시험 시나리오 설계, 보행자 중심 교통안전 정책 수립과 같은 다양한 분야에서 활용 가능한 기초 자료를 제공한다.
more목차
제1장 서론 1
제1절 연구의 배경 및 목적 1
제2절 연구의 범위 및 수행 절차 4
제2장 관련 이론 및 연구 고찰 6
제1절 자율주행 안전성 평가 및 텍스트 분석 관련 이론 6
1. PEGASUS 프로젝트 6
2. TF-IDF 기반 텍스트 분석 10
3. LLM 기반 의미 추론 12
제2절 선행연구 고찰 15
1. 자율주행차 교통사고 시나리오 연구 15
2. LLM을 활용한 데이터 분석 연구 17
제3절 기존 연구와의 차별성 19
제3장 교통사고 데이터 분석 방법론 21
제1절 데이터 수집 21
제2절 데이터 전처리 24
1. 교통사고 서술문 구조 24
2. 교통사고 서술문 전처리 25
제3절 LLM 기반 거동 정보 분석 28
1. Fine-tuning 및 prompt engineering 과정 29
2. 예측 결과 처리 및 비교 분석 33
제4장 자율주행차 안전성 평가용 상황 시나리오 생성 35
제1절 상황 시나리오 데이터 구축 35
제2절 상황 시나리오 구성 요소 정의 39
제3절 EPDO를 활용한 상황 시나리오 적용 41
제4절 상황 시나리오 정책적 및 기술적 활용 방안 44
제5장 결론 및 향후 연구과제 46
제1절 결론 46
제2절 향후 연구과제 47
참고문헌 49
Abstract 52

