검색 상세

토픽 모델링을 이용한 자동차 소비자 불만 프로파일링

Automotive Consumer Complaint Profiling Based On Topic Modeling

초록/요약

As part of improving traffic safety, vehicle defect investigations have always been an important issue domestically and internationally, and recently, it has become more important to discover defects early and then keep consumer safety and prevent damage through prompt corrective action. Consumer complaint reporting is one of the most important infromation collected to discover vehicle defects, and has the advantage of being able to quickly obtain vehicle problems, but in the conventional method, it takes a lot of time and effort to classify numerous reports according to similarity and identify defect issues. This study proposes a method to explore topics from the consumer's porint of view by profiling consumer complaints based on topic modeling. After refining the text, which is unstructured data, using Kkma, a Korean morpheme analyzer, we try to extract keywords and find potential meanings in the document with a probabilistic access-based LDA(Latent Dirichlet Allocation) model. The experiment was conducted by dividing the reports according to total, manufacturers and fuel, and presented consumer complaint topics using topic modeling. This is expected to be helpful in finding vehicle defect issues by intuitively catching trends in vehicle problems experienced by consumers.

more

초록/요약

교통안전 향상의 일환으로 자동차 제작결함조사는 국내·외 늘 중요한 이슈로 자리하고 있으며, 최근에는 결함을 조기에 발굴하여 신속한 시정조치를 통한 소비자의 안전 및 피해를 예방하는 것이 더욱 중요해졌다. 소비자 불만 신고는 자동차 결함을 발굴하기 위해 수집하는 중요한 정보 중 하나로서 차량 문제를 신속히 입수할 수 있다는 장점이 있지만, 기존의 방식으로는 수많은 신고 건을 유사성에 따라 분류하여 결함 이슈를 파악하기에 많은 시간과 노력이 든다. 본 연구는 토픽 모델링을 기반으로 소비자 불만을 프로파일링하여 소비자의 관점 중심에서 토픽을 탐색하는 방법을 제안한다. 비정형 데이터인 텍스트를 한글 형태소 분석기인 Kkma를 이용하여 데이터 정제 후 확률적 접근 기반 LDA(Latent Dirichlet Allocation) 모형으로 문서 내 주요 키워드 추출 및 잠재적 의미를 찾아내고자 한다. 실험은 전체 신고 건, 제작자 및 연료에 따라 신고 건을 나누어 실시하였으며, 토픽 모델링을 이용한 소비자 불만 토픽을 제시한다. 이로써 소비자가 겪는 차량 문제 관련 현상 트렌드를 직관적으로 알 수 있어 자동차 결함 이슈를 찾는데 도움이 될 것으로 기대한다.

more

목차

1. 서론 1
1.1 연구 배경 1
1.2 연구 목적 4
1.3 논문의 구성 7
2. 기존 연구 8
2.1 기존 연구 8
2.2 토픽 모델 10
3. 제안 방법론 12
3.1 데이터 소개 12
3.2 LDA(Latent Dirichlet Allocation) 모형 19
3.3 제안방법 22
4. 실험 24
4.1 데이터 전처리 결과 24
4.2 토픽 추론 결과 27
4.3 실험 결과 정리 40
5. 결론 42
참고문헌 44

more