검색 상세

오토인코더와 앙상블 기법을 활용한 이상 거래 탐지 방법 연구 : 모바일 결제 데이터를 중심으로

A study on fraud detection method using autoencoder and ensemble method:Focusing on the mobile payment data

초록/요약

최근 코로나 확산으로 인하여 비대면 거래가 급증하고 있다. 코로나19 확산에 따른 외부활동 자제 등으로 스마트 폰 등 모바일 기기나 PC 등을 통한 비대면 결제 이용규모는 일 평균 1조원으로 전년동기대비 23.4% 늘어났다. 대면결제도 전년동기대비 2.8% 증가했다. 전체 결제 중 비대면 결제 비중은 상반기 중 41.2%를 기록했다. 비대면 결제 비중은 지난해 상반기 36.9%, 하반기 38% 등으로 지속적으로 늘고 있다. 접근 기기 별로 보면 실물카드를 이용한 결제 규모는 2.2% 증가한 반면 모바일 기기 등을 이용한 결제 규모는 21.4% 큰 폭 증가했다 [1] 이러한 과정에서 휴대폰 소액결제 한도는 2015년 30만원에서 50만원으로 상향됐으며 지난해에는 60만원으로 늘었다. 이통3사는 코로나19 여파에 따른 비대면 소비 확대 등으로 온라인 결제 수요가 늘면서 한도액을 100만원까지 약 67% 늘어났다[2] 한도가 크게 증가하면서 보이스 피싱, 스미싱, 휴대폰 소액 결제를 통하여 현금화하는 이른바 ‘깡 거래’등의 범죄 피해 건수와 피해 금액도 함께 증가하는 추세다. 이러한 불법 거래로부터 소비자를 보호하기 위해서는 기계 학습 기법을 이용하여 불법 거래의 패턴 또는 사용자 거래 패턴, 이상치 등을 분석하여 피해가 발생하지 않게 사전에 예방하고 고객 이탈을 최소화하기 위한 알고리즘을 탐색하는 것을 목표로 한다. 본 논문에서는 지도학습 기법의 성능을 향상시키기 위해 오토인코더를 활용하여 고차원의 데이터를 저차원으로 압축하였다. 오토인코더[3]와 앙상블 기법을 활용하여 실험을 진행한 결과, 이전에 앙상블 기법만 사용했을 때보다 평균적으로 학습 속도는 22.3초, 정확도는 1.38% 상승하였고, 정밀도는 10.66%, 재현율은 27.22% 상승한 것을 확인하였다. 모바일 결제 환경의 이상 거래 탐지 시스템에서는 정상 거래를 이상 거래로 판단하는 오탐이 이상 거래를 탐지 못하는 것보다 중요한 지표로 판단하기 때문에 정밀도보다 재현율의 상승이 중요하다. 또한, 모바일 결제 환경에서는 신용카드와는 다르게 실시간으로 결제가 진행되기 때문에 속도도 중요한 지표로 사용된다. 추후 다른 기계학습 기법과의 결합 또는 데이터의 양을 증가하여 더 많은 표본으로 추가 연구를 진행할 경우 더 좋은 성능 개선 효과를 가져올 것으로 예상된다. 추가적으로 오탐과 미탐에 대한 신속한 대응이 가능한 이상 탐지 시스템 구축에 대한 연구도 함께 진행해보고자 한다.

more

초록/요약

Due to the recent spread of COVID-19, non-face-to-face transactions are increasing rapidly. Due to refraining from outside activities due to the spread of COVID-19, the average daily use of non-face-to-face payments through mobile devices or PCs such as smartphones increased 23.4% year-on-year to 1 trillion won. Face-to-face payments also increased by 2.8% year on year. The proportion of non-face-to-face payments among all payments reached 41.2% in the first half. The proportion of non-face-to-face payments continues to increase to 36.9% in the first half of last year and 38% in the second half. By accessing devices, the number of payments using real cards increased by 2.2%, while the number of payments using mobile devices increased by 21.4%. [1] In this process, the mobile phone payment limit increased from 300,000 won in 2015 to 500,000 won and increased to 600,000 won last year. As demand for online payments increased by 67 percent to 1 million won due to increased non-face-to-face consumption in the aftermath of COVID-19, the number of crime damages such as voice phishing, smishing, and mobile phone payments is also increasing. To protect consumers from such illegal transactions, the goal is to analyze patterns of illegal transactions, user transaction patterns, and outliers using machine learning techniques to prevent damage and search algorithms to minimize customer departure. In this paper, to improve the performance of the supervised learning technique, high-dimensional data was compressed to low-dimensional using an autoencoder. As a result of experimenting using the autoencoder [3] and ensemble techniques, it was confirmed that the average learning speed increased by 22.3 seconds and accuracy increased by 1.38%, precision increased by 10.66%, and reproduction rate increased by 27.22%. In the abnormal transaction detection system of the mobile payment environment, false detection, which judges normal transactions as abnormal transactions, is more important than detection of abnormal transactions, so an increase in reproduction rate is more important than precision. In addition, in a mobile payment environment, unlike credit cards, speed is also used as an important indicator because payments are made in real-time. In the future, it is expected to have a better performance improvement effect if further research is conducted with more samples by increasing the amount of data or combination with other machine learning techniques. In addition, we would like to research the establishment of an abnormality detection system that can respond to false detection and non-detection.

more

목차

제 1 장 서론 1
제 1 절 연구 배경 1
제 2 절 연구 목표 3
제 2 장 관련 연구 4
제 1 절 이상 탐지 방법론 4
제 3 장 수행한 연구 6
제 1 절 수집된 데이터 셋 6
제 2 절 데이터 전처리 12
제 3 절 앙상블 기법 비교 분석 21
제 4 절 오토인코더 적용 비교 분석 25
제 4 장 실험 및 연구 결과 35
제 5 장 결론 40
참고문헌 42
Abstract 47

more