검색 상세

의료비 남용탐지를 위한 유전자 알고리즘 기반 스코어링 모델 : 의료사기탐지

Genetic Algorithm based Scoring Model

초록/요약

최근 우리나라의 국민의료비는 급속하게 증가하고 있는데, 이 상승의 원인으로는 의료시술의 발전 및 노인인구의 증가로 인한 자연증가적인 측면도 있겠지만, 의료사기 같은 부정적인 측면이 큰 부분을 차지한다. 이러한 손실을 줄이기 위하여 의료사기 탐지에 관한 많은 연구가 진행되고 있으나 실제적으로는 도메인에 관한 전문성 측면이나 기술적 측면에서 적지 않은 어려움이 있다. 우선 의료관련 데이터는 전문적인 이해를 요하는 정보를 담고 있고 그 데이터의 양 또한 방대하다. 아직까지 국내에서는 도메인에 대한 이해를 갖춘 정보처리 전문 인력의 수가 크게 제한되어 있어 의료사기탐지와 같은 문제를 다루는 데 적합한 시스템을 개발하는 것이 쉽지 않다. 한편 기술적인 측면의 어려움으로, 의료사기는 그 유형이 일정하지 않은 불규칙한 특성을 띠고 있어 이전 데이터에서 생성된 사기 탐지모델이 새로운 데이터에는 맞지 않는다는 점을 들 수 있다. 이러한 이유로, 이전에 개발된 탐지 시스템은 연구에서 끝날 뿐, 실제의 현장에서 적용되는 경우는 매우 드물다. 따라서 소수 전문가의 수작업으로 부당청구 및 허위청구 등을 파악하고 있는 실정이다. 그러나 급증하는 데이터로부터 새로워지는 의료사기 수법을 파악하고 탐지하는 작업을 기존방식에 계속적으로 의존한다는 것은 이미 현실적으로 그 한계에 도달하고 있다. 따라서 본 연구에서는 이상치 스코어를 산출할 수 있는 함수를 제안하고, 항목들의 중요도를 부여하는 방법으로서 메타휴리스틱기법의 하나인 유전자알고리즘(Genetic Algorithm)을 이용하는 방법론을 제안한다. 제안된 방법은 지표에서 이상 정도를 효율적으로 측정하고, 각 지표를 유전자 알고리즘을 이용하여 통합하는 방식으로, 건강보험심사평가원의 2007년 하반기 데이터에서, AUC 0.965의 정확도를 보이며, 비교모델인 회귀분석(Regression), 신경망 알고리즘(Neural Network), 의사결정나무(Decision Tree) 들보다 뛰어난 예측치를 보이고 있다. Ⅱ

more

초록/요약

The increasing burden of healthcare costs in the national economy has been almost every developed and developing country’s problem, and the problem is worsening with aging population and advancing health technology. Medical abuse and fraud has been a target for ongoing efforts to reduce inappropriate use of healthcare funded by third-party payers for decades, where the effort itself incurs cost to the system. Medical abuse and fraud compromise not only healthcare costs but also healthcare quality, and do harm to honest and ethical healthcare providers. The detection requires reviews by medical experts which can be quite time consuming and expensive. The advancement in information technology and digitization of healthcare information such as electronic medical records and electronic bills and claims opened a new venue for efficient and effective mechanisms of medical abuse and fraud detection. Data mining and machine learning based technologies have been widely used for the fraud detection and audit in domains such as auto and life insurance, banking, credit cards, and mortgage, and similar efforts were made in the healthcare domain as well since the late 1990’s. The objective of this study was to formulate a model that detects healthcare providers who show the pattern of abusive and fraudulent behavior in the provision of healthcare. The proposed model is a method that efficiently quantifies the degree of anomaly in the respective indexes and then integrates them based on Genetic Algorithm. When tested on 2007 Korean Health Insurance Review and Assesment data, the proposed method showed promising result of avg. 0.965 AUC significantly outperforming the competing models including regression, neural network, and decision tree, etc. Ⅱ

more

목차

1 서론 1

2 관련연구 3
1 절 기존연구 3
2 절 건강보험심사평가원의 의료사기탐지 시스템 6
3 절 연구방향 7

3 제안방법 9
1 절 스코어(score)함수 설계 9
2 절 입력항목별 가중치 11

4 실험 및 결과 14
1 절 입력항목 가중치 15
2 절 비교실험 Ⅰ(가중치 방법) 19
3 절 비교실험 Ⅱ(탐지 알고리즘) 22
4 절 결과해석 23

5장 결론 27

참고문헌 (Bibliography) 29
영문요약 (Abstract) 32

more