검색 상세

분류 정확도 및 해석력 개선을 위한 효율적인 규칙 기반 단일 분류기 설계

초록/요약

단일 분류 문제는 동일한 클래스에 속하는 데이터들이 주어졌을 때 새로운 데이터가 해당 클래스에 속하는지를 판별하는 문제이다. 단일 분류는 여러 개의 클래스 정보가 주어진 다중 분류와는 달리 비교할 수 있는 여타 클래스가 존재하지 않기 때문에 다중 분류 알고리즘이 직접적으로 적용될 수 없다. 단일 분류 문제 해결의 필요성이 증대되고 있는 대표적인 현상으로는 단일 클래스에 대한 정보만 수집할 수 있고 다른 클래스에 대해서는 얻을 수 없거나 극히 소량인 경우다. 예를 들어 생산 수율(yield)이 매우 높은 제조 공정에서 얻을 수 있는 데이터는 양품에 대한 것이 대부분이고 불량품에 대한 것은 소수에 지나지 않는다. 이 때 결함의 원인을 파악하기 위해서는 양품과 불량품 데이터 간의 극단적인 비대칭 비율을 올바로 다룰 수 있는 단일 분류가 필요하다. 그러나 기존의 주요 단일 분류 알고리즘들은 사용자가 이해하기 어려운 함수 형태의 분류 모델을 생성하여 그것의 내부적인 매커니즘을 알 수 없다는 블랙박스의 문제점을 갖고 있다. 또한 분류 모델을 해석하기 위한 기존의 룰 기반 단일 분류 방법들은 단일 분류 상황에서 룰을 생성하는 합리적인 기준이 존재하지 않는다는 한계점을 가진다. 본 연구에서는 이러한 문제점들을 개선하기 위해 hyper-rectangle(H-RTGL)을 이용한 두 가지 단일 분류 접근법인 병합기반 H-RTGL 이용 단일 분류기와 군집기반 H-RTGL 이용 단일 분류기를 제안하였다. 병합기반 H-RTGL 이용 단일 분류기는 데이터 집합을 이용해 인터벌을 생성·병합한 뒤 H-RTGL을 생성하고, 군집기반 H-RTGL 이용 단일 분류기는 K-means 알고리즘을 이용해 데이터 집합을 몇 개로 나눈 뒤 각각의 군집에서 H-RTGL을 생성한다. 제안된 단일 분류기들은 블랙박스 문제를 해결하기 위해 룰을 기반으로 구축되었고, 단일 분류 상황에서 효율적인 룰 생성을 위해 기하적인 룰 생성 접근법을 택하였다. 제안된 단일 분류기들을 대상으로 UCI machine learning repository에서 제공되는 데이터 집합에 대한 수치 실험을 수행하여 우수한 분류 정확도와 직관적인 해석력을 검증하였다.

more

목차

제1장 서 론 1
제1절 연구 배경 및 필요성 1
제2절 연구 목적 및 접근법 4
제3절 논문 구성 6

제2장 관련 연구 조사 7

제3장 규칙 기반 단일 분류기 설계 12
제1절 프레임워크 제안 12
제2절 병합기반 H-RTGL을 이용한 단일 분류기 14
제3절 군집기반 H-RTGL을 이용한 단일 분류기 21

제4장 수치 실험 25
제1절 단일 분류기 성능 평가 방법 25
제2절 실험 설계 26
제3절 실험 수행 및 결과 분석 28
제4절 예시를 통한 해석력 검증 32

제5장 결 론 37

참고 문헌 39

영문 요약(Abstract) 43

more