검색 상세

다양한 데이터 전처리 기법 기반 침입 탐지 시스템의 이상 탐지 정확도 비교 연구

Comparative Study of Anomaly Detection Accuracy of Intrusion Detection Systems based on Various Data Preprocessing Techniques

초록/요약

침입 탐지 시스템(IDS: Intrusion Detection System)은 보안을 침해하는 이상 행위를 탐지하는 기술로서 비정상적인 조작을 탐지하고 시스템 공격을 방지한다. 기존의 침입탐지 시스템은 트래픽 패턴을 통계 기반으로 분석하여 설계하였다. 그러나 급속도로 성장하는 기술에 의해 현대의 시스템은 다양한 트래픽을 생성하기 때문에 기존의 방법은 한계점이 명확해졌다. 이런 한계점을 극복하기 위해 다양한 기계학습 기법을 적용한 침입탐지 방법의 연구가 활발히 진행되고 있다. 본 논문에서는 다양한 네트워크 환경의 트래픽을 시뮬레이션 장비에서 생성한 NGIDS-DS(Next Generation IDS Dataset)를 이용하여 이상(Anomaly) 탐지 정확도를 높일 수 있는 데이터 전처리 기법에 관한 비교 연구를 진행하였다. 데이터 전처리로 패딩(Padding)과 슬라이딩 윈도우(Sliding Window)를 사용하였고, 정상 데이터 비율과 이상 데이터 비율의 불균형 문제를 해결하기 위해 AAE(Adversarial Auto-Encoder)를 적용한 오버샘플링 기법 등을 적용하였다. 또한, 전처리된 시퀀스 데이터의 특징벡터를 추출할 수 있는 Word2Vec 기법 중 Skip-gram을 이용하여 탐지 정확도의 성능 향상을 확인하였다. 비교실험을 위한 모델로는 PCA-SVM과 GRU를 사용하였고, 실험 결과는 슬라이딩 윈도우, Skip-gram, AAE, GRU를 적용하였을 때, 더 좋은 성능을 보였다.

more

목차

1. 서 론 1
2. 관련 연구 2
2.1. 클래스 불균형 데이터, 기계학습 모델 성능 평가 2
2.2. 시퀀스 데이터에 적합한 모델 설계 3
2.3. GAN을 적용한 IDS 설계 3
2.4. 단어 임베딩 기법을 통한 성능 개선 4
2.5. 특징 선택 기법과 딥러닝의 결합 5
2.6. GAN을 이용한 데이터 불균형 문개선 5
3. 연구 방법 6
3.1. 데이터셋 7
3.2. 데이터 전처리 10
3.2.1. 패딩 기법 10
3.2.2. 슬라이딩 윈도우 기법 11
3.2.3. 오버샘플링 13
3.2.4. Skip-gram 15
3.3. 학습 모델 16
3.3.1. PCA-SVM 16
3.3.2. GRU 17
4. 실험 및 실험결과 18
4.1. 실험 환경 18
4.2. 정확도 평가지표 18
4.3. 패딩을 사용한 모델 실험 18
4.4. 슬라이딩 윈도우를 사용한 모델 실험 21
4.5. 실험 결과 분석 23
5. 결 론 25
참고문헌 26

more