검색 상세

차원축소 및 특성선택에 기반한 효과적 침입탐지 방법 연구

초록/요약

기술이 발전할수록 데이터와 네트워크에 대한 공격위협은 증가하고 있다. 이런 공격에 대응하기 위해 보안 분야에 AI를 적용한 연구들이 많이 진행되고 있다. 본 연구에서는 차원축소와 특성선택을 활용하여 데이터를 전처리하고 기계학습 및 딥러닝 모델에 학습시켜 모델 간 성능을 비교해 효과적인 침입탐지시스템 방법을 제시하고자 하였다. 실제 환경의 침입탐지시스템에서 수집된 NSL-KDD 데이터셋을 사용하여 데이터를 One-Hot Encoding으로 더미화 한 후 Min-Max Scaling을 하였다. 이후 특성선택 방법으로 Filter-based Method, Wrapper-based Method, Embedded-based Method를 사용하고 특성추출 방법으로 PCA를 사용하여 20개의 차원, 10개의 차원으로 축소 시켰다. 기계학습 모델은 Logistic Regression, XGBoost, LightGBM, SVM을 사용하고 딥러닝 모델은 ANN을 사용하여 학습을 진행하였다. 특성선택과 추출을 활용하여 다양한 조합을 구성하였으며, 모든 결과에서 PCA를 적용한 경우가 높은 성능을 나타냈다. 특성 선택은 Filter-based Method 기반의 조합들이 높은 성능을 나타내었다. 차원의 수에 따른 성능을 비교분석하였으며, 20개의 차원을 가진 특성들이 10개의 차원을 가진 특성들보다 평균적으로 높은 값을 나타냈다. 하지만 PCA를 단독으로 사용하여 10개의 차원으로 축소한 경우는 모든 모델과 성능에서 가장 높은 값을 나타내는 것을 확인했다. 모델 간의 성능을 비교하였을 때 기계학습 모델에서는 XGBoost가 가장 좋은 성능을 나타냈다. 모든 모델에서 Logistic Regression이 가장 낮은 성능을 나타냈다. 따라서 PCA를 사용하여 10개의 차원으로 축소한 후 XGBoost 모델을 활용하는 것이 효과적으로 침입탐지를 할 수 있다는 것을 확인했다.

more

목차

제 1 장 서론 1
제1절 연구배경 1
제2절 연구목적 2
제 2 장 관련 연구 4
제1절 침입탐지시스템 4
1. NIDS 4
2. HIDS 4
3. 비정상 행위 탐지 4
4. 오용기반탐지 5
제2절 특성 공학 5
1. 특성 선택 5
2. 특성 추출 7
제 3 장 연구방법 8
제1절 NSL-KDD 데이터셋 8
1. DoS 9
2. Probing Attack 9
3. R2L 9
4. U2R 10
제2절 데이터 전처리 10
1. One-Hot Encoding 10
2. Min-Max Scaling 10
제3절 특성 선택 및 추출방법 10
1. Filter Method 11
2. Wrapper Method 12
3. Embedded Method 13
4. PCA 14
5. 특성조합 14
제4절 모델 알고리즘 19
1. Logistic Regression 19
2. XGBoost 19
3. LightGBM 19
4. SVM 20
5. ANN 20
제5절 성능평가지표 20
1. 정확도 21
2. 정밀도 21
3. 재현율 21
4. F1-Score 21
5. AUROC Score 22
제 4 장 실험결과 및 분석 23
제1절 실험환경 23
제2절 실험결과 23
1. Logistic Regression 23
2. XGBoost 28
3. LightGBM 33
4. SVM 38
5. ANN 43
6. 전체평가 48
제 5 장 결론 58
참고문헌 60

more