검색 상세

머신러닝 기반의 웹 공격 탐지를 위한 특성 설계 전략

Feature engineering strategies for web attack detection based on machine learning

초록/요약

새로운 웹 공격이 발견되면 보안 전문가는 이를 분석한 후에 탐지 시그니처를 배포한다. 하지만 이러한 방법은 대응하는 시간 동안 보안에 공백이 생긴다는 단점이 있다. 머신러닝은 이러한 문제를 효율적으로 해결할 수 있게 해준다. 머신러닝을 사용할 때 중요한 성공 요인은 데이터에서 특성을 설계하는 것이다. 도메인 지식을 이용하여, 머신러닝 모델에 입력될 특성이 공격을 탐지하는데 필요한 정보를 포함하도록 해야 한다. 본 논문에서는 실제 오늘날의 대표적인 공격을 분석하여 머신러닝 모델에 입력될 적합한 특성을 설계하는 방법을 제안하고 이를 CSIC 2010 데이터 세트에 실증적으로 적용하였다. 제안하는 방법의 경우 학습용 데이터 세트 외에도 실제 오늘날 발생하는 웹 공격을 고려하여 더 일반화된 모델을 생성할 수 있도록 해준다.

more

초록/요약

When a new web attack is discovered, security experts analyze it and distribute detection signatures. However, this method has the disadvantage that there is a security gap during the corresponding time. Machine learning can solve these problems efficiently. An important success factor when using machine learning is extracting features from data. Domain knowledge should be used to ensure that the features to be entered in the machine learning model include the information needed to detect web attacks. In this paper, we propose a method for designing suitable features to be entered into a machine learning model by analyzing a typical attack of today and empirically applied it to the CSIC 2010 data set. In addition to the training data set, the proposed method helps to generate a more generalized model considering the actual web attacks that occur today.

more

목차

제1장 서론 1
제2장 관련 연구 2
제3장 웹 공격 사례 분석 7
제1절 웹 패킷 분석 7
제1항 HTTP 요청 메시지 7
제2항 웹 서버 로그 분석 10
제2절 웹 공격 유형 분류 12
제1항 SQL Injection 12
제2항 XSS 13
제3항 Directory Traversal 14
제4항 Vulnerability Scan 16
제5항 Remote Code Execution 16
제4장 웹 공격 탐지 방법 18
제1절 단어장을 이용한 정적 데이터 기반의 탐지 방법 19
제2절 머신러닝을 이용한 동적 데이터 기반의 탐지 방법 20
제5장 실험 22
제1절 데이터 세트 22
제2절 탐지 모듈 구현 23
제3절 실험 결과 24
제6장 결론 26
참고문헌 28

more