검색 상세

선별된 특성 정보를 이용한 안드로이드 악성 앱 탐지 연구

초록/요약

글로벌 스마트폰 시장의 꾸준한 성장을 전망하고 있는 가운데 앱 시장도 성장이 가속화되고 있다. 우리나라 국민의 1명당 평균 1대 이상의 스마트 기기를 사용하고 있고 스마트폰 성능의 발전과 스마트폰 활용의 대중화로 일상생활은 디지털화, 서비스 무인화되면서 이전과 비교해 혁신적으로 변화되었다. 반면, 이러한 성장 속에 수많은 앱이 널리 사용됨에 따라 스마트 폰의 사용자를 노리는 악의적 기능을 포함한 악성 앱이 증가하고 있다. 2020년 4분기 모바일 악성 앱 탐지 건수는 4천만여 건이고 이 중 3백만여 건이 새로운 악성 앱이었다. 전 세계 모바일 운영체제의 대부분을 안드로이드(Android)가 차지하고 있으며 안드로이드의 개방성으로 인해 모바일 분야 사이버 위협의 많은 부분이 안드로이드 운영체계를 대상으로 하고 있다. 악성 앱의 대응책으로 주로 패턴 기반으로 탐지 및 차단하고 있으나 새로운 악성 앱에 대한 신속한 대응이 불가능하다. 빠르게 변화하는 악성 앱에 대응하기 위해 기계학습을 활용한 악성 앱의 탐지가 요구되고 있으며 본 논문은 악성 앱의 탐지 성능 향상에 유용한 특성 선별 방법을 제안하고 검증하였다.

more

초록/요약

While the global smartphone market is expected to grow steadily, the app market is also accelerating its growth. People use more than one smart device per person on average in Korea. With digitalized and unmanned services, daily life has innovatively changed comparing to the past due to the development of smartphone performance and the populariztion of using smartphone. On the other hand, as numerous apps are widely used amid this growth, malicious apps including malicious functions aimed at users of smartphones are increasing. In the fourth quarter of 2020, the number of mobile malicious apps detected was about 40 million, of which 3 million were new malicious apps. Because Android occupies most of the world's mobile operating systems, and due to Android's openness, much of the cyber threats in the mobile sector target Android operating systems. The malicious apps are mainly detected and blocked based on patterns, but this method cannot quickly respond to new malicious apps. In order to respond to rapidly changing malicious apps, it is required to detect malicious apps using machine learning, and this thesis proposes and verifies a feature selection method useful for improving detection performance of malicious apps.

more

목차

제1장 서론 1
제1절 연구 배경 1
제2절 연구 목적 2
제2장 관련 연구 3
제1절 안드로이드 앱의 구조 및 분석 방법 3
1. 권한(Permission) 4
2. API(Application Programming Interface) 6
제2절 특성 공학 6
1. 특성 선택 6
2. 특성 추출 9
제3절 기계학습 알고리즘 9
1. Linear Regression 9
2. Random Forest 10
3. SVM(Support Vector Machine) 10
4. KNN 11
5. MLP(Multi-Layer Perceptron) 11
제4절 모델 성능 평가 방법 12
제3장 연구 방법론 14
제1절 데이터세트 구성 및 전처리 14
제2절 제안하는 특성정보의 선별 15
제4장 실험 과정 27
제1절 실험 환경 27
제2절 모델 구성 27
제3절 악성 앱 탐지 성능 비교 29
1. Confusion Matrix 비교 29
2. 모델 학습 시간 비교 38
3. ROC, ROC AUC 비교 40
제5장 결론 및 향후 과제 42
제1절 연구 결론 42
제2절 향후 과제 43
참고 문헌 44

more