딥러닝 모델의 학습 데이터 영향력 분석을 위한 레이어 출력 유사도 분석
Layer Output Similarity Analysis for Train Data Impact of Deep Learning Model
- 주제(키워드) 딥러닝 , 모델 테스팅 , 설명 가능한 AI , 활성화 뉴런 , 특징 유사도
- 주제(DDC) 004.6
- 발행기관 아주대학교 일반대학원
- 지도교수 이정원
- 발행년도 2024
- 학위수여년월 2024. 2
- 학위명 석사
- 학과 및 전공 일반대학원 AI융합네트워크학과
- 실제URI http://www.dcollection.net/handler/ajou/000000033475
- 본문언어 한국어
- 저작권 아주대학교 논문은 저작권에 의해 보호받습니다.
초록/요약
딥러닝 기술이 발전하고 정확도가 증가하면서 광범위한 분야에서 딥러닝 기술이 활용되고 있다. 이에 따라 딥러닝 모델을 테스트하기 위한 방법이 연구되고 있으며 크게 블랙박스 테스트 기법과 화이트박스 테스트 기법으로 나눌 수 있다. 블랙박스 기법은 모델 내부 동작은 고려하지 않고 평가 데이 터를 기반으로 테스트를 진행하며, 화이트박스 기법은 모델 내부 동작을 고 려하며 대리 모델을 사용하거나 모델 내부 뉴런 출력을 직접적으로 분석하 는 뉴런 커버리지 기법 등을 사용한다. 하지만 블랙박스 테스트는 테스트 데이터에 대한 신뢰성을 확보해야 하는 문제가 존재하며, 화이트박스 테스 트는 계산 비용 문제, 히트맵 기반 이미지 데이터 평가의 정량화 문제, 뉴런 커버리지의 신뢰성 검증의 어려움 등의 문제점이 존재한다. 따라서 본 논문 에서는 모델 레이어의 출력값을 활성화 뉴런 개념을 이용하여 활성화 맵으 로 만들고, 데이터셋을 분할하여 레이어 출력 패턴의 유사도를 계산하여 정 량화하는 자카드 유사도 기반의 유사도 점수를 제시한다. 또한, 제안하는 지 표를 모델의 레이어 출력에 적용하여 데이터에 대한 레이어 별 학습 수준을 평가할 수 있는 기법을 제안한다. 제안하는 기법은 레이어 프리징을 적용한 학습 모델의 정확도와 학습 데이터의 레이어 출력 유사도 차이를 비교하여 효용성을 검증하였다. 실험 결과, 유사도 점수의 차이가 급격히 증가하는 구 간에서 모델 학습의 정확도가 증가하며, 최소 11.71%, 최대 73.62%까지 차이가 발생함을 확인할 수 있다. 또한 정의한 포화 점수를 이용하였을 때 데이터를 충분히 학습하기 시작한 레이어를 도출하였으며 프리징한 학습 결 과 역시 실제 모델 성능에 근접함을 확인하였다. 이를 통해 레이어의 출력 패턴과 입력 데이터의 특성 간 연관성을 확인하였으며, 출력 패턴의 유사도 를 기반으로 레이어의 데이터 학습 능력을 분석하여 모델 내부 동작을 고려 한 테스팅 기법의 효용성을 검증하였다. 주제어 : 딥러닝, 모델 테스팅, 설명 가능한 AI, 활성화 뉴런, 특징 유사도
more초록/요약
As deep learning technology develops and accuracy increases, deep learning technology is being used in a wide range of fields. Accordingly, methods for testing deep learning models are being investigated and divided into black box test technique and white box test technique. The black box technique does not consider the internal behavior of the deep learning model and tests deep learning model based on evaluation data, and the white box technique considers the internal behavior of the model and uses a surrogate model or a neuron coverage technique that directly analyzes the neuron output inside the model. However, the black box test has a problem of securing the reliability of the test data, and the white box test has problems such as calculation cost, quantification of heat map-based image data evaluation, and difficulty in verifying the reliability of neuron coverage. Therefore, in this paper, we present a similarity score based on jaccard similarity, which makes the output value of the model layer an activation map using the concept of an activation neuron, and calculates and quantifies the similarity of the layer output pattern by dividing the dataset. In addition, we propose a technique that can evaluate the level of layer by layer learning on the data by applying the proposed indicators to the layer output of the model. The proposed technique was verified for its effectiveness by comparing the difference between the accuracy of the learning model applied with layer freeing and the similarity of the layer output of the learning data. As a result of the experiment, it can be confirmed that the accuracy of model learning increases in the section where the difference in the similarity score increases rapidly, and the difference occurs up to at least 11.71% and up to 73.62%. IIn addition, when the defined saturation score was used, a layer that began to fully learn the data was derived, and it was confirmed that the freezing model learning results were also close to the actual model performance. Through this, the relationship between the output pattern of the layer and the characteristics of the input data was confirmed, and the effectiveness of the testing technique considering the internal behavior of the model was verified by analyzing the data learning ability of the layer based on the similarity of the output pattern.
more목차
1. 서론 1
2. 관련 연구 5
2.1. 블랙박스 테스팅 기법 5
2.2. 화이트 박스 테스팅 기법 7
2.3. 뉴런 커버리지 기반 테스팅 기법 9
3. 레이어 출력 유사도 기반 학습 영향력 분석 기법 12
3.1. CNN 모델의 활성화 맵 추출 13
3.2. 대표 레이어 출력 패턴 정의 16
3.3. 히트맵 유사도 분석 16
3.4. 모델 레이어 별 학습 데이터 영향력 분석 18
4. 실험 및 평가 20
4.1. 데이터셋 구축 20
4.2. 학습 영향력 관찰 프로세스 21
4.3. 사전 학습 모델 구축 21
4.4. 활성화 맵을 이용한 자카드 점수 계산 24
4.5. 학습 데이터의 모델 영향력 분석 결과 검증 30
5. 결론 35
<참고문헌> 37