검색 상세

합성곱 신경망의 GPU상에서의 효율적인 추론을 위한 Pruning 기법 연구

Research of GPU Pruning Technique for Efficient Inference on Convolutional Neural Networks

초록/요약

최근 심층 합성곱 신경망은 비약적인 성능 발전으로 인해 많은 인공 지능 분야에 적용돼왔다. 하지만 합성곱 신경망의 우수한 성능은 막대한 연산량과 메 모리 소모량의 결과이며, 프루닝 기법은 합성곱 내부에 희소성을 생성하여 한계 점을 극복하고자 한다. 하지만 프루닝 기법을 통해 생성된 합성곱 층의 불규칙한 희소성은 대규모 병렬성을 이용한 GPU상의 연산 과정에서 속도 향상으로 활용되 기 어려우며, 규칙적인 희소성 또한 제거된 가중치 모양이 온전히 속도 향상으로 나타나지 않는다. 본 논문에서는 GPU 상의 연산 분석을 통하여 생성되는 합성곱 층 내부 희소성이 연산 성능 향상으로 이어질 수 있는 2가지 프루닝 기법을 제 안하고, 실제 심층 신경망에 적용하여 기존의 프루닝 기법에 비해 신경망의 정확 도의 열화가 적으며 추론 속도가 향상됨을 보였다.

more

목차

제1장 서론 1
제2장 관련 연구 5
제1절 비구조적 프루닝 기법을 통한 효율적인 추론 연구 5
제2절 구조적 프루닝 기법을 통한 효율적인 추론 연구 7
제3장 배경 지식 10
제1절 순차적 합성곱 연산 11
제2절 GPU 상의 일반 행렬곱 연산 13
제1항 Im2Col (Image to Column) 변환 15
제2항 GPU 상에서의 일반 행렬곱 블록화/타일링 17
제3절 비구조적/구조적 프루닝 기법 24
제1항 프루닝-재훈련 과정 24
제2항 비구조적 프루닝-가중치 프루닝 26
제3항 구조적 프루닝-커널-채널 프루닝 27
제4장 제안하는 GPU 프루닝 기법 29
제1절 블록 프루닝 29
제1항 블록 영역과 블록별 연산 과정 29
제2항 제안하는 블록 프루닝과 메타데이터를 활용한 연산 생략 과정 31
제2절 미세 타일 프루닝 35
제1항 미세 타일의 개념과 미세 타일별 연산 과정 35
제2항 제안하는 미세 타일 프루닝과 메타데이터를 활용한 연산 생략 과정 37
제5장 실 험 43
제1절 실험 환경 43
제2절 프루닝 기법별 정확도 비교 45
제3절 프루닝 기법별 추론 속도 비교 48
제6장 결론 54
참고 문헌 55

more