검색 상세

합성 곱 신경망을 이용한 효율적인 의미론적 영상 분할 기법 연구

Efficient Semantic Segmentation using Convolutional Neural Networks

초록/요약

영상을 이용한 물체 검출(Detection) 문제는 영상 내의 물체의 위치를 사각형으로 검출하는 것이 일반적이어서, 물체의 정확한 외곽 정보를 찾지 못하는 문제점이 있다. 물체의 정밀한 외곽정보를 검출하는 것은 자율주행, AR(Augmented Reality) 그리고 VR(Virtual Reality)과 같은 분야에서 요구되기에 관련 연구가 필요하다. 따라서, 본 논문에서는 영상 내의 물체의 정밀한 외곽정보를 검출하는 의미론적 영상 분할(Semantic Segmentation) 연구에 대해 다룬다. 최근 분류(Classification)문제에서 깊은 합성 곱 신경망(Deep Convolution Neural Network)을 이용하여 정확도를 향상한 연구가 활발하게 진행되고 있다. 이는 130만 장의 영상으로 구성되는 ImageNet 데이터 세트와 같은 대량의 데이터와 GPU 등의 연산장치의 발전으로 가능해졌다. 반면에 의미론적 영상분할 문제는 학습에 필요한 많은 데이터를 확보하기가 쉽지 않다. 또한, 입력 영상의 모든 픽셀에 대해서 분류를 진행하여 분류문제 보다 많은 계산량을 가지는 네트워크 구조가 필요하다. 이를 위해, 깊은 합성 곱 신경망을 사용하게 되는데, 이는 많은 계산량과 메모리를 요구할 뿐만 아니라 실행시간, 메모리와 정확도 간에 trade-off 관계를 갖는 것이 일반적이다. 따라서 본 논문에서는 skip-connection 구조를 활용하여 기존 논문과 유사한 수준으로 실행시간과 메모리는 유지시키면서, 정확도가 보다 향상된 모델을 제안한다. 그 결과, 캠비드(CamVid) 데이터 셋의 테스트 영상을 이용한 실험에서 기존 논문과 51ms로 같은 실행시간을 유지하며 정확도는 20.63% 증가하여 62.82% 결과를 얻었다.

more

목차

제 1 장 서론 1
1.1 연구배경 1
1.2 연구내용 2
1.3 논문구성 3
제 2 장 기존 연구 4
제 3 장 제안하는 모델 9
3.1 네트워크 구조 9
제 4 장 실험 결과 16
4.1 실험 데이터와 환경 16
4.1.1 실험데이터 16
4.1.2 실험 환경 16
4.2 평가 방법 18
4.3 캠비드 데이터 세트에 대한 결과 19
4.3.1 정량적, 정성적 분석 19
4.3.2 실행시간과 메모리 분석 25
4.4 시티스케이프 데이터 세트에 대한 결과 25
제 5 장 결론 29
참고문헌 30
Abstract 33

more