검색 상세

저작권 침해 의심 데이터 분석을 통한 저작권 침해사이트 탐지 기법

초록/요약

최근 한국 문화의 세계화로 인해 저작권 콘텐츠가 해외 시장으로 수출이 확대됨에 따라, 한국 디지털 콘텐츠 시장의 부가가치가 매우 커지고 있다. 저작권 시장 규모가 증가함에 따라 저작권자의 허락 없이 저작물을 불법으로 유통하여 수익을 창출하는 저작권 침해사이트가 등장하였으며, 이로 인해 저작권자의 직접적인 피해뿐만 아니라 간접적인 피해 또한 발생하고 있다. 공공기관에서는 이를 해결하기 위해 저작권 침해사이트를 탐지하고 이를 차단하는 조치를 하고 있지만, 저작권 침해사이트는 도메인을 변경하거나 탐지에 대응하기 위해 지능적으로 대처하고 있다. 또한, 저작권 침해사이트의 변경 주기가 공공기관의 탐지 및 차단 주기보다 빠르기 때문에 기존의 탐지 기법은 실효성이 부족하다. 따라서 본 논문에서는 저작권 침해사이트로 인한 피해를 방지하기 위해, 검색엔진으로부터 침해 의심 데이터셋을 크롤링하고, 이를 자동화된 침해 여부 판단 알고리즘을 통해 침해 여부를 판단하는 저작권 침해사이트 탐지 기법을 제안한다.

more

초록/요약

As copyright content exports to overseas markets have expanded due to the recent globalization of Korean culture, the added value of the Korean digital content market is increasing very much. As the size of the copyright market increases, piracy sites that illegally distribute works without the permission of the copyright holder to generate profits have emerged, resulting in not only direct damage to the copyright holder but also indirect damage. Public institutions are taking measures to detect and block piracy sites to solve this problem, but piracy sites are intelligently responding to changing domains or responding to detection. In addition, since the change cycle of piracy site’s domain is faster than the detection and blocking cycle of public institutions, the existing detection techniques are not effective. Therefore, in this paper, we propose a piracy site detection technique that crawls suspected infringement dataset from search engines and determines infringement through an automated infringement judgment algorithm.

more

목차

제 1 장 서론 1
제 1 절 연구의 배경 및 목적 1
제 2 절 연구 범위 및 구성 2

제 2 장 관련연구 4
제 1 절 기존 침해사이트 탐지 기법 4
1. S. K. Choi 등의 연구 4
2. E. J. Kim 등의 연구 6
제 2 절 저작권 침해사이트의 특징 분석 8
1. 토렌트 사이트 특징 분석 8
2. 영상스트리밍 사이트 특징 분석 9
3. 웹툰 사이트 특징 분석 10
4. 침해사이트 내 광고배너 분석 12
제 3 절 제안 기법을 위한 관련 기술 13
1. OCR(Optical Character Recognition) 13
2. F1 Score와 Confusion Matrix 14

제 3 장 침해사이트 탐지를 위한 침해 의심 데이터셋 16
제 1 절 Contents List 데이터셋 16
제 2 절 성능측정 데이터셋 17


제 4 장 제안 기법 18
제 1 절 검색엔진과 Contents List 데이터셋을 이용한 크롤링 19
제 2 절 침해 키워드 비교 분석 21
제 3 절 광고배너 키워드 비교 분석 23

제 5 장 성능측정 결과 25
제 1 절 토렌트 사이트에 대한 성능측정 결과 25
제 2 절 영상스트리밍 사이트에 대한 성능측정 결과 27
제 3 절 웹툰 사이트에 대한 성능측정 결과 29
제 4 절 기존 침해사이트 탐지 기법과 비교 분석 31

제 6 장 결론 36

참고문헌 37

ABSTRACT 39

more