검색 상세

프록시기반의 Multi-Agent TD Learning Algorithm을 이용한 적응적 비디오 스트리밍 기법

A Proxy-based Adaptive Video Streaming with Multi-Agent TD Learning Algorithm

초록/요약

최근 HAS(HTTP Adaptive Streaming)는 인터넷기반의 비디오 스트리밍 시장에서 사실상의 비디오 스트리밍 표준으로 빠르게 자리 매김하고 있다. 이는 네트워크 품질이 시시각각 변하는 환경에서도 안정적인 사용자 체감 품질(QoE)를 제공하는 것을 목적으로 한다. 대부분의 HAS 기술은 비디오 품질 조절이 클라이언트를 중심으로 이루어지는 방식(pull-based approach)을 취하고 있다. 하지만 이러한 방식은 다수의 사용자 모바일 단말들이 하나의 AP(Access Point)에 연결되어 병목구간(bottleneck link)을 형성하고 네트워크 대역폭(network bandwidth)을 공유하는 무선 네트워크 환경에서 각각의 HAS 클라이언트로 하여금 정확하지 못한 가용 네트워크 대역폭(available bandwidth) 측정을 야기하고 이로 인해 빈번한 비디오 품질 스위칭이 발생한다. 또한 네트워크 대역폭 측정 주기에 따라서 일부 HAS 클라이언트는 상당한 네트워크 대역폭을 사용하여 우수한 체감 품질을 보장받는 반면, 다른 나머지는 상대적으로 적은 네트워크 대역폭을 사용하게 되므로 낮은 체감 품질을 겪게 되는 unfairness 현상이 문제로 대두되고 있는 실정이다. 본 논문은 무선 환경에서의 비디오 스트리밍 서비스에 대하여 다수의 HAS 클라이언트가 공평한 네트워크 대역폭을 사용하면서 전반적으로 체감 품질을 향상 시킬 수 있는 프록시(proxy) 기반의 적응적 비트전송속도(Bit-rate) 조절 기법을 제안한다.

more

목차

1. INTRODUCTION 1
2. RELATED WORKS 5
2.1. Pull-based MDP(Markov Decision Process) approach 5
2.2. QoE-based Link Adaptation 6
2.3. Proxy-based approach 6
3. PROPOSED SCHEME 8
3.1. System Model 8
3.2. Fairness Problem Statement 11
3.3. Multi-Agent TD Learning Architecture 12
3.3.1. State Definition 13
3.3.2. Action Definition 14
3.3.3. Reward Definition 14
3.3.3.1. Subjective QoE Reward 14
3.3.3.2. Objective QoE Reward 15
3.3.3.3. Fairness QoE Reward 16
3.3.4. Learning Process 16
4. SIMULATIONS 19
4.1. Simulation Setup 19
4.2. Result 20
5. CONCLUSIONS AND FUTURE WORK 24
6. REFERENCE 26

more