• Aucun résultat trouvé

Adaptation de la tranmsission d’une vidéo scalable sur un

un réseau sans fil

On s’intéresse essentiellement à l’optimisation de la qualité vidéo reçue lors d’une transmission vidéo en unicast. Pour maximiser la qualité vidéo, plusieurs éléments du réseau peuvent être contrôlés, y compris, la stratégie d’ordonnancement, les tampons dans chaine de transmission, le taux de perte, etc. Nous proposons un système de contrôle au coeur du réseau qui effectue un filtrage entre les différentes couches d’un flux scalable codé et stocké dans des tampons de post-encodage. Ce système effectue un filtrage des couches avec prise en compte de l’ordre de priorité entre les couches. Ce contrôle a pour but de maximiser la qualité de la vidéo à la réception.

4.2.1 Description du problème

Tampons de post-encodage Contenue

Vidéo Encodeurscalable

Serveur Couche base Couche raff.1 Couche raff. L-1 Process de filtrage de couches Proxy Canal variable Tampons du recepteur Décodeur vidéo Récepteur Station de base

Etat des tampons et du canal

Coeur du réseau Réseau sans fil

Figure 6: Schéma de transmission vidéo bout-en-bout.

Dans un système de transmission vidéo vers un récepteur mobile, on identifie plusieurs éléments tel que la source vidéo, le codeur de source, les tampons répartis sur plusieurs endroits du réseau, un canal sans fil, et le récepteur, voir figure 6. Selon la localisation du système de contrôle de transmission vidéo, certains de ces éléments peuvent être contrôlables et d’autres pas. Dans notre cas, le système de

contrôle est placé dans un proxy dans le coeur du réseau. Il est en charge de filtrer les couches scalables stockées dans des tampons dans le proxy. Ce filtrage exploite la propriété de séparabilité des couches scalables pour adapter le flux codé sans avoir à ré-encoder la séquence. Ce filtrage se fait en se basant sur des critère de qualité d’expérience qui ciblent une qualité vidéo maximale à la réception. Ces critères sont le PSNR et une marge minimale dans le tampon du récepteur qui évite le gel de la vidéo au décodage lors de dégradation des conditions du canal.

Le processus de filtrage proposé doit être conçu pour que les conditions suivantes soient satisfaites:

1. La qualité vidéo décodée doit être maximisée,

2. Le débit canal disponible doit être utilisé efficacement,

3. Les niveaux des tampons de post-encodage doivent être ajustés afin d’éviter tout débordement,

4. Les tampons au niveau du récepteur doivent être contrôlés afin de maintenir un niveau de remplissage minimal afin d’être robuste à l’égard des variations du canal.

Le problème d’optimisation est formulé dans le cadre du processus de décision Markovien. Toutes les contraintes citées doivent être traduites dans la fonction récompense. Pour cela nous avons définit les états systèmes composé de l’état ht de la station de base et le canal, les états se

, ℓ = 1, . . . , L des tampons de post-encodage des L couches SVC placés dans le proxy, et les états sr

des tampons du récepteur. A chaque instant t, échantillonné à la période d’une image, le proxy doit prendre une action at qui détermine le nombre de couches scalables à envoyer. Lorsque les conditions du canal sont mauvaises, pour éviter le débordement des tampons de post-encodage, les paquets peuvent également être détruits. Quand les tampons de post-encodage l’autorisent, le proxy peut également choisir de ne rien envoyer et d’attendre jusqu’à ce que les conditions du canal s’améliorent.

4.2.2 Résolution du problème

Le proxy choisi l’action qui maximise la qualité vidéo reçue et qui permet également de satisfaire les contraintes de débit de canal, de niveau de remplissage des tampons de post-encodage et du récepteur. Ainsi, une fonction de récompense r qui prend en compte toutes ces contraintes est considérées

rt(st, at) = L X l=1 γlal,t | {z } Rec. de transmission + βν RTt(at, ht) − Rct  | {z }

Rec. de de débit canal

+E       L X l=1 λlρ(sel,t, al,t) | {z }

Rec. des tampons de post-encodage

+ L X l=1 µlρ(srl,t, al,t) | {z }

Rec. des tampons du recepteur

     . (7)

Les paramètres positifs γl, λl, µl, avec l = 1 . . . L, et β permettent de définir l’importance relative des différentes contraintes imposées au système. La fonction récompense dans (7) implique plusieurs parties chacune correspond à une des con-traintes exigées.

Contrairement aux systèmes de contrôle de débit traditionnels, qui se concen-trent sur le contrôle à court terme, où seule la fonction récompense immédiate est maximisée, l’objectif du contrôle proposé est de trouver les actions qui maximisent la somme amortie des espérances des récompenses futures

Vπ = Eπ[

X

k=0

γkrt+k+1|st], (8) où le paramètre 0 ≤ γ ≤ 1 est le coéfficient d’amortissement qui définit l’importance relative des récompenses présentes et futures. Eπ[.] désigne la valeur attendue étant donné que l’agent suit une politique π. La politique π est une suite qui indique pour chaque état quelle est l’action à prendre.

Ce problème est résolu en utilisant l’algorithme d’itérations sur les valeurs. Cet algorithme consiste à calculer la fonction valeur optimale V par évaluation succes-sive de la fonction Vt selon le schéma d’itération Vt+1 = T Vt, où T est l’opérateur de Bellman [SB98]. Dans la partie expérimentale, on compare la politique à court terme (γ = 0) et la politique à long terme (γ = 0.9) en terme de qualité vidéo décodée.

4.2.3 Etude expérimentale

La performance du processus de filtrage de couches proposé est évaluée en utilisant la séquence Foreman au format QCIF à une cadence F = 30 images/seconde. Les tests sont effectués en utilisant le codeur H.264/SVC (JSVM 9.11) [VWS07]. Parmi les trois types de scalabilité (temporelle, spatiale, et en qualité), dans cette partie, nous avons considéré la scalabilité en qualité où le nombre de couches décodées impacte directement la qualité vidéo décodée.

L’évolution du PSNR pour la luminance du flux vidéo décodé pour les deux politiques à court et à long terme sont représentées sur la figure 7. En moyenne sur la séquence considérée, un gain d’environ 0.9 dB est obtenu avec la politique à long terme comparée à celle à court terme. Ce gain est principalement dû à une meilleure gestion de filtrage des couches scalables. De plus, les tampons sont mieux contrôlés avec la politique à long terme et cela avec moins de situation de débordement dans les tampons de post-encodage et moins de situations de vide dans les tampons du récepteur. L’impact des actions sur le niveau des tampons du récepteur est également analysé. Les résultats montrent une augmentation de la qualité vidéo lorsque l’information sur les états des tampons du récepteur est exploitée par rapport au cas où les états de ces tampons ne sont pas considérés dans le système de contrôle.

Afin d’évaluer la dépendance du processus de filtrage de couches proposé par rapport au débit de canal, des simulations complémentaires ont été réalisées avec différentes valeurs de débit instantané. Nous avons constaté que la politique à long terme améliore le PSNR moyen, même pour de faibles valeurs de débit de canal par rapport au débit moyen de codage de la séquence. Les ressources disponibles sont

0 100 200 300 400 500 600 700 800 28 30 32 34 36 38

Documents relatifs