Transmission optimisée de flux vidéo haute définition H.264/AVC et SVC sur ADSL2

(1)

HAL Id: hal-00572719

https://hal.archives-ouvertes.fr/hal-00572719

Submitted on 18 Nov 2020

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de

Transmission optimisée de flux vidéo haute définition H.264/AVC et SVC sur ADSL2

Anne-Sophie Bacquet

To cite this version:

Anne-Sophie Bacquet. Transmission optimisée de flux vidéo haute définition H.264/AVC et SVC sur ADSL2 : adaptation conjointe des paramètres de codage source et de transmission. Sciences de l’ingénieur [physics]. Université de Valenciennes et du Hainaut-Cambrésis, 2010. Français. �NNT : 2010VALE0050�. �hal-00572719�

(2)

00

No d'ordre : 10-50

THÈSE DE DOCTORAT

présentée à

L'UNIVERSITÉ DE VALENCIE NES ET DU HAl AUT-CAMBRÉSIS

Pour l'obtention du grade de

DOCTEUR EN SCIENCES

Discipline : Electronique, optronique et systèmes Spécialité : Electronique

par

ANNE-SOPHIE BACQUET

Transmission optimisée de flux vidéo haute définition H.264/ AVC et SVC sur ADSL2 : adaptation conjointe des

paramètres de codage source et de transmission

Soutenue prévue le 10 décembre 2010 devant le jury composé de :

Rapporteurs :

Mme C. GUILLEMOT Mr Y. POUSSET

Examinateur :

Mr H.BOEGLEN

M embre invité :

Directrice de Recherche INRIA-IRISA, Rennes

Maître de Conférences HDR, Institut de Recherche XLIM UMR CNRS 6172, Département SIC, Poitiers

Maître de Conférences, Laboratoire MIPS Université de Haute-Alsace. IUT de Colmar

0

Mr D. NICHOLSON Ingénieur Chef de Projets, THALES Communications, Colombes Co-encadrant :

Mr P. CORLAY Maître de Conférences, IEMN OAE UMR CNRS 8520, Valenciennes Directeurs de thèse :

Mr F.-X. COUDOUX Professeur des Universités, IEMN OAE UMR CNRS 8520, Valenciennes Mr M.-G. GAZALET Professeur des Universités, IEMN OAE UMR C RS 8520, Valenciennes

(3)

W d"ordre : 10-50

UNIVERSITÉ DE VALENCIENNES ET DU RAINA T-CAl\IBRÉSIS

Institut d'Electronique. de ?\Iicroéletronique et de Nanotechnologies (U:YIR CNRS 8520) Département Opto-Acousto-Electronique

Thèse présentée en vue de l"obtention du grade de

Docteur de l'Université de Valenciennes et du Hainaut-Cambrésis

Discipline : Electronique, optronique et systèmes Spécialité : Electronique

par

ANNE-SOPHIE BACQUET

Transmission optimisée de flux vidéo haute définition H.264/ AVC et SVC sur ADSL2 : adaptation conjointe des

paramètres de codage source et de transmission

Soutenue prévue le 10 décembre 2010 devant le jury composé de :

Rapporteurs :

Mme C. GUILLEMOT Mr Y. POUSSET

Examinateur :

Mr H. BOEGLEN

Membre invité :

Mr D. NICHOLSON Co-encadrant :

Mr P. CORLAY Directeurs de thèse :

Directrice de Recherche INRIA-IRISA, Rennes

Maître de Conférences HDR, Institut de Recherche XLIM UMR CNRS 6172, Département SIC, Poitiers

Niaître de Conférences, Laboratoire MIPS Université de Haute-Alsace, IUT de Colmar

Ingénieur Chef de Projets, THALES Communications. Colombes

Maître de Conférences, IEMI\ OAE UMR CI\RS 8520, Valenciennes

Mr F.-X. COUDOUX Professeur des Universités. IE~L ï OAE U~IR CNRS 8520, Valenciennes

(4)

Remerciements

Ce travail a été réalisé au sein du département OAE de l'IEMN (UMR8250) de l'Université de Valenciennes et du Hainaut Cambrésis. Je tiens à remercier les deux directeurs successifs du laboratoire, qui m'ont donné les moyens d'effectuer cette thèse, ainsi que la région Nord-Pas-De- Calais et l'Université de Valenciennes et du Hainaut Cambrésis pour le financement de celle-ci.

Je remercie ensuite chaleureusement mes directeurs de thèse, Monsieur François-Xavier Coudoux et Monsieur Marc Gazalet, et mon co- encadrant, Monsieur Patrick Corlay, qui par leur expérience et leurs conseils m'ont permis de mener à bien ces trois années de doctorat. En particulier merci à François-Xavier Coudoux pour sa grande disponibilité et à Patrick Corlay pour ses critiques précises et appréciées.

Je remercie Madame Christine Guillemot et Monsieur Yannis Pousset d'avoir accepter de juger de la qualité de mon travail en tant que rapporteurs et leur exprime ma sincère reconnaissance.

Je tiens à exprimer ma gratitude à Hervé Boeglen et Didier Nicholson pour avoir accepté de faire partie du jury de thèse final.

Ces trois années de thèse auraient été moins épanouissantes sans la compagnie de mes collègues doctorants et docteurs: Imade, Christophe, Benoit, ...

Je remercie également Marie Zwingelstein et Mohamed Gharbi pour leur aide régulière.

Je remercie tous les autres membres du laboratoire IEMN-DOAE pour leur accueil chaleureux et leur bonne humeur et plus particulièrement nos trois secrétaires pour l'aide fréquente qu'elles m'ont apportée : Anne, Edith et Virginie. Un merci particulier à ma voisine de bureau pour son soutien et sa compréhension.

Je tiens à remercie également le service de reprographie de l'Université pour leur sympathie et leur efficacité lors du tirage du manuscrit final.

D'un point de vue plus personnel, je remercie mes amis pour leur soutien et leur intérêt pour mon travail. Je remercie vivement mon grand- père pour les corrections du manuscrit. Merci à ma future belle-famille et ma soeur pour leur soutien. J'adresse un merci très particulier à mes parents:

merci pour votre soutien et votre confiance. Merci à ma mère pour ses conseils avisés.

(5)

Table des matières:

ln trodu~tion générale ... .. 1

Chapitre 1: LE STANDARD DE COMPRESSION VIDEO H.264/AVC ET L'ADAPTATION DES CONTENUS PAR TRANSCODAGE OU SCALABILITE I. Introduction ... 5

II. Le codeur vidéo type et les standards précédant H.264 / AVC ... 6

A. Le codeur et le décodeur vidéo types ... 6

B. L'historique des standards de compression et leurs utilisations ... 8

III. Le codee H.264/ AVC ... 10

A. Les outils du standard H.264/ AVC ... 10

1) La prédiction intra (A) ... 10

2) La prédiction de mouvement (A) ... 11

3) La transformée entière, le scaling et la quantification uniforme (B,C) 12 4) Le codage entropique adapté au contexte ... 14

5) La couche NAL ... 14

6) Le data partitioning ... 15

7) Les profils ... 16

B. Les performances ... 17

IV. Le transcodage ... 18

v. A. La conversion de standards ... 19

B. Le transcodage temporel. ... 19

C. Le transcodage spatial ... 20

D. Le transcodage en qualité ... 21

1) Transcodage en boucle ouverte /fermée ... 21

2) Transcodeurs par re-quantification ... 22

3) Transcodeurs par sélectivité fréquentielle ... 25

4) Conclusion sur les transcodeurs en qualités ... 26

L'extension scala ble de H.264 1 AVC : SVC ... 27

A. 1) 2) 3) 4) B. 1) 2) C. 1) 2) D. 1) 2) La scalabilité de manière générale ... 27

Historique ... 27

Un codeur scala ble type ... 27

Le cahier des charges de SVC ... 28

Motivations de H.264/ SVC ... 28

H.264 SVC ... 29

H.264 / SVC en général.. ... 29

Les applications ... 30

La scalabilité spatiale et temporelle avec H.264/SVC ... 32

Scalabilité temporelle et performances ... 32

Scalabilité spatiale et performances ... 35

La scalabilité en qualité ... 36

Le codage scalable en qualité avec H.264/SVC ... 36

La prédiction inter couches ... 37

(6)

4) E.

Le MOS et les images clés ... 42

Les performances de H.264 SVC en haute résolution ... 46

VI. Conclusion ... 4 7 Chapitre 2 : LA TRANSMISSION DES SIGNAUX SUR ADSL2 ET L'ETAT DE L'ART DE LA DIFFUSION DE CONTENUS VIDEO I. Introduction ... 49

II. Les systèmes de transmission sur paire torsadée ... 49

A. Les premières transmissions bas débit et les besoins en Haut Débit 49 1) Les transmissions bas débit ... 49

2) Les besoins en haut Débit et les différentes solutions ... 50

B. Les technologies DSL ... 50

1) Le RNIS ... 50

2) HDSL: 0991.1 ... 51

3) ADSL:0.992.1et2 ... 51

4) ADSL2 : G992.3 et 4 ... 52

5) ADSL2+ : 0992.5 ... 54

6) VDSL : 0993.1 ... 55

III. Le canal de transmission ADSL : description et modélisation ... 55

A. Le canal de transmission : la paire torsadée ... 55

1) Les lignes téléphoniques et leurs caractéristiques ... 55

2) Les modes de transmission ... 57

3) Les sources de perturbation ... 58

B. Modélisation de la fonction de transfert. ... 60

1) La modélisation par quadripôle ... 60

2) Les modélisations normalisées ... 61

3) Les modèles de ligne de l'ETSI. ... 61

C. Modélisation du bruit ... 64

1) Modélisation du NEXT : G 1 ... 65

2) Modélisation du FEXT :G2 ... 66

3) Modélisation des sources de bruit G3 à 08 ... 67

4) Modélisation du bruit total.. ... 67

IV. Le système ADSL2 ... 69

A. La sous-couche PMD ... 69

1) La capacité du canal uniforme et non uniforme ... 70

2) La modulation DMT ... 71

3) Le water filling et l'allocation des puissances et des bits ... 80

4) L'algorithme d'allocation des bits et des puissances utilisé ... 82

5) Les codes en treillis ... 86

6) L'organisation en supertrames ... 87

B. La sous-couche PMS-TC ... 87

1) Le fonctionnement de la couche PMS-TC ... 87

2) Le codage canal de Reed salomon ... 89

C. La sous-couche TPS-TC ... 92

V. La transmission de vidéo sur ADSL et la problématique de la zone de couverture ... 93

A. Les couches supérieures à L'ADSL ... 93

(7)

1)

2)

B.

c.

Les modes d'encapsulation usuels de la vidéo ... 93

Le mode retenu ... 93

Les offres triple play ... 94

La problématique de la zone de couverture ... 96

VI. Conclusion ... 97

Chapitre 3 : TRANSMISSION OPTIMISEE D'UN FLUX H.264/ AVC HAUTE DEFINITION SUR LIEN ADSL I. Introduction ... 99

II. Le scénario de transmission ... 100

A. Les séquences de test ... 100

B. Les flux vidéos encodés ... 104

III. La zone d'éligibilité initiale ... 104

A. Le calcul des distances initiales d'éligibilité ... 104

B. Résultats ... 106

IV. Le transcodeur proposé ... 107

v. A. Principe ... 107

B. Performances du transcodeur ... 108

A. B. c. 1) Evolution du débit en sortie du transcodeur ... 108

2) Evolution de la qualité en sortie du transcodeur ... 111

L'extension d'éligibilité ... 117

Principe ... 117

Algorithme d'optimisation ... 118

Résultats ... 119

VI. L' extens10n e 1g1 1 lte en 1-reso u 10n ... .. . d"l" 'b'l' - b' - 1 t' 123 A. B. 1) 2) C. Principes de la bi-résolution ... 123

Système considéré ... 124

La création des flux haute et basse priorité ... 124

Synoptique d'une transmission bi-résolution ... 126

Performances en termes de distorsion de transcodage ... 127

VII. Conclusion ... 130

Chapitre 4: EXTENSION DE LA ZONE D'ELIGIBILITE GRACE A UNE SOLUTION HYBRIDE BASEE SUR LA SCALABILITE ET LE TRANSCODAGE I. II. A. B. c. Introduction ... 133

Le scénario considéré ... 133

Le scenario considéré et les solutions proposées ... 133

Les paramètres de transmission ... 135

. Les paramètres de codage des flux vidéos SVC ... 136

III. Les méthodes d'adaptation de débit ... 137

A. 1) 2) 3) B. La réduction de débit par scalabilité ... 137

La scalabilité MGS ... 137

L'outil d'adaptation ou l'outil d'extraction de NALu ... 139

La qualité en sortie de l'outil d'extraction ... 141

Le transcodage de la couche de base ... 142

(8)

A. Les résultats ... 143

B. Analyse en termes de qualité ... 146

1) Extraction et transcodage ... 146

2) Transcodage de la couche de base et transcodage du flux AVC ... 147

3) L'extension par transcodage pour Mobcal à 1900 et 2000 mètres ... 147

C. Analyse en termes d'extension d'éligibilité ... 148

1) L'influence du modèle de ligne sur la solution proposée ... 148

2) Le critère d'arrêt ... 148

V. L'influence de la taille de la couche de base ... 151

A. Les paramètres de la simulation ... 151

B. Les résultats ... 152

1) L'analyse en termes de qualité ... 155

2) L'analyse en termes d'éligibilité ... 155

VI. Implémentations des méthodes étudiées au sein des systèmes de transmission actuels ... 158

A. Conséquences au niveau du serveur de contenu ... 158

B. Conséquences chez l'abonné ... 158

C. Conséquences au niveau du DSLAM ... 158

VII. Conclusion ... 159

Chapitre 5: PROPOSITION D'UNE SOLUTION DE PROTECTION INEGALE D'UN FLUX VIDEO H.264/SVC MGS POUR L'EXTENSION D'ELIGIBILITE VIDEO SUR ADSL OPTIMISEE EN TERMES DE QUALITE I. Introduction ... 161

II. Analyse des performances de SVC en fonction de la résolution ... 161

A. Description du scenario ... 162

B. Les résultats de l'étude ... 165

1) Résultats pour QPg=35 et QPA=25 ... 165

2) Influence du paramètre de quantification de la couche d'amélioration ... 167

3) Résultats pour un paramètre de quantification de base égal à 25 168 4) Résultats pour des couches de base de qualité identiques ... 169

5) L'influence de la définition du contenu à coder sur les performances du codeur scalable ... ~ ... 170

III. L'extension d'éligibilité de la vidéo sur ADSL : Protection inégale des données scala bles ... 171

A. Scénario étudié ... 171

1) Les paramètres de simulation ... 171

2) Le scenario bi-résolution (ou UEP) ... 173

B. L'évaluation de la solution proposée ... 182

1) Les éligibilités initiales ... 182

2) La solution EEP ... 182

C. Les résultats obtenus ... 183

1) Les résultats en termes de nombre de NALus éliminées et d'extension d'éligibilité ... 184

2) Evaluation en termes de qualité ... 190

(9)

3) Conclusion sur la solution proposée ... 193 IV. Conclusion ... 194

Conclusion générale et perspectives ... 195

(10)

(11)

Table des figures

Figure 1-1. Schéma bloc d'un codeur vidéo ... 6

Figure 1-2. Les pixels adjacents utilisés dans la prédiction intra ... 11

Figure 1-3. Transformée et quantification des macroblocs intra 16x16 ... 13

Figure 1-4. NALu d'une image H.264/AVC ... 15

Figure 1-5. Profils principaux de H.264/AVC de [RIC03] ... 16

Figure 1-6. Evolution du PSNR selon le débit pour différents codees d'après [SULOSJ ... 18

Figure 1-7. Le transcodage vidéo ... 19

Figure 1-8. Illustration de l'erreur de prédiction pour une image Intra codée avec H .264 j AVC et transcodée en boucle ouverte. (gauche) image originale (droite) Image transcodée ... 22

Figure 1-9. CPD Transcodeur d'après [LEF06] ... 24

Figure 1-10. Performances des algorithmes de transcodage par requantification d'après [LEF06] ... 24

Figure 1-11. Sélectivité fréquentielle par niveau ... 25

Figure 1-12. Sélectivité fréquentielle par position ... 25

Figure 1-13. Performances des algorithmes de sélectivité fréquentielle en boucle ouverte ... 26

Figure 1-14. Schéma d'un codeur scalable en qualité type ... 28

Figure 1-15. Continuité de service en environnement mobile d'après [HHI-2] ... 31

Figure 1-16. Eligibilité sur ADSL de [KOU08] ... 32

Figure 1-17. GOP hiérarchiques (a) quatre niveaux - dyadique (b) 3 niveaux - non dyadique ... 33

Figure 1-18. Efficacité de codage avec les GOP hiérarchiques d'après [HHI-2] ... 35

Figure 1-19. Scalabilité spatiale- comparaison AVC de [HHI-1] ... 36

Figure 1-20. Schéma bloc d'un codeur SVC en qualité à deux couches ... 37

Figure 1-21. Scalabilité CGS - Performances d'après [HHI -2] ... .40

Figure 1-22. Scalabilité CGS- performances d'après [SCH07] ... .40

Figure 1-23. Comparaison CGS vs transrating d'après [LIU08] (a) Bus en QCIF et (b) Fore man en CIF ... 42

Figure 1-24. GOP hiérarchique ... 43

Figure 1-25. Concept des images clés d'après [HHI-1] ... 44

Figure 1-26. Relations de prédiction SVC d'après [SCH07] ... .45

Figure 1-27. Performances des différentes relations de prédiction d'après [SCH07] ... 45

Figure 1-28. Tests subjectifs scalabilité spatiale - Haute Définition d'après [HHI-1] ... 46

Figure 1-29. Dé bit distorsion pour scalabilité spatiale HD d'après [HHI -1] .. 4 7 Figure 2-1. Schéma bloc d'un système DSL classique d'après [FUN06-2] .... 50

Figure 2-2. Multiplexage fréquentiel ADSL d'après [OBL] ... 52

(12)

Figure 2-4. Spectre ADSL2 de [DSL03] ... 54

Figure 2-5 Débit en fonction de la distance ADSL2 et ADSL 2 d'après [DSL03] ... 55

Figure 2-6. Illustration de l'effet des load coils ... 57

Figure 2-7. Diaphonie NEXT et FEXT ... 58

Figure 2-8. Schéma électronique d'un quadripôle ... 60

Figure 2-9. Modèles de ligne européens de [ITU01] ... 62

Figure 2-10. Fonction de transfert en fonction de la fréquence pour le modèle 1 ... 63

Figure 2-11. Fonction de transfert des différentes modèles pour une distance de 2300 mètres ... 63

Figure 2-12. Les sources de perturbations dans la modélisation du bruit par l'ET'SI de [ETS02] ... 64

Figure 2-13. PSD G1 pour modélisation du NEXT- modèle B ... 66

Figure 2-14. PSD G2 pour modélisation du FEXT- modèle B ... 67

Figure 2-15. Bruit ramenés à l'entrée :(a) loop 1 , 0 perturbateur (b) loop 1 , 1000m ... 68

Figure 2-16. Sous-couches du système ADSL2 ... 69

Figure 2-17. Constellations QAM : la 16-QAM avec mapping de gray ... 72

Figure 2-18. Synoptique de la modulation DMT ... 73

Figure 2-19. Représentation d'un symbole DMT en temps et en fréquence .. 74

Figure 2-20. Synoptique complet chaine ADSL. ... 74

Figure 2-21. Illustration de l'interférence entre symboles ... 7 5 Figure 2-22. L'intervalle de garde et les lES ... 75

Figure 2-23. Illustration du régime transitoire ... 76

Figure 2-24. Représentation spectrale avec IEC ... 77

Figure 2-25. Solution à l'IEC ... 77

Figure 2-26. 16-QAM symbole émis {vert) symbole reçu (rouge) symbole détecté (orange) ... 78

Figure 2-27. Principe du Water filling: illustration ... 81

Figure 2-28. Classement des bruits ramenés à l'entrée et différents niveaux de water filling ... 83

Figure 2-29. Structure de la supertrame ... 87

Figure 2-30. Organisation de la couche PMS-TC ... 88

Figure 2-31. Trame de données concaténée après redondance FEC ... 88

Figure 2-32. Trame de données après entrelacement ... 88

Figure 2-33. Multiplexage des données pour deux trajets de latence, fabrication de la trame de données ADSL ... 89

Figure 2-34. Performances des différents codes RS ... 91

Figure 2-35. Exemple d'entrelacement d'après [FUN06-3] ... 91

Figure 2-36. Synoptique général des trois sous-couches ADSL pour deux flux ATM en entrée ... 92

Figure 2-37. Encapsulation de la vidéo retenue ... 94

(13)

Figure 3-1. Synoptique de la solution proposée ... 100

Figure 3-2. Classification en deux groupes des séquences selon leurs indicateurs SI et TI ... 102

Figure 3-3. Illustration des séquences vidéos utilisées et classification après caractérisation ... 103

Figure 3-4. Détermination de la distance d'éligibilité ... 105

Figure 3-5. Schéma bloc du transcodeur proposé ... 108

Figure 3-6. Exemple de débit en sortie du transcodeur pour la séquence Shields ... 109

Figure 3-7. Débits moyen en sortie du transcodeur et écart type pour les dix séquences lorsque PBPintra =PB Pinter ... 110

Figure 3-8. Evolution du débit moyen en fonction de PBPintra et PBPinter ... 110

Figure 3-9. Evolution de l'EQM pour la séquence Shields ... 111

Figure 3-10. Notes VQM quand l'un des PBP est fixé à 16 et l'autre varie de 1 à 16 (gauche) Parkrun (droite) Mobcal ... 112

Figure 3-11. EQM en sortie du transcodeur pour les dix séquences. PBPintra==PBPinter ... 115

Figure 3-12. EQM normalisée moyenne ... 115

Figure 3-13. Erreur absolue de modélisation (a-b) sans normalisation (c-d) avec normalisation ... 116

Figure 3-14. Synoptique du système ... 118

Figure 3-15. Déroulement de l'optimisation ... 119

Figure 3-16. Extensions d'éligibilité pour les différentes lignes (a) sans et avec les perturbateurs dans le cas de la transmission de la séquence Shields ... 120

Figure 3-17. Couples (PBPintra, PBPinter) choisis pour chaque nouvelle extension d'éligibilités sur le modèle de ligne1 sans perturbateurs ADSL.121 Figure 3-18. Exemple illustratif de la qualité avec a) PBPintra =2 , b) PBPintra =3 ... 122

Figure 3-19. Evolution des distorsions de transcodage, de transmission et totale en fonction du débit ... 124

Figure 3-20. Image reconstruite à partir des partitions A et B ... 125

Figure 3-21. Synthèse des flux haute et basse priorité ... 125

Figure 3-22. Synoptique du système pour le cas bi résolution ... 126

Figure 3-23. Extension 1 de la zone d'éligibilité Bi-résolution: TEBTc:1QA .128 Figure 3-24. Evolution du Débit selon les deux curseurs PBPintra et PBPinter ... 129

Figure 3-25. Evolution du dé bit total en fonction de la proportion du train de base pour différentes lignes ... 129

Figure 4-1. Extension d'éligibilité par transcodage ... 134

Figure 4-2. Extension d'éligibilité par solution hybride proposée ... 135

Figure 4-3. Gop hiérarchique employé ... 137

Figure 4-4. La structure de GOP détaillée ... 139

Figure 4-5. Extraction des couches ... 140

(14)

Figure 4-6. Evolution de la qualité image par image à différents points

d'extraction (30 premières images de CrowdRun) ... 141

Figure 4-7. Extension éligibilité obtenue pour les deux solutions, ... 145

Figure 4-8. Illustration visuelle de la qualité des couches de base ... 14 7 Figure 4-9. Extension d'éligibilité pour la séquence CrowdRun pour les modèles 1,4 et 8 ... 148

Figure 4-10 . Illsutration de la qualité recue chez l'utilisateur final : (a) Couche de base transcodée avec (3,1) ... 149

Figure 4-11. Mo bcal, couche de base tronquée à (3, 1) ... 150

Figure 4-12. CrowdRun, Evolution de la qualité en fonction de la distance ... 152

Figure 4-13. Mobcal, Evolution de la qualité en fonction de la distance ... 152

Figure 4-14. La qualité visuelle obtenue pour le transcodage des couches de bases à (3, 1) et (2, 1) ... 157

Figure 5-l. Séquences de test ... 163

Figure 5-2. Synoptique du scenario d'évaluation des performances de SVC fonction de la résolution ... 164

Figure 5-3. Evolution de la qualité pour un QPB=35 et un QPA variable. Séquence Aspen ... 167

Figure 5-4. Evolution de la qualité pour un QPB=35 et un QPA variable. Séquence Sunflower ... 167

Figure 5-5. Performances de SVC pour séquences Aspen HD-Cut ... 170

Figure 5-6. Paquetisation des données vidéo ... 1 7 4 Figure 5-7. Relations d'estimation/compensation de mouvement dans le flux ... 176

Figure 5-8. Optimisation de la solution bi-résolution ... 179

Figure 5-9. Evolution du nombre de NALu éliminées en EEP selon la distance pour la séquence Football ... 184

Figure 5-10. Evolution du nombre de NALu éliminées en EEP selon la distance pour la séquence Bus ... 184

Figure 5-11 Evolution de la taille en octet des NALu à retirer selon l'ordre d'apparition pour les séquences Football et Bus ... 185

Figure 5-12. Evolution du nombre de NALus éliminées en fonction du TEB du train complémentaire pour la séquence Football à 3400 mètres ... 186

Figure 5-13. Evolution du nombre de NALu éliminées en fonction du TEB du train complémentaire pour la séquence Bus à 3416 mètres ... 187

Figure 5-14. Evolution du nombre de NALus éliminées en EEP et bi- résolution en fonction de la distance pour la séquence Football ... 188

Figure 5-15. Evolution du nombre de NALus éliminées en EEP et bi- résolution en fonction de la distance pour la séquence Bus ... 189

Figure 5-16. PSNR image par image avec et sans train complémentaire- séquence Football. ... 191

Figure 5-17. PSNR image par image avec et sans train complémentaire- séquence Bus ... 191

(15)

Liste des tableaux :

Tableau 1- 1. Les standards de compression vidéo du groupe MPEG ... 9

Tableau 1- 2. Les standards de compression vidéo du groupe VCEG ... 9

Tableau 1- 3. Répartition du débit selon la partition et selon le type d'image ... 16

Tableau 1- 4. GOP hiérarchiques- 3 exemples ... 33

Tableau 1- 5. Interactions entre les modes de prédiction inter-couches et les éléments envoyés ... 38

Tableau 1- 6. Débits obtenus par CGS ... 40

Tableau 2-1. Les modes de transmission ... 57

Tableau 2-2. Longueurs minimales des modèles ETSI ... 61

Tableau 2-3. Algorithmes d'allocation ... 82

Tableau 2-4. Détermination de Ret P théoriques ... 85

Tableau 2-5. Surcout de débit entraîné par le codage RS ... 90

Tableau 2-6. Options de codage TV sur ADSL ... 95

Tableau. 3-1 Caractérisation spatiale et temporelle des séquences de test 102 Tableau 3-2. Eligibilité Initiale ... 106

Tableau 3-3. Taille des DFD intra et inter pour différents flux vidéo ... 113

Tableau 3-4. QP moyens retenus pour le codage des séquence de test à 8Mbitjs ... 114

Tableau 3-5. Ecart type relatifs moyens des séquences normalisées ... 114

Tableau 3-6. Nouvelles Eligibilités ... 123

Tableau 3-7. Débits possible selon le TEB pour différents modèles de ligne à 2000m ... 128

Tableau 4-1. Séquence CrowdRun, eligibilité étendue avec solution hybride ou transcodage ... 144

Tableau 4-2. Séquence Mobcal, eligibilité étendue avec solution hybride ou transcodage ... 144

Tableau 4-3. Analyse des distorions modélisées et rélles pour Mobcal à 1900 et 2000 mètres ... 14 7 Tableau 4-4. Extensions d'éligibilité ... 150

Tableau 4-5. Débits obtenus pour le codage des flux SVC avec les couches de bases à 4 et 5 Mbit/s ... 151

Tableau 4-6. Extension d'éligibilité pour la séquence CrowdRun avec une couche de base à SMbit/s(gauche) 4Mbit/s (droite) ... 153

(16)

Tableau 4-7. Extension d'éligibilité pour la séquence Mobcal avec une

couche de base à 5Mbitjs (gauche) 4Mbitjs (droite) ... 154

Tableau 4-8. Eligibilités pour les nouvelles taille de couche de base 155 Tableau 5-1. séquences de test.. ... 162

Tableau 5-2 Résultats pour Aspen ... 166

Tableau 5-3 Résultats pour Suflower ... 166

Tableau 5-4 Résultats pour Wind ... 166

Tableau 5-5 Résultats pour Touch ... 166

Tableau 5-6. Performances de SVC pour la séquence As pen avec un QP8=2 5 et un QPA=21 ... 168

Tableau 5-7. Performances de SVC pour la séquence Sunflower avec un QPB=25 et un QPA=21 ... 168

Tableau 5-8. Codage de la séquence Aspen CIF à la qualité de la full-HD. 169 Tableau 5-9. Codage de la séquence Sunflower CIF à la qualité de la full-HD ... 169

Tableau 5-10. Caractéristiques des séquences de test ... 172

Tableau 5-11. Caractéristiques de codage des séquences de test ... 173

Tableau 5-12. Eligibilité initiale des séquences avec le modèle de ligne 3 .. 182

Tableau 5-13. Extensions d'éligibilité solution ... 185

Tableau 5-14. Gains maximums obtenus pour la bi-résolution par rapport à la solution EEP ... 189

Tableau 5-15. Ecart en qualité maximal lorsque les NALu du train complémentaire sont retirées ... 192

Tableau 5-16. Gain de la bi-résolution par rapport à la solution EEP en dB ... 192

(17)

ADSL ANSI ATM ATU AVC BL CAB AC CAVLC CBR CGS CIF CM co

CNR CPDT CPL CSA DCT DFD DMT DSLAM DVB DVD EEP EL EM EQM EQMN ETSI FDD FDFR FDM FEC FEQ FEXT FGS FPGA FPS GOP HD HQAM IDR IEC lES IG

Glossaire :

Asymetrie Digital Subscriber Line American National Standard Institute Asynchronous Transfert Mode ADSL Terminal Unit

Advanced Video Coding Base Layer

Context Adaptive Binary Arithmetic Coding Context Adaptive Variable Length Coding Constant Bit Rate

Coarse Grain Scalability Common Intermediate Format Compensation de Mouvement Central Office

Channel to Noise Ratio

Cascaded Pixel Domain Transrater Courant Porteur de Ligne

Carrier Service Area Discrete Cosine Transform Displaced Frame Difference Discrete Multi-Tone

Digital Subscriber Line Access Multiplexer Digital Video Broadcasting

Digital Versatile Dise Equal Error Protection Enhancement Layer Estimation de Mouvement

Erreur Quadratique Moyenne(= MSE) EQM Normalisée

European Telecommunications Standards Institute Frequency Division Duplexing

Full Decode Full Re-encode Frequency Division Multiplexing Forward Error Correction

Frequency EQualizer Far End XTalk Fine Grain Scalability

Field Programmable Gate Array Frame Per Second

Group OfPicture High Definition Hierarchichal QAM

Instantaneous Decoder Refresh Interférence Entre Canaux Interférence Entre Symboles Intervalle de Garde

(18)

IPTV ITU JM JSVM JVT MGS Mi Mo MPEG MRA MSE NAL NEXT OFDM PBP PC PCM PMD PMS-TC POTS PPS PSD PSNR QAM QCIF QEF QP Re-ADSL RNIS RS RTP SAE SD SI SPS SSIM

svc

SVH TB TC TEB TEQ TES TFDI TI TNT TPS-TC TV TVHD UDP UEP

Internet Protocol Tele Vision

International Telecommunication Union Joint Model

Joint Scalable Video Model Joint Video Team

Medium Grain Scalability Multiple input Multiple output Moving Picture Expert Group Mixed Requantification Algorithme Mean Square Error

Network Abstraction Layer Near End Xtalk

Orthogonal Frequcy Division Multiplexing Priority Break Point

Prefixe Cyclique

Pulse Coded Modulation Physical Medium Dependant

Physical Medium Specifie -Transmission Convergence Plain Old Telephone Service

Picture Parameter Sets Power Spectral Density Peak Signal to Noise Ratio

Quadrature Amplitude Modulation Quarter CIF

Quasi Error Free

Quantification Parameter Reach extended ADSL

Réseau Numérique à Intégration de Services Reed Solomon

Real-time Transport Protocol Sum of Absolute Error Standard Definition Spatial Information Sequence Parameter Sets Structural SIMilarity Scalable Video Coding Système Visuel Humain Train de Base

Train Complémentaire Taux d'Erreur Binaire Temporal EQualizer Taux d'Erreur Symbole

Transformée de Fourier Discrète Inverse Temporal Information

Télévision Numérique Terrestre

Transport Protocol Specifie - Transmission Convergence TéléVision

TéléVision Haute Définition User Datagram Protocol Unequal Error Protection

(19)

UMA VCEG VCL VDSL VHS VOD VQM WiFi

Universal Multimedia Access Video Coding Expert Group Video Coding Layer

Very high bitrate DSL Video Home System Video On Demand Video Quality Metric Wireless Fidelity

(20)

Introduction générale

Le déploiement rapide durant ces quelques dernières années des nouveaux services de télédiffusion en haute définition (TVHD) constitue une des innovations récentes dans le domaine des communications numériques audiovisuelles. Celui-ci a été rendu possible essentiellement grâce aux avancées récentes dans le domaine des communications numériques d'une part, et des techniques de compression vidéo d'autre part. Toutefois, les nouveaux services TVHD requièrent de plus en plus de bande passante, et mettent en œuvre des technologies de plus en plus variées en termes de réseaux, format de données, équipements terminaux, ... au sein de réseaux dits hétérogènes filaires et/ ou sans fil, de telle sorte que la mise en place de ces nouveaux modes de diffusion de contenus audiovisuels haute définition constitue un véritable défi afin de satisfaire les exigences toujours plus fortes en matière de qualité de service et d'expérience.

En effet, l'utilisation des systèmes de compression vidéo, indispensables pour s'adapter à la bande passante disponible, induit des défauts typiques de codage, auxquelles viennent s'ajouter les perturbations éventuelles liées aux bruits de transmission qui auront un impact considérable sur la qualité de la vidéo distribuée perçue par l'utilisateur final. L'utilisation des systèmes de compression dits échelonnables (ou scalables) semble une solution intéressante afin de satisfaire les contraintes de qualité de ces nouveaux modes de diffusion. Ils peuvent notamment être exploités de façon conjointe avec des méthodes adaptatives de transmission afin d'assurer à l'ensemble du système de transmission à la fois une grande robustesse et une meilleure flexibilité.

Le projet ANR 2007-2010 TOSCANE (Transmission vidéo Optimisée Source/ Canal écheloNnablE)l porte sur le développement d'un système de diffusion s'appuyant sur une telle approche conjointe. Il a pour but d'améliorer la couverture globale de diffusion des contenus audiovisuels haute définition en optimisant la transmission de bout en bout, d'abord sur les réseaux filaires de type ADSL, puis sur le réseau domestique sans fil qui peut suivre

Logo TOSCANE

(WiFi en particulier) (Fig. 1). TOSCANE propose d'exploiter les nouvelles caractéristiques de robustesse et de scalabilité des standards émergents de compression vidéo numérique et d'optimiser leur utilisation au sein d'architectures innovantes de diffusion vidéo numérique basée sur une approche conjointe de source et de canal, susceptibles à terme de renouveler les services et les usages et de répondre aux futurs besoins du marché de la télévision numérique.

1 Le Consortium TOSCANE réunissait les partenaires suivants : Thomson Grass Valley, THALES Communications, LIEN Nancy, NETQOST, et IEMN. IEMN était responsable du sous-projet« Etudes Algorithmiques». La revue finale du projet s'est tenue à Rennes le 11 juin 2010.

(21)

Grâce à la scalabilité on peut envisager chez un même abonné la possibilité d'utiliser différents types de terminaux afin de visualiser un même programme ou des programmes différents. Les opérations d'adaptation et d'optimisation conjointe pourront alors être réalisées soit au niveau du central ADSL, au niveau du modem routeur de l'abonné, ou bien au niveau du décodeur.

Ce travail de thèse s'inscrit dans le cadre du projet ANR TOSCANE, et porte plus particulièrement sur l'optimisation de la transmission de flux vidéo haute définition sur ADSL2, à 1 'heure où les opérateurs télécoms et les fournisseurs de services multiplient les offres ll TV sur ADSL >>.

Vidéo MPEG-4

A b o n n é 2 -

Abonné n

~mAN

PC

~SDT'l'MDTV Vidéo

en

direct ,../f

Optimisation de la transmission vidéo du central ADSL vers l'abonné (à gauche), puis sur le réseau domestique (à droite)

L'éligibilité d'un client ADSL à un service vidéo dépend de la qualité de sa ligne. Cette qualité, ou capacité à supporter les débits nécessaires au transport de vidéos, dépend de plusieurs paramètres mais plus particulièrement de la distance séparant ce client ADSL du central téléphonique. En d'autres termes, au delà d'une certaine distance, une ligne ne pourra plus permettre la transmission d'une vidéo au débit requis avec un niveau de qualité de service donné : les clients ADSL sont alors dits« non éligibles>>. L'objectif de ces travaux de thèse est d'étudier plusieurs solutions pour étendre la zone d'éligibilité aux services de diffusion de contenus vidéo haute définition. Deux scénarios sont successivement considérés :

• Dans le premier cas dit non scalable, le flux vidéo haute définition est encodé de manière traditionnelle selon le standard H.264 / AVC (Advanced Video Coding) qui constitue aujourd'hui l'état de l'art en matière de compression vidéo.

• Dans le second cas, dit scalable, le flux vidéo haute définition à transmettre est directement encodé selon l'extension échelonnable du standard H.264/AVC, plus connue sous le nom de SVC (Scalable Video Coding).

Afin de rendre le client éligible, le débit vidéo à transmettre est adapté à la qualité de la ligne d'abonné: par transcodage dans le premier cas, puis par scalabilité dans le second. Dans les deux cas, les paramètres de transcodagejscalabilité sont optimisés en termes de qualité reçue, de

(22)

Le manuscrit se décompose en cinq chapitres. Le premier chapitre donne un aperçu des techniques de compression vidéo mises en œuvre dans le cadre de la thèse. L'accent est mis sur le standard de compression vidéo H.264 j AVC et ses outils de codage spécifiques, ainsi que sur l'extension scalable de ce dernier, connue sous le nom de SVC (Scalable Video Coding).

Une partie de ce chapitre est également consacrée aux techniques les plus récentes de transcodage vidéo. Le second chapitre présente un état de l'art des techniques ADSL de transmission de données numériques haut débit sur ligne téléphonique. Les caractéristiques physiques du canal de transmission sont décrites en détail, puis la chaine complète de transmission ADSL est présentée en insistant sur la modulation multi- porteuses utilisée ainsi que l'allocation adaptative des bits et de la puissance sur les différents sous-canaux ADSL. Le chapitre se termine par une présentation des services actuels de diffusion vidéo sur ADSL (solutions IPTV), qui permet d'introduire la problématique de la zone de couverture limitée de ces derniers.

Le troisième chapitre présente la première contribution de ce travail de thèse. Il s'agit d'une solution originale permettant d'étendre la zone d'éligibilité des services IPTV dans le cas d'une transmission de flux haute définition compressés suivant H.264/ AVC sur ADSL2. Les données vidéo transmises sont protégées de manière égale (transmission EEP) pour une transmission dite quasi sans erreur. L'extension de zone d'éligibilité s'appuie sur une adaptation du débit vidéo à la ligne d'abonné par transcodage du flux vidéo entrant. Un transcodeur H.264 a été développé ; ses caractéristiques ainsi que ses performances sont décrites en détail. Les paramètres de transcodage ainsi que les paramètres de transmission (répartition des bits et de la puissance) sont optimisés afin de minimiser l'impact visuel pour l'abonné final de la distorsion due au transcodage. Les résultats obtenus montrent que grâce à la solution proposée, l'éligibilité initiale est étendue de 1,2 Km en moyenne sur les différentes lignes testées, avec une qualité visuelle résultante tout à fait acceptable.

Dans les deux derniers chapitres, nous considérons maintenant que le flux vidéo haute définition entrant est compressé suivant l'extension échelonnable SVC, dans le cas d'une scalabilité SNR du type MGS. Le quatrième chapitre propose d'abord une solution basée sur une approche de réduction de débit hybride (scalabilité MGS appliquée sur la couche d'amélioration, puis transcodage de la couche de base), cette solution permet d'améliorer la qualité des vidéos reçues avec des valeurs de PSNR jusqu'à 3dB supérieures. Le dernier chapitre commence par une évaluation des performances atteintes en scalabilité en qualité selon la résolution spatiale considérée. Cette étude montre que les gains obtenus en termes de qualité sont relativement modestes pour les séquences de résolution élevée. Nous proposons ensuite une approche bi-résolution, où le flux vidéo SVC est scindé en deux parties d'importances variables. Une protection inégale des flux de données vidéo obtenus est ensuite appliquée en fonction de leur importance, en adaptant le mode de transmission utilisé, et le choix des porteuses dans la répartition des données haute ou basse priorité. Dans une première approche, la proposition retenue est validée pour des séquences

(23)

vidéo au format CIF. Celle-ci permet d'améliorer les performances en qualité obtenues en comparaison avec une approche du type EEP, pour des accroissements de zone de couverture géographique dans le cas d'une transmission de données vidéo sur ADSL depuis un central téléphonique jusque l'abonné identiques.

Nous proposons, pour terminer, des perspectives de poursuite et des pistes d'amélioration de ce travail.

(24)

Chapitre 1 :

LE STANDARD DE COMPRESSION VIDEO H.264/AVC ET L'ADAPTATION DES CONTENUS

PAR TRANSCODAGE OU SCALABILITE

1. Introduction

Les transmissions de vidéo sur des supports comme l'ADSL ont été permises grâce aux techniques de compression vidéo. En effet, la transmission d'une séquence vidéo non compressée, de résolution standard nécessiterait des débits supérieurs â 100 Mbitjs. Avec la compression vidéo, ces débits sont typiquement réduits à 1.5 Mbitjs. Pour y parvenir le codage des vidéo sera donc réalisé avec pertes c'est-à-dire, qu'après compression, la vidéo ne pourra pas être reconstruite identique à l'originale. La compression vidéo repose sur deux nécessités fondamentales et contradictoires : un débit toujours plus faible et la meilleure qualité possible. Ces deux aspects sont contradictoires car la meilleure qualité possible ne peut être obtenue qu'en allouant suffisamment de ressources pour transmettre l'ensemble des éléments composant la vidéo. La notion de compromis entre ces deux paramètres définit la problématique de la compression :jusqu'où compresser la vidéo tout en conservant une qualité acceptable ?

Une vidéo non compressée est constituée d'une succession d'images fixes. Elles sont capturées à une certaine fréquence image variant classiquement entre 15 à 60 images par seconde ou fps (frame per second).

Chacune des images est découpée en un certain nombre de colonnes et de lignes, chaque cellule ainsi créée est appelée pixel. Le nombre de pixels contenus sur chaque ligne et chaque colonne définissent la résolution de la vidéo. Par exemple, une vidéo en CIF (Common Intermediate Format) aura 288 lignes et 352 pixels par ligne. Les différentes résolutions usuelles sont rappelées en Annexe 1.

La compression vidéo réduit efficacement les quatre types de redondances présents dans le signal vidéo. Tout d'abord, au sein d'une image, des zones plus ou moins uniformes peuvent être distinguées. Il existe une redondance spatiale de l'information à coder. Deuxièmement, pendant une seconde, un grand nombre d'image est capturé. Un objet en mouvement sera très probablement situé à une position proche dans deux images successives, les informations sont redondantes temporellement. La prédiction de mouvement aura pour rôle de réduire ce type de redondance. Ensuite, le système visuel humain (SVH) est inégalement sensible aux fréquences spatiales d'une image. En effet, plus la fréquence spatiale augmente moins la sensibilité de l'œil est importante. Il existe des redondances psycho-visuelles.

Le dernier type de redondance exploité dans les codeurs vidéo est lié au codage de l'information en un flux binaire. En effet, certaines valeurs à coder arrivent plus fréquemment que d'autres. Les informations à coder sont statistiquement redondantes.

(25)

Chapitre 1 :Le standard de compression vidéo H.264/ AVC et l'adaptation des contenus par transcodage ou scalabilité

Dans ce chapitre, nous présentons dans un premier temps les différentes étapes d'un codeur vidéo type et nous donnons un bref historique des codees précédant H.264/ AVC. Nous présentons ensuite les outils du codeur H.264/ AVC et en particulier ceux que nous utiliserons dans ces travaux. Les transmissions de vidéo s'effectuant, à l'heure actuelle, sur des réseaux de transmission à bande passante variable et à destinations de terminaux très hétérogènes (en résolution spatiale et temporelle), les besoins en adaptation de contenus se sont fortement accrus. Nous présentons donc deux outils d'adaptation de contenu vidéo: le transcodage et la scalabilité, dans le cas de vidéo H.264 / AVC. Etant donné qu'avec l'application ciblée nos travaux nécessite l'adaptation de la vidéo aux caractéristiques de la ligne d'abonné ADSL, nous présenterons plus en détail le transcodage et la scalabilité en qualité.

Il. Le codeur vidéo type et les standards précédant H.264/AVC

Les codeurs ayant historiquement précédé H.264/AVC possédaient une architecture similaire principalement basée sur des étapes de transformée et d'estimation/ compensation de mouvement. Nous présentons dans un premier temps les diverses étapes du codage d'une vidéo avant de balayer rapidement les spécificités des codeurs précédant H.264/ AVC.

A. Le codeur et le décodeur vidéo types

Les différentes étapes du codeur vidéo sont représentées sur la Figure 1-1.

Chaque image de la vidéo subit tout d'abord le découpage en bloc et les blocs ainsi crées sont codés successivement. C'est le premier moyen de réduire les redondances spatiales.

Prédiction A

Transformée B

Quantification

c

Codage

-r---IIIJo~l entropique D ' - - - 1 ' _______ . . . ______ - L - - - . . . . 1

: Quantification·' :

! ^E ^:

: = = = • Transformée·' ' = = = t= = =

=:

⁼~ ^J

' '

' F '

L - - - -_:~

~--, 1

•' "---... ,1,+

-<4----! Mémoire ~

---r"" d'\

: d'images -,(); + --- _:_::al!imiGiill!ilill!lllllid..---_t

Figure 1-1. Schéma bloc d'un codeur vidéo

On distingue deux types de codage: le codage intra-image appelé