HAL Id: hal-00572719
https://hal.archives-ouvertes.fr/hal-00572719
Submitted on 18 Nov 2020
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de
Transmission optimisée de flux vidéo haute définition H.264/AVC et SVC sur ADSL2
Anne-Sophie Bacquet
To cite this version:
Anne-Sophie Bacquet. Transmission optimisée de flux vidéo haute définition H.264/AVC et SVC sur ADSL2 : adaptation conjointe des paramètres de codage source et de transmission. Sciences de l’ingénieur [physics]. Université de Valenciennes et du Hainaut-Cambrésis, 2010. Français. �NNT : 2010VALE0050�. �hal-00572719�
00
No d'ordre : 10-50
THÈSE DE DOCTORAT
présentée à
L'UNIVERSITÉ DE VALENCIE NES ET DU HAl AUT-CAMBRÉSIS
Pour l'obtention du grade de
DOCTEUR EN SCIENCES
Discipline : Electronique, optronique et systèmes Spécialité : Electronique
par
ANNE-SOPHIE BACQUET
Transmission optimisée de flux vidéo haute définition H.264/ AVC et SVC sur ADSL2 : adaptation conjointe des
paramètres de codage source et de transmission
Soutenue prévue le 10 décembre 2010 devant le jury composé de :
Rapporteurs :
Mme C. GUILLEMOT Mr Y. POUSSET
Examinateur :
Mr H.BOEGLEN
M embre invité :
Directrice de Recherche INRIA-IRISA, Rennes
Maître de Conférences HDR, Institut de Recherche XLIM UMR CNRS 6172, Département SIC, Poitiers
Maître de Conférences, Laboratoire MIPS Université de Haute-Alsace. IUT de Colmar
0
Mr D. NICHOLSON Ingénieur Chef de Projets, THALES Communications, Colombes Co-encadrant :
Mr P. CORLAY Maître de Conférences, IEMN OAE UMR CNRS 8520, Valenciennes Directeurs de thèse :
Mr F.-X. COUDOUX Professeur des Universités, IEMN OAE UMR CNRS 8520, Valenciennes Mr M.-G. GAZALET Professeur des Universités, IEMN OAE UMR C RS 8520, Valenciennes
W d"ordre : 10-50
UNIVERSITÉ DE VALENCIENNES ET DU RAINA T-CAl\IBRÉSIS
Institut d'Electronique. de ?\Iicroéletronique et de Nanotechnologies (U:YIR CNRS 8520) Département Opto-Acousto-Electronique
Thèse présentée en vue de l"obtention du grade de
Docteur de l'Université de Valenciennes et du Hainaut-Cambrésis
Discipline : Electronique, optronique et systèmes Spécialité : Electronique
par
ANNE-SOPHIE BACQUET
Transmission optimisée de flux vidéo haute définition H.264/ AVC et SVC sur ADSL2 : adaptation conjointe des
paramètres de codage source et de transmission
Soutenue prévue le 10 décembre 2010 devant le jury composé de :
Rapporteurs :
Mme C. GUILLEMOT Mr Y. POUSSET
Examinateur :
Mr H. BOEGLEN
Membre invité :
Mr D. NICHOLSON Co-encadrant :
Mr P. CORLAY Directeurs de thèse :
Directrice de Recherche INRIA-IRISA, Rennes
Maître de Conférences HDR, Institut de Recherche XLIM UMR CNRS 6172, Département SIC, Poitiers
Niaître de Conférences, Laboratoire MIPS Université de Haute-Alsace, IUT de Colmar
Ingénieur Chef de Projets, THALES Communications. Colombes
Maître de Conférences, IEMI\ OAE UMR CI\RS 8520, Valenciennes
Mr F.-X. COUDOUX Professeur des Universités. IE~L ï OAE U~IR CNRS 8520, Valenciennes
Remerciements
Ce travail a été réalisé au sein du département OAE de l'IEMN (UMR8250) de l'Université de Valenciennes et du Hainaut Cambrésis. Je tiens à remercier les deux directeurs successifs du laboratoire, qui m'ont donné les moyens d'effectuer cette thèse, ainsi que la région Nord-Pas-De- Calais et l'Université de Valenciennes et du Hainaut Cambrésis pour le financement de celle-ci.
Je remercie ensuite chaleureusement mes directeurs de thèse, Monsieur François-Xavier Coudoux et Monsieur Marc Gazalet, et mon co- encadrant, Monsieur Patrick Corlay, qui par leur expérience et leurs conseils m'ont permis de mener à bien ces trois années de doctorat. En particulier merci à François-Xavier Coudoux pour sa grande disponibilité et à Patrick Corlay pour ses critiques précises et appréciées.
Je remercie Madame Christine Guillemot et Monsieur Yannis Pousset d'avoir accepter de juger de la qualité de mon travail en tant que rapporteurs et leur exprime ma sincère reconnaissance.
Je tiens à exprimer ma gratitude à Hervé Boeglen et Didier Nicholson pour avoir accepté de faire partie du jury de thèse final.
Ces trois années de thèse auraient été moins épanouissantes sans la compagnie de mes collègues doctorants et docteurs: Imade, Christophe, Benoit, ...
Je remercie également Marie Zwingelstein et Mohamed Gharbi pour leur aide régulière.
Je remercie tous les autres membres du laboratoire IEMN-DOAE pour leur accueil chaleureux et leur bonne humeur et plus particulièrement nos trois secrétaires pour l'aide fréquente qu'elles m'ont apportée : Anne, Edith et Virginie. Un merci particulier à ma voisine de bureau pour son soutien et sa compréhension.
Je tiens à remercie également le service de reprographie de l'Université pour leur sympathie et leur efficacité lors du tirage du manuscrit final.
D'un point de vue plus personnel, je remercie mes amis pour leur soutien et leur intérêt pour mon travail. Je remercie vivement mon grand- père pour les corrections du manuscrit. Merci à ma future belle-famille et ma soeur pour leur soutien. J'adresse un merci très particulier à mes parents:
merci pour votre soutien et votre confiance. Merci à ma mère pour ses conseils avisés.
Table des matières:
ln trodu~tion générale ... .. 1
Chapitre 1: LE STANDARD DE COMPRESSION VIDEO H.264/AVC ET L'ADAPTATION DES CONTENUS PAR TRANSCODAGE OU SCALABILITE I. Introduction ... 5
II. Le codeur vidéo type et les standards précédant H.264 / AVC ... 6
A. Le codeur et le décodeur vidéo types ... 6
B. L'historique des standards de compression et leurs utilisations ... 8
III. Le codee H.264/ AVC ... 10
A. Les outils du standard H.264/ AVC ... 10
1) La prédiction intra (A) ... 10
2) La prédiction de mouvement (A) ... 11
3) La transformée entière, le scaling et la quantification uniforme (B,C) 12 4) Le codage entropique adapté au contexte ... 14
5) La couche NAL ... 14
6) Le data partitioning ... 15
7) Les profils ... 16
B. Les performances ... 17
IV. Le transcodage ... 18
v. A. La conversion de standards ... 19
B. Le transcodage temporel. ... 19
C. Le transcodage spatial ... 20
D. Le transcodage en qualité ... 21
1) Transcodage en boucle ouverte /fermée ... 21
2) Transcodeurs par re-quantification ... 22
3) Transcodeurs par sélectivité fréquentielle ... 25
4) Conclusion sur les transcodeurs en qualités ... 26
L'extension scala ble de H.264 1 AVC : SVC ... 27
A. 1) 2) 3) 4) B. 1) 2) C. 1) 2) D. 1) 2) La scalabilité de manière générale ... 27
Historique ... 27
Un codeur scala ble type ... 27
Le cahier des charges de SVC ... 28
Motivations de H.264/ SVC ... 28
H.264 SVC ... 29
H.264 / SVC en général.. ... 29
Les applications ... 30
La scalabilité spatiale et temporelle avec H.264/SVC ... 32
Scalabilité temporelle et performances ... 32
Scalabilité spatiale et performances ... 35
La scalabilité en qualité ... 36
Le codage scalable en qualité avec H.264/SVC ... 36
La prédiction inter couches ... 37
4) E.
Le MOS et les images clés ... 42
Les performances de H.264 SVC en haute résolution ... 46
VI. Conclusion ... 4 7 Chapitre 2 : LA TRANSMISSION DES SIGNAUX SUR ADSL2 ET L'ETAT DE L'ART DE LA DIFFUSION DE CONTENUS VIDEO I. Introduction ... 49
II. Les systèmes de transmission sur paire torsadée ... 49
A. Les premières transmissions bas débit et les besoins en Haut Débit 49 1) Les transmissions bas débit ... 49
2) Les besoins en haut Débit et les différentes solutions ... 50
B. Les technologies DSL ... 50
1) Le RNIS ... 50
2) HDSL: 0991.1 ... 51
3) ADSL:0.992.1et2 ... 51
4) ADSL2 : G992.3 et 4 ... 52
5) ADSL2+ : 0992.5 ... 54
6) VDSL : 0993.1 ... 55
III. Le canal de transmission ADSL : description et modélisation ... 55
A. Le canal de transmission : la paire torsadée ... 55
1) Les lignes téléphoniques et leurs caractéristiques ... 55
2) Les modes de transmission ... 57
3) Les sources de perturbation ... 58
B. Modélisation de la fonction de transfert. ... 60
1) La modélisation par quadripôle ... 60
2) Les modélisations normalisées ... 61
3) Les modèles de ligne de l'ETSI. ... 61
C. Modélisation du bruit ... 64
1) Modélisation du NEXT : G 1 ... 65
2) Modélisation du FEXT :G2 ... 66
3) Modélisation des sources de bruit G3 à 08 ... 67
4) Modélisation du bruit total.. ... 67
IV. Le système ADSL2 ... 69
A. La sous-couche PMD ... 69
1) La capacité du canal uniforme et non uniforme ... 70
2) La modulation DMT ... 71
3) Le water filling et l'allocation des puissances et des bits ... 80
4) L'algorithme d'allocation des bits et des puissances utilisé ... 82
5) Les codes en treillis ... 86
6) L'organisation en supertrames ... 87
B. La sous-couche PMS-TC ... 87
1) Le fonctionnement de la couche PMS-TC ... 87
2) Le codage canal de Reed salomon ... 89
C. La sous-couche TPS-TC ... 92
V. La transmission de vidéo sur ADSL et la problématique de la zone de couverture ... 93
A. Les couches supérieures à L'ADSL ... 93
1)
2)
B.
c.
Les modes d'encapsulation usuels de la vidéo ... 93
Le mode retenu ... 93
Les offres triple play ... 94
La problématique de la zone de couverture ... 96
VI. Conclusion ... 97
Chapitre 3 : TRANSMISSION OPTIMISEE D'UN FLUX H.264/ AVC HAUTE DEFINITION SUR LIEN ADSL I. Introduction ... 99
II. Le scénario de transmission ... 100
A. Les séquences de test ... 100
B. Les flux vidéos encodés ... 104
III. La zone d'éligibilité initiale ... 104
A. Le calcul des distances initiales d'éligibilité ... 104
B. Résultats ... 106
IV. Le transcodeur proposé ... 107
v. A. Principe ... 107
B. Performances du transcodeur ... 108
A. B. c. 1) Evolution du débit en sortie du transcodeur ... 108
2) Evolution de la qualité en sortie du transcodeur ... 111
L'extension d'éligibilité ... 117
Principe ... 117
Algorithme d'optimisation ... 118
Résultats ... 119
VI. L' extens10n e 1g1 1 lte en 1-reso u 10n ... .. . d"l" 'b'l' - b' - 1 t' 123 A. B. 1) 2) C. Principes de la bi-résolution ... 123
Système considéré ... 124
La création des flux haute et basse priorité ... 124
Synoptique d'une transmission bi-résolution ... 126
Performances en termes de distorsion de transcodage ... 127
VII. Conclusion ... 130
Chapitre 4: EXTENSION DE LA ZONE D'ELIGIBILITE GRACE A UNE SOLUTION HYBRIDE BASEE SUR LA SCALABILITE ET LE TRANSCODAGE I. II. A. B. c. Introduction ... 133
Le scénario considéré ... 133
Le scenario considéré et les solutions proposées ... 133
Les paramètres de transmission ... 135
. Les paramètres de codage des flux vidéos SVC ... 136
III. Les méthodes d'adaptation de débit ... 137
A. 1) 2) 3) B. La réduction de débit par scalabilité ... 137
La scalabilité MGS ... 137
L'outil d'adaptation ou l'outil d'extraction de NALu ... 139
La qualité en sortie de l'outil d'extraction ... 141
Le transcodage de la couche de base ... 142
A. Les résultats ... 143
B. Analyse en termes de qualité ... 146
1) Extraction et transcodage ... 146
2) Transcodage de la couche de base et transcodage du flux AVC ... 147
3) L'extension par transcodage pour Mobcal à 1900 et 2000 mètres ... 147
C. Analyse en termes d'extension d'éligibilité ... 148
1) L'influence du modèle de ligne sur la solution proposée ... 148
2) Le critère d'arrêt ... 148
V. L'influence de la taille de la couche de base ... 151
A. Les paramètres de la simulation ... 151
B. Les résultats ... 152
1) L'analyse en termes de qualité ... 155
2) L'analyse en termes d'éligibilité ... 155
VI. Implémentations des méthodes étudiées au sein des systèmes de transmission actuels ... 158
A. Conséquences au niveau du serveur de contenu ... 158
B. Conséquences chez l'abonné ... 158
C. Conséquences au niveau du DSLAM ... 158
VII. Conclusion ... 159
Chapitre 5: PROPOSITION D'UNE SOLUTION DE PROTECTION INEGALE D'UN FLUX VIDEO H.264/SVC MGS POUR L'EXTENSION D'ELIGIBILITE VIDEO SUR ADSL OPTIMISEE EN TERMES DE QUALITE I. Introduction ... 161
II. Analyse des performances de SVC en fonction de la résolution ... 161
A. Description du scenario ... 162
B. Les résultats de l'étude ... 165
1) Résultats pour QPg=35 et QPA=25 ... 165
2) Influence du paramètre de quantification de la couche d'amélioration ... 167
3) Résultats pour un paramètre de quantification de base égal à 25 168 4) Résultats pour des couches de base de qualité identiques ... 169
5) L'influence de la définition du contenu à coder sur les performances du codeur scalable ... ~ ... 170
III. L'extension d'éligibilité de la vidéo sur ADSL : Protection inégale des données scala bles ... 171
A. Scénario étudié ... 171
1) Les paramètres de simulation ... 171
2) Le scenario bi-résolution (ou UEP) ... 173
B. L'évaluation de la solution proposée ... 182
1) Les éligibilités initiales ... 182
2) La solution EEP ... 182
C. Les résultats obtenus ... 183
1) Les résultats en termes de nombre de NALus éliminées et d'extension d'éligibilité ... 184
2) Evaluation en termes de qualité ... 190
3) Conclusion sur la solution proposée ... 193 IV. Conclusion ... 194
Conclusion générale et perspectives ... 195
Table des figures
Figure 1-1. Schéma bloc d'un codeur vidéo ... 6
Figure 1-2. Les pixels adjacents utilisés dans la prédiction intra ... 11
Figure 1-3. Transformée et quantification des macroblocs intra 16x16 ... 13
Figure 1-4. NALu d'une image H.264/AVC ... 15
Figure 1-5. Profils principaux de H.264/AVC de [RIC03] ... 16
Figure 1-6. Evolution du PSNR selon le débit pour différents codees d'après [SULOSJ ... 18
Figure 1-7. Le transcodage vidéo ... 19
Figure 1-8. Illustration de l'erreur de prédiction pour une image Intra codée avec H .264 j AVC et transcodée en boucle ouverte. (gauche) image originale (droite) Image transcodée ... 22
Figure 1-9. CPD Transcodeur d'après [LEF06] ... 24
Figure 1-10. Performances des algorithmes de transcodage par re- quantification d'après [LEF06] ... 24
Figure 1-11. Sélectivité fréquentielle par niveau ... 25
Figure 1-12. Sélectivité fréquentielle par position ... 25
Figure 1-13. Performances des algorithmes de sélectivité fréquentielle en boucle ouverte ... 26
Figure 1-14. Schéma d'un codeur scalable en qualité type ... 28
Figure 1-15. Continuité de service en environnement mobile d'après [HHI-2] ... 31
Figure 1-16. Eligibilité sur ADSL de [KOU08] ... 32
Figure 1-17. GOP hiérarchiques (a) quatre niveaux - dyadique (b) 3 niveaux - non dyadique ... 33
Figure 1-18. Efficacité de codage avec les GOP hiérarchiques d'après [HHI-2] ... 35
Figure 1-19. Scalabilité spatiale- comparaison AVC de [HHI-1] ... 36
Figure 1-20. Schéma bloc d'un codeur SVC en qualité à deux couches ... 37
Figure 1-21. Scalabilité CGS - Performances d'après [HHI -2] ... .40
Figure 1-22. Scalabilité CGS- performances d'après [SCH07] ... .40
Figure 1-23. Comparaison CGS vs transrating d'après [LIU08] (a) Bus en QCIF et (b) Fore man en CIF ... 42
Figure 1-24. GOP hiérarchique ... 43
Figure 1-25. Concept des images clés d'après [HHI-1] ... 44
Figure 1-26. Relations de prédiction SVC d'après [SCH07] ... .45
Figure 1-27. Performances des différentes relations de prédiction d'après [SCH07] ... 45
Figure 1-28. Tests subjectifs scalabilité spatiale - Haute Définition d'après [HHI-1] ... 46
Figure 1-29. Dé bit distorsion pour scalabilité spatiale HD d'après [HHI -1] .. 4 7 Figure 2-1. Schéma bloc d'un système DSL classique d'après [FUN06-2] .... 50
Figure 2-2. Multiplexage fréquentiel ADSL d'après [OBL] ... 52
Figure 2-4. Spectre ADSL2 de [DSL03] ... 54
Figure 2-5 Débit en fonction de la distance ADSL2 et ADSL 2 d'après [DSL03] ... 55
Figure 2-6. Illustration de l'effet des load coils ... 57
Figure 2-7. Diaphonie NEXT et FEXT ... 58
Figure 2-8. Schéma électronique d'un quadripôle ... 60
Figure 2-9. Modèles de ligne européens de [ITU01] ... 62
Figure 2-10. Fonction de transfert en fonction de la fréquence pour le modèle 1 ... 63
Figure 2-11. Fonction de transfert des différentes modèles pour une distance de 2300 mètres ... 63
Figure 2-12. Les sources de perturbations dans la modélisation du bruit par l'ET'SI de [ETS02] ... 64
Figure 2-13. PSD G1 pour modélisation du NEXT- modèle B ... 66
Figure 2-14. PSD G2 pour modélisation du FEXT- modèle B ... 67
Figure 2-15. Bruit ramenés à l'entrée :(a) loop 1 , 0 perturbateur (b) loop 1 , 1000m ... 68
Figure 2-16. Sous-couches du système ADSL2 ... 69
Figure 2-17. Constellations QAM : la 16-QAM avec mapping de gray ... 72
Figure 2-18. Synoptique de la modulation DMT ... 73
Figure 2-19. Représentation d'un symbole DMT en temps et en fréquence .. 74
Figure 2-20. Synoptique complet chaine ADSL. ... 74
Figure 2-21. Illustration de l'interférence entre symboles ... 7 5 Figure 2-22. L'intervalle de garde et les lES ... 75
Figure 2-23. Illustration du régime transitoire ... 76
Figure 2-24. Représentation spectrale avec IEC ... 77
Figure 2-25. Solution à l'IEC ... 77
Figure 2-26. 16-QAM symbole émis {vert) symbole reçu (rouge) symbole détecté (orange) ... 78
Figure 2-27. Principe du Water filling: illustration ... 81
Figure 2-28. Classement des bruits ramenés à l'entrée et différents niveaux de water filling ... 83
Figure 2-29. Structure de la supertrame ... 87
Figure 2-30. Organisation de la couche PMS-TC ... 88
Figure 2-31. Trame de données concaténée après redondance FEC ... 88
Figure 2-32. Trame de données après entrelacement ... 88
Figure 2-33. Multiplexage des données pour deux trajets de latence, fabrication de la trame de données ADSL ... 89
Figure 2-34. Performances des différents codes RS ... 91
Figure 2-35. Exemple d'entrelacement d'après [FUN06-3] ... 91
Figure 2-36. Synoptique général des trois sous-couches ADSL pour deux flux ATM en entrée ... 92
Figure 2-37. Encapsulation de la vidéo retenue ... 94
Figure 3-1. Synoptique de la solution proposée ... 100
Figure 3-2. Classification en deux groupes des séquences selon leurs indicateurs SI et TI ... 102
Figure 3-3. Illustration des séquences vidéos utilisées et classification après caractérisation ... 103
Figure 3-4. Détermination de la distance d'éligibilité ... 105
Figure 3-5. Schéma bloc du transcodeur proposé ... 108
Figure 3-6. Exemple de débit en sortie du transcodeur pour la séquence Shields ... 109
Figure 3-7. Débits moyen en sortie du transcodeur et écart type pour les dix séquences lorsque PBPintra =PB Pinter ... 110
Figure 3-8. Evolution du débit moyen en fonction de PBPintra et PBPinter ... 110
Figure 3-9. Evolution de l'EQM pour la séquence Shields ... 111
Figure 3-10. Notes VQM quand l'un des PBP est fixé à 16 et l'autre varie de 1 à 16 (gauche) Parkrun (droite) Mobcal ... 112
Figure 3-11. EQM en sortie du transcodeur pour les dix séquences. PBPintra==PBPinter ... 115
Figure 3-12. EQM normalisée moyenne ... 115
Figure 3-13. Erreur absolue de modélisation (a-b) sans normalisation (c-d) avec normalisation ... 116
Figure 3-14. Synoptique du système ... 118
Figure 3-15. Déroulement de l'optimisation ... 119
Figure 3-16. Extensions d'éligibilité pour les différentes lignes (a) sans et avec les perturbateurs dans le cas de la transmission de la séquence Shields ... 120
Figure 3-17. Couples (PBPintra, PBPinter) choisis pour chaque nouvelle extension d'éligibilités sur le modèle de ligne1 sans perturbateurs ADSL.121 Figure 3-18. Exemple illustratif de la qualité avec a) PBPintra =2 , b) PBPintra =3 ... 122
Figure 3-19. Evolution des distorsions de transcodage, de transmission et totale en fonction du débit ... 124
Figure 3-20. Image reconstruite à partir des partitions A et B ... 125
Figure 3-21. Synthèse des flux haute et basse priorité ... 125
Figure 3-22. Synoptique du système pour le cas bi résolution ... 126
Figure 3-23. Extension 1 de la zone d'éligibilité Bi-résolution: TEBTc:1QA .128 Figure 3-24. Evolution du Débit selon les deux curseurs PBPintra et PBPinter ... 129
Figure 3-25. Evolution du dé bit total en fonction de la proportion du train de base pour différentes lignes ... 129
Figure 4-1. Extension d'éligibilité par transcodage ... 134
Figure 4-2. Extension d'éligibilité par solution hybride proposée ... 135
Figure 4-3. Gop hiérarchique employé ... 137
Figure 4-4. La structure de GOP détaillée ... 139
Figure 4-5. Extraction des couches ... 140
Figure 4-6. Evolution de la qualité image par image à différents points
d'extraction (30 premières images de CrowdRun) ... 141
Figure 4-7. Extension éligibilité obtenue pour les deux solutions, ... 145
Figure 4-8. Illustration visuelle de la qualité des couches de base ... 14 7 Figure 4-9. Extension d'éligibilité pour la séquence CrowdRun pour les modèles 1,4 et 8 ... 148
Figure 4-10 . Illsutration de la qualité recue chez l'utilisateur final : (a) Couche de base transcodée avec (3,1) ... 149
Figure 4-11. Mo bcal, couche de base tronquée à (3, 1) ... 150
Figure 4-12. CrowdRun, Evolution de la qualité en fonction de la distance ... 152
Figure 4-13. Mobcal, Evolution de la qualité en fonction de la distance ... 152
Figure 4-14. La qualité visuelle obtenue pour le transcodage des couches de bases à (3, 1) et (2, 1) ... 157
Figure 5-l. Séquences de test ... 163
Figure 5-2. Synoptique du scenario d'évaluation des performances de SVC fonction de la résolution ... 164
Figure 5-3. Evolution de la qualité pour un QPB=35 et un QPA variable. Séquence Aspen ... 167
Figure 5-4. Evolution de la qualité pour un QPB=35 et un QPA variable. Séquence Sunflower ... 167
Figure 5-5. Performances de SVC pour séquences Aspen HD-Cut ... 170
Figure 5-6. Paquetisation des données vidéo ... 1 7 4 Figure 5-7. Relations d'estimation/compensation de mouvement dans le flux ... 176
Figure 5-8. Optimisation de la solution bi-résolution ... 179
Figure 5-9. Evolution du nombre de NALu éliminées en EEP selon la distance pour la séquence Football ... 184
Figure 5-10. Evolution du nombre de NALu éliminées en EEP selon la distance pour la séquence Bus ... 184
Figure 5-11 Evolution de la taille en octet des NALu à retirer selon l'ordre d'apparition pour les séquences Football et Bus ... 185
Figure 5-12. Evolution du nombre de NALus éliminées en fonction du TEB du train complémentaire pour la séquence Football à 3400 mètres ... 186
Figure 5-13. Evolution du nombre de NALu éliminées en fonction du TEB du train complémentaire pour la séquence Bus à 3416 mètres ... 187
Figure 5-14. Evolution du nombre de NALus éliminées en EEP et bi- résolution en fonction de la distance pour la séquence Football ... 188
Figure 5-15. Evolution du nombre de NALus éliminées en EEP et bi- résolution en fonction de la distance pour la séquence Bus ... 189
Figure 5-16. PSNR image par image avec et sans train complémentaire- séquence Football. ... 191
Figure 5-17. PSNR image par image avec et sans train complémentaire- séquence Bus ... 191
Liste des tableaux :
Tableau 1- 1. Les standards de compression vidéo du groupe MPEG ... 9
Tableau 1- 2. Les standards de compression vidéo du groupe VCEG ... 9
Tableau 1- 3. Répartition du débit selon la partition et selon le type d'image ... 16
Tableau 1- 4. GOP hiérarchiques- 3 exemples ... 33
Tableau 1- 5. Interactions entre les modes de prédiction inter-couches et les éléments envoyés ... 38
Tableau 1- 6. Débits obtenus par CGS ... 40
Tableau 2-1. Les modes de transmission ... 57
Tableau 2-2. Longueurs minimales des modèles ETSI ... 61
Tableau 2-3. Algorithmes d'allocation ... 82
Tableau 2-4. Détermination de Ret P théoriques ... 85
Tableau 2-5. Surcout de débit entraîné par le codage RS ... 90
Tableau 2-6. Options de codage TV sur ADSL ... 95
Tableau. 3-1 Caractérisation spatiale et temporelle des séquences de test 102 Tableau 3-2. Eligibilité Initiale ... 106
Tableau 3-3. Taille des DFD intra et inter pour différents flux vidéo ... 113
Tableau 3-4. QP moyens retenus pour le codage des séquence de test à 8Mbitjs ... 114
Tableau 3-5. Ecart type relatifs moyens des séquences normalisées ... 114
Tableau 3-6. Nouvelles Eligibilités ... 123
Tableau 3-7. Débits possible selon le TEB pour différents modèles de ligne à 2000m ... 128
Tableau 4-1. Séquence CrowdRun, eligibilité étendue avec solution hybride ou transcodage ... 144
Tableau 4-2. Séquence Mobcal, eligibilité étendue avec solution hybride ou transcodage ... 144
Tableau 4-3. Analyse des distorions modélisées et rélles pour Mobcal à 1900 et 2000 mètres ... 14 7 Tableau 4-4. Extensions d'éligibilité ... 150
Tableau 4-5. Débits obtenus pour le codage des flux SVC avec les couches de bases à 4 et 5 Mbit/s ... 151
Tableau 4-6. Extension d'éligibilité pour la séquence CrowdRun avec une couche de base à SMbit/s(gauche) 4Mbit/s (droite) ... 153
Tableau 4-7. Extension d'éligibilité pour la séquence Mobcal avec une
couche de base à 5Mbitjs (gauche) 4Mbitjs (droite) ... 154
Tableau 4-8. Eligibilités pour les nouvelles taille de couche de base 155 Tableau 5-1. séquences de test.. ... 162
Tableau 5-2 Résultats pour Aspen ... 166
Tableau 5-3 Résultats pour Suflower ... 166
Tableau 5-4 Résultats pour Wind ... 166
Tableau 5-5 Résultats pour Touch ... 166
Tableau 5-6. Performances de SVC pour la séquence As pen avec un QP8=2 5 et un QPA=21 ... 168
Tableau 5-7. Performances de SVC pour la séquence Sunflower avec un QPB=25 et un QPA=21 ... 168
Tableau 5-8. Codage de la séquence Aspen CIF à la qualité de la full-HD. 169 Tableau 5-9. Codage de la séquence Sunflower CIF à la qualité de la full-HD ... 169
Tableau 5-10. Caractéristiques des séquences de test ... 172
Tableau 5-11. Caractéristiques de codage des séquences de test ... 173
Tableau 5-12. Eligibilité initiale des séquences avec le modèle de ligne 3 .. 182
Tableau 5-13. Extensions d'éligibilité solution ... 185
Tableau 5-14. Gains maximums obtenus pour la bi-résolution par rapport à la solution EEP ... 189
Tableau 5-15. Ecart en qualité maximal lorsque les NALu du train complémentaire sont retirées ... 192
Tableau 5-16. Gain de la bi-résolution par rapport à la solution EEP en dB ... 192
ADSL ANSI ATM ATU AVC BL CAB AC CAVLC CBR CGS CIF CM co
CNR CPDT CPL CSA DCT DFD DMT DSLAM DVB DVD EEP EL EM EQM EQMN ETSI FDD FDFR FDM FEC FEQ FEXT FGS FPGA FPS GOP HD HQAM IDR IEC lES IG
Glossaire :
Asymetrie Digital Subscriber Line American National Standard Institute Asynchronous Transfert Mode ADSL Terminal Unit
Advanced Video Coding Base Layer
Context Adaptive Binary Arithmetic Coding Context Adaptive Variable Length Coding Constant Bit Rate
Coarse Grain Scalability Common Intermediate Format Compensation de Mouvement Central Office
Channel to Noise Ratio
Cascaded Pixel Domain Transrater Courant Porteur de Ligne
Carrier Service Area Discrete Cosine Transform Displaced Frame Difference Discrete Multi-Tone
Digital Subscriber Line Access Multiplexer Digital Video Broadcasting
Digital Versatile Dise Equal Error Protection Enhancement Layer Estimation de Mouvement
Erreur Quadratique Moyenne(= MSE) EQM Normalisée
European Telecommunications Standards Institute Frequency Division Duplexing
Full Decode Full Re-encode Frequency Division Multiplexing Forward Error Correction
Frequency EQualizer Far End XTalk Fine Grain Scalability
Field Programmable Gate Array Frame Per Second
Group OfPicture High Definition Hierarchichal QAM
Instantaneous Decoder Refresh Interférence Entre Canaux Interférence Entre Symboles Intervalle de Garde
IPTV ITU JM JSVM JVT MGS Mi Mo MPEG MRA MSE NAL NEXT OFDM PBP PC PCM PMD PMS-TC POTS PPS PSD PSNR QAM QCIF QEF QP Re-ADSL RNIS RS RTP SAE SD SI SPS SSIM
svc
SVH TB TC TEB TEQ TES TFDI TI TNT TPS-TC TV TVHD UDP UEP
Internet Protocol Tele Vision
International Telecommunication Union Joint Model
Joint Scalable Video Model Joint Video Team
Medium Grain Scalability Multiple input Multiple output Moving Picture Expert Group Mixed Requantification Algorithme Mean Square Error
Network Abstraction Layer Near End Xtalk
Orthogonal Frequcy Division Multiplexing Priority Break Point
Prefixe Cyclique
Pulse Coded Modulation Physical Medium Dependant
Physical Medium Specifie -Transmission Convergence Plain Old Telephone Service
Picture Parameter Sets Power Spectral Density Peak Signal to Noise Ratio
Quadrature Amplitude Modulation Quarter CIF
Quasi Error Free
Quantification Parameter Reach extended ADSL
Réseau Numérique à Intégration de Services Reed Solomon
Real-time Transport Protocol Sum of Absolute Error Standard Definition Spatial Information Sequence Parameter Sets Structural SIMilarity Scalable Video Coding Système Visuel Humain Train de Base
Train Complémentaire Taux d'Erreur Binaire Temporal EQualizer Taux d'Erreur Symbole
Transformée de Fourier Discrète Inverse Temporal Information
Télévision Numérique Terrestre
Transport Protocol Specifie - Transmission Convergence TéléVision
TéléVision Haute Définition User Datagram Protocol Unequal Error Protection
UMA VCEG VCL VDSL VHS VOD VQM WiFi
Universal Multimedia Access Video Coding Expert Group Video Coding Layer
Very high bitrate DSL Video Home System Video On Demand Video Quality Metric Wireless Fidelity
Introduction générale
Le déploiement rapide durant ces quelques dernières années des nouveaux services de télédiffusion en haute définition (TVHD) constitue une des innovations récentes dans le domaine des communications numériques audiovisuelles. Celui-ci a été rendu possible essentiellement grâce aux avancées récentes dans le domaine des communications numériques d'une part, et des techniques de compression vidéo d'autre part. Toutefois, les nouveaux services TVHD requièrent de plus en plus de bande passante, et mettent en œuvre des technologies de plus en plus variées en termes de réseaux, format de données, équipements terminaux, ... au sein de réseaux dits hétérogènes filaires et/ ou sans fil, de telle sorte que la mise en place de ces nouveaux modes de diffusion de contenus audiovisuels haute définition constitue un véritable défi afin de satisfaire les exigences toujours plus fortes en matière de qualité de service et d'expérience.
En effet, l'utilisation des systèmes de compression vidéo, indispensables pour s'adapter à la bande passante disponible, induit des défauts typiques de codage, auxquelles viennent s'ajouter les perturbations éventuelles liées aux bruits de transmission qui auront un impact considérable sur la qualité de la vidéo distribuée perçue par l'utilisateur final. L'utilisation des systèmes de compression dits échelonnables (ou scalables) semble une solution intéressante afin de satisfaire les contraintes de qualité de ces nouveaux modes de diffusion. Ils peuvent notamment être exploités de façon conjointe avec des méthodes adaptatives de transmission afin d'assurer à l'ensemble du système de transmission à la fois une grande robustesse et une meilleure flexibilité.
Le projet ANR 2007-2010 TOSCANE (Transmission vidéo Optimisée Source/ Canal écheloNnablE)l porte sur le développement d'un système de diffusion s'appuyant sur une telle approche conjointe. Il a pour but d'améliorer la couverture globale de diffusion des contenus audiovisuels haute définition en optimisant la transmission de bout en bout, d'abord sur les réseaux filaires de type ADSL, puis sur le réseau domestique sans fil qui peut suivre
Logo TOSCANE
(WiFi en particulier) (Fig. 1). TOSCANE propose d'exploiter les nouvelles caractéristiques de robustesse et de scalabilité des standards émergents de compression vidéo numérique et d'optimiser leur utilisation au sein d'architectures innovantes de diffusion vidéo numérique basée sur une approche conjointe de source et de canal, susceptibles à terme de renouveler les services et les usages et de répondre aux futurs besoins du marché de la télévision numérique.
1 Le Consortium TOSCANE réunissait les partenaires suivants : Thomson Grass Valley, THALES Communications, LIEN Nancy, NETQOST, et IEMN. IEMN était responsable du sous-projet« Etudes Algorithmiques». La revue finale du projet s'est tenue à Rennes le 11 juin 2010.
Grâce à la scalabilité on peut envisager chez un même abonné la possibilité d'utiliser différents types de terminaux afin de visualiser un même programme ou des programmes différents. Les opérations d'adaptation et d'optimisation conjointe pourront alors être réalisées soit au niveau du central ADSL, au niveau du modem routeur de l'abonné, ou bien au niveau du décodeur.
Ce travail de thèse s'inscrit dans le cadre du projet ANR TOSCANE, et porte plus particulièrement sur l'optimisation de la transmission de flux vidéo haute définition sur ADSL2, à 1 'heure où les opérateurs télécoms et les fournisseurs de services multiplient les offres ll TV sur ADSL >>.
Vidéo MPEG-4
A b o n n é 2 -
Abonné n
~mAN
PC
~SDT'l'MDTV Vidéo
en
direct ,../f
Optimisation de la transmission vidéo du central ADSL vers l'abonné (à gauche), puis sur le réseau domestique (à droite)
L'éligibilité d'un client ADSL à un service vidéo dépend de la qualité de sa ligne. Cette qualité, ou capacité à supporter les débits nécessaires au transport de vidéos, dépend de plusieurs paramètres mais plus particulièrement de la distance séparant ce client ADSL du central téléphonique. En d'autres termes, au delà d'une certaine distance, une ligne ne pourra plus permettre la transmission d'une vidéo au débit requis avec un niveau de qualité de service donné : les clients ADSL sont alors dits« non éligibles>>. L'objectif de ces travaux de thèse est d'étudier plusieurs solutions pour étendre la zone d'éligibilité aux services de diffusion de contenus vidéo haute définition. Deux scénarios sont successivement considérés :
• Dans le premier cas dit non scalable, le flux vidéo haute définition est encodé de manière traditionnelle selon le standard H.264 / AVC (Advanced Video Coding) qui constitue aujourd'hui l'état de l'art en matière de compression vidéo.
• Dans le second cas, dit scalable, le flux vidéo haute définition à transmettre est directement encodé selon l'extension échelonnable du standard H.264/AVC, plus connue sous le nom de SVC (Scalable Video Coding).
Afin de rendre le client éligible, le débit vidéo à transmettre est adapté à la qualité de la ligne d'abonné: par transcodage dans le premier cas, puis par scalabilité dans le second. Dans les deux cas, les paramètres de transcodagejscalabilité sont optimisés en termes de qualité reçue, de
Le manuscrit se décompose en cinq chapitres. Le premier chapitre donne un aperçu des techniques de compression vidéo mises en œuvre dans le cadre de la thèse. L'accent est mis sur le standard de compression vidéo H.264 j AVC et ses outils de codage spécifiques, ainsi que sur l'extension scalable de ce dernier, connue sous le nom de SVC (Scalable Video Coding).
Une partie de ce chapitre est également consacrée aux techniques les plus récentes de transcodage vidéo. Le second chapitre présente un état de l'art des techniques ADSL de transmission de données numériques haut débit sur ligne téléphonique. Les caractéristiques physiques du canal de transmission sont décrites en détail, puis la chaine complète de transmission ADSL est présentée en insistant sur la modulation multi- porteuses utilisée ainsi que l'allocation adaptative des bits et de la puissance sur les différents sous-canaux ADSL. Le chapitre se termine par une présentation des services actuels de diffusion vidéo sur ADSL (solutions IPTV), qui permet d'introduire la problématique de la zone de couverture limitée de ces derniers.
Le troisième chapitre présente la première contribution de ce travail de thèse. Il s'agit d'une solution originale permettant d'étendre la zone d'éligibilité des services IPTV dans le cas d'une transmission de flux haute définition compressés suivant H.264/ AVC sur ADSL2. Les données vidéo transmises sont protégées de manière égale (transmission EEP) pour une transmission dite quasi sans erreur. L'extension de zone d'éligibilité s'appuie sur une adaptation du débit vidéo à la ligne d'abonné par transcodage du flux vidéo entrant. Un transcodeur H.264 a été développé ; ses caractéristiques ainsi que ses performances sont décrites en détail. Les paramètres de transcodage ainsi que les paramètres de transmission (répartition des bits et de la puissance) sont optimisés afin de minimiser l'impact visuel pour l'abonné final de la distorsion due au transcodage. Les résultats obtenus montrent que grâce à la solution proposée, l'éligibilité initiale est étendue de 1,2 Km en moyenne sur les différentes lignes testées, avec une qualité visuelle résultante tout à fait acceptable.
Dans les deux derniers chapitres, nous considérons maintenant que le flux vidéo haute définition entrant est compressé suivant l'extension échelonnable SVC, dans le cas d'une scalabilité SNR du type MGS. Le quatrième chapitre propose d'abord une solution basée sur une approche de réduction de débit hybride (scalabilité MGS appliquée sur la couche d'amélioration, puis transcodage de la couche de base), cette solution permet d'améliorer la qualité des vidéos reçues avec des valeurs de PSNR jusqu'à 3dB supérieures. Le dernier chapitre commence par une évaluation des performances atteintes en scalabilité en qualité selon la résolution spatiale considérée. Cette étude montre que les gains obtenus en termes de qualité sont relativement modestes pour les séquences de résolution élevée. Nous proposons ensuite une approche bi-résolution, où le flux vidéo SVC est scindé en deux parties d'importances variables. Une protection inégale des flux de données vidéo obtenus est ensuite appliquée en fonction de leur importance, en adaptant le mode de transmission utilisé, et le choix des porteuses dans la répartition des données haute ou basse priorité. Dans une première approche, la proposition retenue est validée pour des séquences
vidéo au format CIF. Celle-ci permet d'améliorer les performances en qualité obtenues en comparaison avec une approche du type EEP, pour des accroissements de zone de couverture géographique dans le cas d'une transmission de données vidéo sur ADSL depuis un central téléphonique jusque l'abonné identiques.
Nous proposons, pour terminer, des perspectives de poursuite et des pistes d'amélioration de ce travail.
Chapitre 1 :
LE STANDARD DE COMPRESSION VIDEO H.264/AVC ET L'ADAPTATION DES CONTENUS
PAR TRANSCODAGE OU SCALABILITE
1. Introduction
Les transmissions de vidéo sur des supports comme l'ADSL ont été permises grâce aux techniques de compression vidéo. En effet, la transmission d'une séquence vidéo non compressée, de résolution standard nécessiterait des débits supérieurs â 100 Mbitjs. Avec la compression vidéo, ces débits sont typiquement réduits à 1.5 Mbitjs. Pour y parvenir le codage des vidéo sera donc réalisé avec pertes c'est-à-dire, qu'après compression, la vidéo ne pourra pas être reconstruite identique à l'originale. La compression vidéo repose sur deux nécessités fondamentales et contradictoires : un débit toujours plus faible et la meilleure qualité possible. Ces deux aspects sont contradictoires car la meilleure qualité possible ne peut être obtenue qu'en allouant suffisamment de ressources pour transmettre l'ensemble des éléments composant la vidéo. La notion de compromis entre ces deux paramètres définit la problématique de la compression :jusqu'où compresser la vidéo tout en conservant une qualité acceptable ?
Une vidéo non compressée est constituée d'une succession d'images fixes. Elles sont capturées à une certaine fréquence image variant classiquement entre 15 à 60 images par seconde ou fps (frame per second).
Chacune des images est découpée en un certain nombre de colonnes et de lignes, chaque cellule ainsi créée est appelée pixel. Le nombre de pixels contenus sur chaque ligne et chaque colonne définissent la résolution de la vidéo. Par exemple, une vidéo en CIF (Common Intermediate Format) aura 288 lignes et 352 pixels par ligne. Les différentes résolutions usuelles sont rappelées en Annexe 1.
La compression vidéo réduit efficacement les quatre types de redondances présents dans le signal vidéo. Tout d'abord, au sein d'une image, des zones plus ou moins uniformes peuvent être distinguées. Il existe une redondance spatiale de l'information à coder. Deuxièmement, pendant une seconde, un grand nombre d'image est capturé. Un objet en mouvement sera très probablement situé à une position proche dans deux images successives, les informations sont redondantes temporellement. La prédiction de mouvement aura pour rôle de réduire ce type de redondance. Ensuite, le système visuel humain (SVH) est inégalement sensible aux fréquences spatiales d'une image. En effet, plus la fréquence spatiale augmente moins la sensibilité de l'œil est importante. Il existe des redondances psycho-visuelles.
Le dernier type de redondance exploité dans les codeurs vidéo est lié au codage de l'information en un flux binaire. En effet, certaines valeurs à coder arrivent plus fréquemment que d'autres. Les informations à coder sont statistiquement redondantes.
Chapitre 1 :Le standard de compression vidéo H.264/ AVC et l'adaptation des contenus par transcodage ou scalabilité
Dans ce chapitre, nous présentons dans un premier temps les différentes étapes d'un codeur vidéo type et nous donnons un bref historique des codees précédant H.264/ AVC. Nous présentons ensuite les outils du codeur H.264/ AVC et en particulier ceux que nous utiliserons dans ces travaux. Les transmissions de vidéo s'effectuant, à l'heure actuelle, sur des réseaux de transmission à bande passante variable et à destinations de terminaux très hétérogènes (en résolution spatiale et temporelle), les besoins en adaptation de contenus se sont fortement accrus. Nous présentons donc deux outils d'adaptation de contenu vidéo: le transcodage et la scalabilité, dans le cas de vidéo H.264 / AVC. Etant donné qu'avec l'application ciblée nos travaux nécessite l'adaptation de la vidéo aux caractéristiques de la ligne d'abonné ADSL, nous présenterons plus en détail le transcodage et la scalabilité en qualité.
Il. Le codeur vidéo type et les standards précédant H.264/AVC
Les codeurs ayant historiquement précédé H.264/AVC possédaient une architecture similaire principalement basée sur des étapes de transformée et d'estimation/ compensation de mouvement. Nous présentons dans un premier temps les diverses étapes du codage d'une vidéo avant de balayer rapidement les spécificités des codeurs précédant H.264/ AVC.
A. Le codeur et le décodeur vidéo types
Les différentes étapes du codeur vidéo sont représentées sur la Figure 1-1.
Chaque image de la vidéo subit tout d'abord le découpage en bloc et les blocs ainsi crées sont codés successivement. C'est le premier moyen de réduire les redondances spatiales.
Prédiction A
Transformée B
Quantification
c
Codage
-r---IIIJo~l entropique D ' - - - 1 ' _______ . . . ______ - L - - - . . . . 1
: Quantification·' :
! E :
: = = = • Transformée·' ' = = = t= = =
=:
= ~ J' '
' F '
L - - - -_:~
~--, 1
•' "---... ,1,+
-<4----! Mémoire ~
---r"" d'\
: d'images -,(); + --- _:_::al!imiGiill!ilill!lllllid..---_t
Figure 1-1. Schéma bloc d'un codeur vidéo
On distingue deux types de codage: le codage intra-image appelé