• Aucun résultat trouvé

Sommaire français. Introduction

N/A
N/A
Protected

Academic year: 2022

Partager "Sommaire français. Introduction"

Copied!
12
0
0

Texte intégral

(1)
(2)

Sommaire français

Introduction

L'évolution de la technologie des caméras, des appareils mobiles, des écrans, etc., conduit à augmenter l'utilisation de ces appareils électroniques. Par exemple, aujourd'hui, les on préfère utiliser des vidéos dans les activités quotidiennes. Ces activités comprennent des appels vidéo et des messages, enregistrant des vidéos pour les souvenir, CV enregistré en vidéo, etc. Par conséquent, et selon le rapport de Cisco [1], la vidéo IP trafic représente 70% de l'ensemble du trafic IP en 2015 et devrait augmenter jusqu'à 82%. En outre, selon la prévision de Cisco [2], les téléchargements de vidéos sur Internet et le streaming sont les applications principales qui devraient avoir 80% de la bande passante, par 2020, de tous les trafics sur Internet. Il est également rapporté que le réseau de distribution de contenu (CDN) est la manière dominante pour la diffusion des vidéos. 61% de tous les trafics vidéo sur Internet a passé les CDN en 2015 et devraient atteindre 73%. Comme les gens sont maintenant connectés à différents types de réseaux en particulier à Internet en utilisant différents appareils (ordinateurs, téléviseurs, portables appareils, ... etc.), ils exigent des vidéos de haute qualité. En outre, les exigences incluent des contenus immersifs ainsi que de la haute définition (UHD), de la haute dynamique (HDR) et des vidéos 360o. La livraison (de la capture à l'utilisateur final) d'une telle qualité est un défi. Cela nécessite d'économiser de la bande passante en utilisant de bons codeurs, produisant des flux robustes à envoyer sur des canaux sujets aux erreurs, la capacité de récupérer des erreurs et enfin une estimation de bonne qualité pour les vidéos perçues.

En effet, il existe différents types de contenus de séquence vidéo tels que des événements sportifs, des nouvelles, scène naturelle, films, ordinateur - généré, et des séquences de dessins animés. Chacun de ces types de contenu peut être divisé en sous-catégories. Chaque contenu a ses propres caractéristiques et des caractéristiques de contenu sous-jacentes qui rendent le contenu vidéo différent des autres contenus. La livraison de contenus vidéo avec une qualité qui satisfait les utilisateurs finaux est un défi. Une façon d'améliorer l'état de l'art de chaîne de livraison de la vidéo est de profiter des caractéristiques du contenu de la vidéo. La grande variété de contenu de la vidéo pose un défi pour la recherche fondée sur le contenu puisque, bien sûr, les scènes naturelles diffèrent des scènes sportives et les scènes sportives diffèrent des dessins animés, etc. Par conséquent, compte tenu des types de contenu et leurs caractéristiques correspondantes sont très importantes dans de différents aspects. Premièrement, lors de la mise en place d'une expérience subjective ; dans [3-5], Video Quality Experts Group (VQEG) et Pinson et al. ont mentionné certaines limitations à la sélection de la source vidéo pour mener des recherches. Deuxièmement, dans l'amélioration des mesures objectives de la qualité vidéo ; dans [6-8], les fonctionnalités de contenu vidéo sont analysées pour améliorer la mesure de la qualité de la vidéo. Troisièmement, dans l'amélioration de l'efficacité du codage vidéo ; ça peut être conclu à partir de l'expérience subjective de Pitrey et al. [9] que le contenu de la vidéo influence le codage vidéo. Quatrièmement, dans la conception des outils de résilience d’erreur : dans [10-13], les algorithmes de commutation qui utilisent les fonctions de contenu sont utilisés pour décider quelle technique de dissimulation d'erreur devrait être appliquée.

Par conséquent, l'objectif principal de ce mémoire est de prendre les avantages des fonctionnalités / indicateurs de contenu pour améliorer la chaîne de livraison vidéo dans aspects différent. La chaîne de livraison comprend, dans ce mémoire, un processus de pré-codage, une erreur la résilience, la dissimulation d'erreur et l'évaluation de la qualité.

Processus de pré-codage

L'objectif de tout codeur est de réduire la taille du fichier vidéo pour cibler un budget de bitrate spécifique. La dernière norme de codage vidéo, haute efficacité de codage vidéo (HEVC) [14], est spécialement conçu pour cibler différents types d'applications et en particulier des applications vidéo de haute résolution [15]. La qualité, le bitrate et la complexité

(3)

(temps de codage) sont les éléments clés de l'évaluation de la performance du codage vidéo. La complexité de l'HEVC est augmentée en raison des nouveaux outils de codage améliorés. Cette complexité est une responsabilité pour certains utilisateurs ciblés, pour certaines applications ou pour certains périphériques. Certains utilisateurs ciblés, comme les fournisseurs de contenu, ne se soucient pas de la complexité, car ils ont le pouvoir de construire des codeurs de haute performance, à savoir les codeurs parallèles. Certaines applications (applications de sûreté et de sécurité) exigent que les vidéos capturées soient rapidement codées et envoyées. En raison de la puissance de calcul limitée et des batteries de certains appareils, la complexité est un problème important. Cette thèse vise cette question et examine l'impact de l’utilisation des caractéristiques de contenu afin de réduire l'effet de la complexité.

Résilience d'erreur

Les caractéristiques du système de transmission vidéo dépendent du type d'application. L'application en temps réel utilise des systèmes basés sur RTP / UDP, car elle convient à des applications avec un retard faible, tandis que les applications basées sur le téléchargement progressif utilisent des systèmes basés sur HTTP / TCP car c'est un protocole fiable. Dans [16], les auteurs résument ces technologies système à:

RTP [16], est un protocole de transport en temps réel développé par Internet Engineering Task Force (IETF) et est utilisé sur UDP.

MPEG-2 Systèmes [17]. Il est utilisé dans les systèmes de diffusion comme IPTV.

L’ISO Base format média [18] et MPEG-DASH, Dynamic Adaptive Streaming sur HTTP, [19]. Ils sont utilisés en streaming vidéo à la demande, téléchargement progressif et HTTP streaming sur Internet. Pour plus d'informations sur les principes et les concepts standard, les lecteurs sont invités à se référer à [20-23].

La qualité de la vidéo décodée peut ne pas être satisfaisante si un ou plusieurs paquets sont perdus dans les canaux sujets aux erreurs. L'objectif principal du codage vidéo comme le codage vidéo haute efficacité (HEVC) [14] est de minimiser la distorsion de codage pour un bitrate cible. Cela nécessite un processus de prédiction complexe pour supprimer les informations redondantes dans le signal vidéo [15]. En conséquence, la résilience d'erreur dans l'HEVC est diminuée par rapport à l'H.264 / AVC en raison de l'augmentation de la dépendance temporelle [24]. Les méthodes de protection d'un flux compressé [25] peuvent être classées en trois catégories : l’erreur de résilience, le codage de contrôle d'erreur et dissimulation d'erreur. Il est indiqué dans [25] que "l'erreur de résilience se réfère à des schémas qui introduisent des éléments élastiques d'erreur au stade de la compression vidéo, ce qui réduit les interdépendances du flux de données afin d'atténuer la propagation des erreurs". La propagation des erreurs est un phénomène lorsque des trames successives sont affectées par une erreur de transmission unique / multiple. Plusieurs techniques d'erreur de résilience sont introduites dans la littérature [26-28].

Cette thèse vise cette question et étudie l'impact de l'utilisation des caractéristiques de contenu et l'impact de l'utilisation de la bonne structure de réseau lorsque plusieurs codes de description est utilisé comme outil d'erreur de résilience. L'objectif est de : 1) réduire l'effet de la propagation d'erreur qui se produit en raison des pertes de paquets et 2) réduire la quantité de données redondantes qui doivent être envoyées.

Masquage d'erreur

L'erreur de masquage (EC) est une catégorie de méthodes pour protéger le flux compressé. L'EC est une opération passive qui ne place pas l'élément élastique dans les flux mais utilise les données vidéo correctement reçues pour récupérer les informations perdues. L'un des objectifs d'un outil de l'erreur de résilient est de faciliter le travail de l'erreur de masquage. Les techniques EC spatiales [29, 30] utilisent les pixels environnants disponibles pour reconstruire les pixels

(4)

manquants. Ils ne sont pas efficaces pour les grandes surfaces, pour les zones non constantes et en termes de complexité. Ils reconstituent habituellement la texture (comme les bords) , mais non pas la structure. Les techniques temporelles de la CE utilisent les informations de mouvement disponibles pour prédire les vecteurs de mouvement manquants (MV), par exemple en interpolant [31] ou en sélectionnant le MV qui minimise la distorsion de la correspondance latérale [32]. Malgré le fait de fournir des informations sur si la zone actuelle se déplace ou non, cette technique n'est efficace que pour les séquences à faible mouvement et lisses et pour les petites zones, car la précision des MV non prédites n'est pas garantie. Ainsi, la structure (des données copiées) est reconstruite mais pas la texture. La cible de tout algorithme d'erreur de masquage est double : reconstruire une reconstruction satisfaisante d'une zone perdue et réduire le décalage entre les blocs codés et reconstruits qui permettent de réduire l'effet de propagation d'erreur. Pour ce fait, nous devons reconstruire la texture et la structure d'une zone manquante et cela peut être fait en utilisant des techniques de peinture. Cette thèse vise cette question et étudie l'impact de l’utilisation des caractéristiques de contenu dans l’amélioration des algorithmes d'erreur de masquage de inpainting-based.

Évaluation de la qualité

La satisfaction humaine est un aspect qualité de l'expérience (QoE). La métrique connue pour mesurer la qualité de la vidéo est MSE / PSNR qui n'exerce pas nécessairement la satisfaction humaine, surtout lorsque certaines parties de la vidéo sont retardées ou dissimulées. Les chercheurs font confiance aux jugements des observateurs dans l'évaluation de la qualité vidéo, même si la construction d'expériences subjectives est très coûteuse et ne peut pas être incorporée dans les systèmes en temps réel. De nombreux efforts ont été dédiés à la mise en œuvre des mesures objectives pour évaluer automatiquement la qualité de l'image ou de la vidéo et donner des résultats très proches de ce que les observateurs humains donnent. La qualité de l'expérience (QoE) est définie dans [33] comme « le degré de plaisir ou de l'agacement de l'utilisateur d'une application ou d'un service. Cela résulte de l'accomplissement de ses attentes en ce qui concerne l'utilité et / ou la jouissance de l'application ou du service en fonction de la personnalité de l'utilisateur et de l'état actuel

". L'expérience subjective est la façon précise de juger de la qualité de la vidéo perçue. En raison de son incapacité à faire partie de la livraison de vidéo et de son temps et la consommation d'argent, des efforts ont été consacrés à la mise en œuvre des mesures objectives pour évaluer automatiquement la qualité d'image ou vidéo prenant en compte les propriétés de perception du contenu et les propriétés du système visuel humain.

Cette thèse vise différentes questions d'évaluation de la qualité vidéo. Tout d'abord, comment étudier l'accord des différentes mesures de qualité vidéo objective et l'influence des types de contenu et les conditions de codage sur cet accord. D'autre part, l'impact des caractéristiques de contenu sont étudiés afin de voir la corrélation des caractéristiques de contenu en ce qui concerne le comportement des mesures d'objectives de référence complète pour les vidéos avec sans erreurs et avec une perte de valeur. Troisièmement, la sélection des conditions de codage pour tester les mesures objectives est également étudiée. Enfin, pour atténuer les insuffisances des méthodes actuelles (corrélations et erreurs carrées moyennes) pour évaluer la performance de la mesure de la qualité vidéo, des analyses sont effectuées pour introduire de nouvelles méthodes.

Les questions principales et les contributions

Comme l'indique le sous-titre de ce manuscrit, l'objet principal de ce mémoire est d'utiliser les caractéristiques de contenu des vidéos pour améliorer la chaîne de livraison vidéo. Pour chaque composante de la chaîne de livraison de vidéo, les questions de recherche suivantes sont étudiées :

- Processus de pré-codage :

(5)

1. Les fonctionnalités de contenu génériques / globales peuvent-elles être utilisées comme indicateurs pour trouver les liens entre les caractéristiques du contenu et les paramètres des encodeurs ? Si tel est le cas, la construction d'un modèle de prédiction des paramètres d'un encodeur de contenu cohérent et de complexité est applicable. De plus, les questions de recherche secondaires suivantes sont également étudiées :

+ Comment l'encodeur se comporte-t-il en termes de complexité avec un contenu différent ? + Comment la complexité de l'encodeur est-elle liée à des différents paramètres par contenu ?

- Résilience d’erreur :

1. Quelles sont les caractéristiques du contenu qui peuvent être utilisés pour prendre l’avantage des représentations/descriptions redondantes reçues lors de l'utilisation de n-MDC avec n ≥ 4 ?

2. Avec ces caractéristiques, est-ce que la qualité de l’expérience (QoE) de la séquence vidéo reconstruite est-elle améliorée?

3. Quelles fonctionnalités de contenu aideraient à créer un schéma de MDC adaptatif ? De plus, les questions secondaires suivante est également étudiée :

+ Peut-on échanger entre la qualité et le bitrate dans les schémas MDC en n'utilisant pas toujours de schème MDC spécifique ? En d’autres termes « Est - il préférable d'utiliser la DDC, 2-MDC, ou 4-MDC pour un contenu spécifique?»

4. Comment évaluer la qualité du programme temporel-MDC ? De plus, la question secondaire suivante est également étudiée :

+ Comment profiter des protocoles TCP et UDP pour créer une bonne structure de réseau qui permet de réduire le nombre de données MDC redondantes à envoyer.

- Masquage d'erreur (Error Concealment (EC) en anglais) :

1. Quelles sont les informations, des indicateurs de contenu, qui doivent être considérés comme des entrées de l'algorithme de l'inpainting-based EC ? De plus, la question secondaire suivante est également étudiée :

+ Comment adapter l'état de l'art des algorithmes inpainting-based EC pour convenir à une communication avec un délai faible ?

2. L'observateur est-il perturbé par l'algorithme proposé sur la base de l’ECP ? Est-ce que cela est corrélé avec le DMOS?

3. Quels indicateurs de contenu peuvent aider à prédire cette corrélation ?

- Évaluation de la qualité :

1. Comment les différentes mesures de la qualité de la vidéo de référence intégrale se comportent en termes de classement pour séquences sans erreur et avec des troubles de pertes ?

2. Caractériser le comportement des mesures de qualité vidéo FR au niveau du cadre et de la séquence par rapport à la vidéo de contenu et des paramètres de codage.

(6)

3. Quel est l'impact de l'utilisation des caractéristiques de contenu basées sur les pixels dans la construction de l'apprentissage par la machine NR VQA pour des séquences sans erreur et sans perte, ainsi que des paramètres de canal et de codage ?

4. Un sous-ensemble représentatif peut-il être sélectionné à partir d'une base de données à grande échelle de sorte que cette base de données à petite échelle puisse être analysées et les conclusions tirées sur la base de données à petite échelle sont également applicables à la base de données à grande échelle ?

5. Dans le cas où le PLCC et le RMSE ne peuvent pas signaler la qualité d'un modèle, quelles autres mesures de performance que nous devons signaler cette qualité ? De plus, la question secondaire suivante est également étudiée : + Comment l'analyse de la qualité fonctionne-t-elle lorsque les sources de contenu ainsi que les HRCs sont différentes ?

Des recherches ont été menées pour utiliser les caractéristiques de contenu dans les champs mentionnés ci-dessus. Les objectifs, basés sur les questions de recherche soulevées, sont de développer des cadres, des méthodes et des algorithmes pour intégrer le contenu vidéo les fonctionnalités comme composant principal. Pour atteindre cette fin, différents types d'analyses et d'expériences (y compris des expériences subjectives) ont été menées. À la suite de ces efforts, cette thèse présente les contributions suivantes :

- Contribution # 1 : Un cadre pour prédire les paramètres du codeur au niveau de la séquence en utilisant les indicateurs de contenu a été proposé:

1. La contribution principale de ce travail est la prédiction des valeurs des paramètres d'encodage conduisant à une complexité minimale en termes de temps d'exécution en utilisant les fonctionnalités de contenu sous-jacentes. Par exemple, les caractéristiques comme la corrélation croisée, l'information à base laplacienne, la chrominance et les caractéristiques d'intensité de mouvement ont un impact fort pour trouver les liens entre les fonctions de contenu et le paramètre de l'étendue du mouvement dans l'encodeur HM, les modèles équilibrent rate (R), la distorsion (D) et la complexité (C). Par exemple, si un échantillon vidéo est codé en utilisant des configurations différentes et les vidéos sont dans les mêmes étendues de bitrates et de distorsion, la configuration qui atteignent le temps minimal de l'encodage sera choisi. Si les vidéos de sortie atteignent la même complexité et les étendues de distorsion, la configuration du bitrate le plus bas sera choisie.

- Contribution # 2 : Présentation de sensibilisation du contenu en MDC et en introduisant ensuite un contrôle de la qualité du régime de MDC qui exploite l'état de l'art des architectures des réseaux :

1. Un nouveau schéma temporel MDC qui se caractérise par une compatibilité standard, un réglage de redondance, un poids léger la complexité et l'adéquation pour les systèmes de MDN. Ce schéma inclut le processus de génération de descriptions et le processus de reconstruction des séquences vidéo lorsque les données primaires sont perdues. L'unité de codage de division et les propriétés de distance temporelle sont utilisées pour former un coefficient de pondération pour reconstruire le cadre primaire perdu à partir des cadres redondants.

2. L'expérience subjective qui montre la préférence du schéma proposé par rapport aux autres schémas MDC est introduit.

3. Un cadre adaptatif du contenu conscient pour prédire le schéma de description approprié (SDC, 2-MDC ou 4- MDC) pour être transmis sur un canal sujet aux erreurs afin de maximiser la qualité de l'expérience. Le contraste de la Gray Level Co-occurrence Matrix et le ratio d'entropie des niveaux de laplaciens 4 et 5 sont utilisés pour construire le schéma adaptatif MDC.

(7)

4. Le cadre d'évaluation de la qualité des schémas temporels MDC est proposé. Le cadre introduit une structure de réseau interactif qui permet de réduire la quantité de données redondantes à envoyer. Au cours de ce travail, toutes les étapes proposées du cadre ont été réalisées, à l'exception de l'évaluation de la qualité (subjectivement et objectivement). Ceci est dû aux limites du temps et de la puissance computationnelle.

- Contribution # 3 : L'algorithme contenu- et inpainting-adaptée EC et l'expérience subjective pour étudier la perturbation du sujet :

1. Une version modifiée de la dissimulation d'erreur basée sur l'impression [34] est proposée. Les améliorations suivantes sont atteintes dans l'algorithme proposé :

Le concept de carte de mouvement Mc est introduit. Il comprend les vecteurs de mouvement prédit Mvm, le Mpi d'intensité de mouvement pixel-based et le vecteur des intérêts de mouvement (MVI) qui sont relatifs au mouvement de la caméra Mcm. Il a été montré que la carte de mouvement proposée améliore la performance de l'inpainting.

L'algorithme est adapté pour être pratique pour les communications vidéo avec un délai faible.

Une taille de fenêtre de recherche adaptative pour l'inpainting temporelle et spatiale est introduite.

Réduire les artefacts spatio-temporels en utilisant de simples stratégies de mélange de Poisson avec la stratégie du masquage proposé.

2. Une expérience subjective qui analyse la perturbation de l'observateur lorsque des déficiences sont introduites dans la séquence vidéo. On constate que la mesure de perturbation a une corrélation élevée avec le DMOS perçu. De plus, il a été démontré que la technique inpainting-based EC réalise une meilleure qualité perçue par rapport aux techniques de l'état de l'art de la EC.

3. Trois caractéristiques de contenu sont introduites pour étudier la perturbation du sujet comme un pas vers l'avant pour aider à mesurer la qualité des vidéos dégradées perçues. Les caractéristiques sont les suivantes : la texture, la couleur et le mouvement des carte de l’entropie.

- Contribution n # 4 : Le contenu-adaptée VQA qui prédit le comportement des mesures de référence complète est proposée et un algorithme de sélection de sous-ensemble contenu est également proposé :

1. L'accord entre les trois mesures testées PSNR, SSIM et VIFP a montré que les résultats de leurs prédictions sont similaires, notamment dans la gamme de qualité élevée et faible, moins dans la gamme moyenne. Il a également été noté que le désaccord des mesures est plus prononcé en cas de perte de paquets que pour les conditions de codage qui peuvent être considérées comme une première étape vers une identification automatique de la portée de la demande de mesures objectives. Grâce à la grande taille de l'ensemble de données analysées, des effets importants sur la caractérisation de la performance ont été mis en exergue qui ne sont pas évidents lorsqu'un ensemble limité des contenus et des paramètres est considéré.

2. Le désaccord entre plusieurs mesures objectives existe sur le même niveau même si les mesures s'accordent sur un niveau de séquence. Cependant, les modèles particuliers de ce désaccord indiquent deux conclusions importantes. La première conclusion est que l'utilisation d'une seule mesure peut ne pas être suffisante. Il peut être bénéfique notamment pour analyser l'utilisation de plusieurs algorithmes complémentaires dans la boucle de codage, soit pour l’optimisation des débits de distorsion. En outre, il convient de noter que le biais de performance peut se produire lorsque des améliorations ne sont mesurés que de façon objective et n'utilisent qu'une seule méthode, ce qui affaiblit ces propositions. La deuxième conclusion est que la corrélation prononcée entre les caractéristiques du contenu et le

(8)

paramètre du codeur la sélection encourage une analyse plus approfondie, par exemple en ce qui concerne l'efficacité des algorithmes de contrôle du débit. Certains facteurs de codage ne sont presque pas influents, tandis que d'autres ont un fort impact, suggérant que la qualité des comparaisons entre les séquences sans tenir compte du comportement détaillé de la qualité sur les cadres dans la séquence elle-même pourrait être fortement trompeuse.

3. Un contenu-adaptée NR VQA est conçu pour des séquences vidéo sans erreurs et sans troubles de perte avec le codage et les caractéristiques des canaux. Il prédit le comportement de la VQA référence complète. Les caractéristiques suivantes sont trouvées utiles pour le modèle de prédiction :

Paramètres du canal : débit de perte, moyenne et longueur du burst.

Paramètres de codage : taille / type GOP, intra-période, nombre de tranches, ouvrir / fermer GOP, QP.

Paramètres de canal et de codage : nombre de cadres tapés, nombre de tranches tapés et nombre de cadres affectées.

Caractéristiques de contenu :

+ Propriétés de la matrice de co-occurrence du niveau gris, + Information de la chrominance,

+ Information spatiale et temporelle, + Corrélation croisée

+ Propriétés basées sur le DCT et sur le Laplacien, + Intensité de mouvement et

+ Descripteur d'activité de mouvement MPEG-7.

4. Deux algorithmes de sélection de sous-ensemble sont proposés. Ils visent une étendue large de cibles spécifiques

; qualité/bitrate ou cibles de contenu. Plus précisément, un ensemble à petite échelle est sélectionné dans une base de données à grande échelle de façon à ce que cette base de données à petite échelle puisse être analysée et les conclusions tirées sur la base de données à petite échelle soit appliquées également à la base de données à grande échelle.

5. Les nouvelles mesures de performance suivantes sont proposées pour les algorithmes d’apprentissage pour l'évaluation de la qualité vidéo :

Les mesures dépendent de l'analyse de l'erreur résiduelle à l'aide de PCA,

Les mesures dépendent de l'analyse des intervalles de confiance des données prédites et

Les mesures dépendent de l'analyse des intervalles de confiance des coefficients linéaires des modèles entraînés et testés.

Liste des publications

Journals

— Ahmed Aldahdooh, Enrico Masala, Glenn Van Wallendael, Marcus Barkowsky. “Reproducible research framework for objective video quality measures using a large-scale database approach”, Elsevier Digital Signal processing, soumis.

— Ahmed Aldahdooh, Enrico Masala, Glenn Van Wallendael, Marcus Barkowsky. “Framework for reproducible objective video quality research with case study on PSNR implementations”, Elsevier SoftwareX, soumis.

(9)

— Ahmed Aldahdooh, Marcus Barkowsky and Patrick Le Callet, “Proof-of-Concept: Role of Generic Content Characteristics in Optimizing Video Encoders,” Springer Multimedia Tools And Applications, soumis.

Conference

— Ahmed Aldahdooh, Marcus Barkowsky, Patrick Le Callet, and David Bull, “Inpainting-Based Error Concealment For Low-Delay Video Communication,” The 42nd IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2017), New Orleans, LA, 2017.

— Ahmed Aldahdooh, Enrico Masala, Glenn Van Wallendael, Marcus Barkowsky. “Comparing temporal behaviour of fast objective video quality measures on a large-scale database” 32nd Picture Coding Symposium (PCS 2016)., Nuremberg, Germany, 2016.

— Yashas Rai, Ahmed Aldahdooh, Suiyi Ling, Marcus Barkowsky and Patrick Le Callet, “Effect of content features on short-term video quality in the visual periphery,” 2016 IEEE Workshop on Multimedia Signal Processing (MMSP 2016), Montreal, Canada, 2016.

— Ahmed Aldahdooh, Marcus Barkowsky and Patrick Le Callet, “Content-aware adaptive multiple description coding scheme,” 2016 IEEE International Conference on Multimedia & Expo Workshops (IC-MEW), Seattle, WA, 2016, pp.

1-6. doi: 10.1109/ICMEW.2016.7574726

— Aldahdooh, Ahmed, Marcus Barkowsky, and Patrick Le Callet. “Spatio-temporal Error Concealment Technique for High Order Multiple Description Coding Schemes Including Subjective As-sessment” Quality of Multimedia EXperiences (QoMEX) 2016, International Conference on. IEEE, 2016.

— Ahmed Aldahdooh, Enrico Masala, Olivier Janssens, Glenn Van Wallendael, Marcus Barkowsky. “Comparing Simple Video Quality Measures for Loss-Impaired Video Sequences on a Large-Scale Database” Quality of Multimedia EXperiences (QoMEX) 2016, International Conference on. IEEE, 2016.1.4. PUBLICATIONS 17

— Aldahdooh, Ahmed, Marcus Barkowsky, and Patrick Le Callet. “The impact of complexity in the ratedistortion optimization: A visualization tool.” Systems, Signals and Image Processing (IWSSIP) 2015, International Conference on. IEEE, 2015.

Les références

[1] Cisco, The Zettabyte Era: Trends and Analysis, 2016.

[2] __, Cisco Visual Networking Index: Forecast and Methodology, 2015–2020, 2016.

[3] M. H. Pinson, K. Sue Boyd, J. Hooker, and K. Muntean, “How to choose video sequences for video quality assessment,” in Proceedings of the seventh International Workshop on Video Processing and Quality Metrics for Consumer Electronics (VPQM) Scottsdale, USA, 2013.

[4] VQEG, The Validation Of Objective Models Of Multimedia Quality Assessment, PHASE I 2008.

[5] M. H. Pinson, M. Barkowsky, and P. Le Callet, “Selecting scenes for 2d and 3d subjective video quality tests,”

EURASIP Journal on Image and Video Processing, vol. 2013, no. 1, pp. 1–12, 2013.

(10)

[6] J. Korhonen and J. You, “Improving objective video quality assessment with content analysis,” in Proceedings of the fifth International Workshop on Video Processing and Quality Metrics for Consumer Electronics (VPQM) Scottsdale, USA, 2010.

[7] B. Ortiz-Jaramillo, J. Niño-Castañeda, L. Platiša, and W. Philips, “Content-aware objective video quality assessment,” Journal of Electronic Imaging, vol. 25, no. 1, pp. 013 011–013 011, 2016.

[8] A. Aldahdooh, E. Masala, O. Janssens, G. Van Wallendael, and M. Barkowsky, “Comparing simple video quality measures for loss-impaired video sequences on a large-scale database,” in 2016 Eighth International Conference on Quality of Multimedia Experience (QoMEX), June 2016, pp. 1–6.

[9] Y. Pitrey, M. Barkowsky, R. Pépion, P. Le Callet, and H. Hlavacs, “Influence of the source content and encoding configuration on the perceived quality for scalable video coding,” in IS&T/SPIE Electronic Imaging. International Society for Optics and Photonics, 2012, pp. 82 911K–82 911K.

[10] D. Agrafiotis, D. R. Bull, and C. N. Canagarajah, “Enhanced error concealment with mode selection,” Circuits and Systems for Video Technology, IEEE Transactions on, vol. 16, no. 8, pp. 960–973, 2006.

[11] S. Cen and P. C. Cosman, “Decision trees for error concealment in video decoding,” Multimedia, IEEE Transactions on, vol. 5, no. 1, pp. 1–7, 2003.

[12] Z. Rongfu, Z. Yuanhua, and H. Xiaodong, “Content-adaptive spatial error concealment for video communication,”

Consumer Electronics, IEEE Transactions on, vol. 50, no. 1, pp. 335–341, 2004.

[13] S.-C. Huang and S.-Y. Kuo, “Optimization of hybridized error concealment for h. 264,” Broadcasting, IEEE Transactions on, vol. 54, no. 3, pp. 499–516, 2008.

[14] ITU, “ITU-T H.265 : High efficiency video coding,” http:// www.itu.int/ rec/T-REC-H.265-201504-I , 2013, http://www.itu.int/rec/T-REC-H.265-201504-I.

[15] G. J. Sullivan, J. Ohm, W.-J. Han, and T. Wiegand, “Overview of the High Efficiency Video Coding (HEVC) standard,” Circuits and Systems for Video Technology, IEEE Transactions on, vol. 22, no. 12, pp. 1649–1668, 2012.

[16] R. Frederick, V. Jacobson, and P. Design, “RTP: A transport protocol for real-time applications,” IETF RFC3550, 2003.

[17] ISO, “Information technology - generic coding of moving pictures and associated audio information: Systems,”

ISO/IEC, 2014.

[18] ISO/IEC, “Information technology—coding of audio-visual objects—part 12: Iso base media file format,” ISO/IEC 14496-12 (4th ed.), 2012.

[19] ——, “Information technology - dynamic adaptive streaming over http (dash) - part 1: Media presentation description and segment formats,” ISO/IEC 23009-1 (2nd ed.), 2014.

[20] A. C. Begen, T. Akgul, and M. Baugher, “Watching video over the web: Part 1: Streaming protocols,” Internet Computing, IEEE, vol. 15, no. 2, pp. 54–63, 2011.

[21] A. Begen, T. Akgul, and M. Baugher, “Watching video over the web: Part 2: Applications, standardization, and open issues,” Internet Computing, IEEE, vol. 15, no. 3, pp. 59–63, 2011.

[22] I. Sodagar, “The mpeg-dash standard for multimedia streaming over the internet.” IEEE Multimedia, no. 18, pp.

62–67, 2011.

(11)

[23] T. Stockhammer, “Dynamic adaptive streaming over HTTP-design principles and standards,” in Proceedings of the Second Annual ACM Conference on Multimedia Systems, vol. 2014. New York, USA: ACM, 2011, pp. 2–4.

[24] B. Oztas, M. T. Pourazad, P. Nasiopoulos, and V. C. Leung, “A study on the HEVC performance over lossy networks,” in Electronics, Circuits and Systems (ICECS), 2012 19th IEEE International Conference on. IEEE, 2012, pp.

785–788.

[25] L. R. Siruvuri, P. Salama, and D. S. Kim, “Adaptive error resilience for video streaming,” International Journal of Digital Multimedia Broadcasting, vol. 2009, 2009.

[26] Y. Wang, J. Ostermann, and Y.-Q. Zhang, Video processing and communications. Prentice Hall Upper Saddle River, 2002, vol. 5.

[27] S. Wenger, “H. 264/AVC over IP,” Circuits and Systems for Video Technology, IEEE Transactions on, vol. 13, no.

7, pp. 645–656, 2003.

[28] T. Schierl, M. M. Hannuksela, Y.-K. Wang, and S. Wenger, “System layer integration of high efficiency video coding,” Circuits and Systems for Video Technology, IEEE Transactions on, vol. 22, no. 12, pp. 1871–1884, 2012.

[29] Y. Wang, Q. F. Zhu, and L. Shaw, “Maximally smooth image recovery in transform coding,” IEEE Transactions on Communications, vol. 41, no. 10, pp. 1544–1551, Oct 1993.

[30] K. Meisinger and A. Kaup, “Spatial error concealment of corrupted image data using frequency selective extrapolation,” in Acoustics, Speech, and Signal Processing, 2004. Proceedings. (ICASSP ’04). IEEE International Conference on, vol. 3, May 2004, pp. iii–209–12 vol.3.

[31] M. E. Al-Mualla, N. Canagarajah, and D. R. Bull, “Error concealment using motion field interpolation,” in Image Processing, 1998. ICIP 98. Proceedings. 1998 International Conference on, Oct 1998, pp. 512–516 vol.3.

[32] W. M. Lam, A. R. Reibman, and B. Liu, “Recovery of lost or erroneously received motion vectors,” in Acoustics, Speech, and Signal Processing, 1993. ICASSP-93., 1993 IEEE International Conference on, vol. 5, April 1993, pp. 417–

420 vol.5.

[33] P. Le Callet, S. Möller, A. Perkis et al., “Qualinet white paper on definitions of quality of experience,” European Network on Quality of Experience in Multimedia Systems and Services (COST Action IC 1003), 2012.

[34] M. Ebdelli, O. L. Meur, and C. Guillemot, “Loss concealment based on video inpainting for robust video communication,” in Signal Processing Conference (EUSIPCO), 2012 Proceedings of the 20th European, Aug 2012, pp.

1910–1914.

(12)

Références

Documents relatifs

Smartphone in den Unterricht zu integrieren. Durch den Einsatz des Smartphones steigt die Kooperation zwischen der Lehrperson und den Schülern und Schülerinnen. Der

Lektionsziel(e): Die SuS werden sich durch das Lesen der Texte auf S.26, 27 ihren eigenen Hörgewohnheiten bewusst, indem sie ihre Überlegungen im Hörtagebuch eintragen. Kriterien

- Kurzvortrag „So hör ich Radio“ vorbereiten und schriftlich anhand Stichworten festhalten (W-Fragen berücksichtigen) - Foto muss eingebaut werden (Fragen können vorgegeben

En conclusion, au nom de tous ses élèves, Pierre Treyssac a été pour nous un Maître au sens original du mot et nous lui sommes infiniment reconnaissants pour tout ce qu’il nous

1.. 14 اطنتساو عمتلمجا قمع لىإ ،وق لض امك تاقلبعلا ىوتسم ىلع عمتلمجا تلاوتح ةرياسم ؿوا تُب ،تُسنلجا ـاعلا ءاضفلا ؾلبتما لجأ نم ضوافتلا لثم ديعت

Posteriormente, o acúmulo de carboidratos nas folhas devido ao desbalanço entre fonte e dreno poderia decrescer a expressão de genes ligados à fotossíntese (LI &

Tables des logarithmes à huit décimales des nombres entiers de 1 à 120000, et des sinus et tangentes de dix secondes en dix secondes d’arc dans le système de la division centésimale

Chlorinated contaminants mitigation during pyro-gasification of wastes using CaO reactant: experimental and life cycle assessment Thermal treatment of municipal solid waste MSW