• Aucun résultat trouvé

de la série télévisée «Friends»; respectivement le nombre de lignes de la matrice dans ce cas étant égal au nombre d’images représentant chaque vidéo, une très grande diversité survient pour les vidéos plus longues. De plus, la nature de la mise en scène de ces deux vidéos entraîne la présence d’un grand nombre de plans de contenus divers dans ces derniers par rapport aux deux autres vidéos.

4.7 Analyse globale des expériences

Suite aux expériences réalisées, nous constatons que l’application de notre proces-sus de construction automatique de résumés visuels basé sur le PRM produit des résumés ayant de bonnes performances par rapport à notre critère d’évaluation.

Nous ne pouvons faire une comparaison directe des performances obtenues des résumés construits en utilisant les deux représentations étudiées (histogrammes par région et histogrammes de blobs) car les vecteurs caractéristiques des im-ages construits selon ces deux représentations ne sont pas équivalents les uns aux autres. Cependant l’analyse des résultats de l’étude de similarité que nous avons effectuée indique que la représentation des images par des histogrammes de blobs est plus proche du jugement humain de la ressemblance visuelle que la représentation par des histogrammes par région.

Pour la détermination de la similarité visuelle entre deux images, nous avons étudié le cas où une classification stricte basée sur un algorithme de type k-means était utilisée et le cas où une matrice de similarité était réalisée. Intuitivement, l’utilisation de la matrice de similarité est plus proche du raisonnement humain que la l’utilisation de catégories. Dans le cas où une matrice de similarité est employée, une image i peut ressembler à un très grand nombre d’images sans aucune restriction. Par ailleurs, dans le cas où la classification est rigide, une image n’est similaire qu’aux images de sa classe. Aussi, il faut noter qu’au sein d’une même classe, deux images situées à une distance supérieure à la moitié du seuil par rapport au centroïde peuvent avoir une distance entre elles supérieure au seuil de similarité. C’est-à-dire que les images appartenant à la même classe ne sont pas nécessairement évaluées comme similaires en utilisant la matrice de similarité. De même, il est possible de trouver des couples d’images appartenant à deux classes différentes dont la distance est inférieure au seuil de similarité.

En contrepartie, la construction de résumés vidéos sans classification stricte est plus coûteuse en temps de calcul et en espace mémoire, parce que la ma-trice de similarité qui représente l’ensemble des classes doit être chargée en mé-moire durant le processus de sélection d’images représentatives. Par conséquent, l’utilisation de la matrice de similarité n’est pas adaptée à la construction de résumés de vidéos de grande taille.

4.8 Conclusion

Dans ce chapitre, nous avons détaillé notre méthodologie de construction de ré-sumés vidéos, basée sur le PRM en utilisant uniquement les informations vi-suelles. Nous avons étudié deux différentes représentations des images sous forme de vecteurs caractéristiques. La première utilise des histogrammes de couleurs par région, et la deuxième les histogrammes de blobs. De même, pour la carac-térisation de la similarité visuelle, nous avons traité le cas où une classification stricte est réalisée et le cas ou une matrice de similarité est créée. Enfin nous avons comparé et analysé les différents résultats obtenus.

Chapitre 5

Construction de Résumés Multi-vidéos

Dans ce chapitre nous nous intéressons au problème de la construction automa-tique de résumés de plusieurs vidéos simultanément; une application envisagée est par exemple la construction des résumés de plusieurs épisodes d’une même série télévisée où les mêmes acteurs sont présents dans la plupart des épisodes.

La construction de résumés indépendants ne semble pas la meilleure solution.

Dans ce cas de résumés multi-vidéos, nous proposons une extension du principe de reconnaissance maximale permettant de définir les résumés optimaux. Cette extension introduit une nouvelle expérience. Nous ferons ensuite une compara-ison de plusieurs variantes de notre méthode, ainsi que des méthodes inspirées par les travaux de deux autres groupes de recherche.

Enfin, nous présentons une expérience basée sur une évaluation réaliste. Des utilisateurs réels réaliserons la tâche de reconnaissance maximale définie dans le chapitre 3. Ils sont pour cela conviés à identifier l’origine d’une centaine d’extraits qui leur sont présentés toute en ne disposant que de l’ensemble des résumés créés par notre approche automatique de création de résumés multi-vidéos basée sur le principe de reconnaissance maximale.

5.1 Résumés Multi-Vidéos

La plupart des travaux actuels se focalisent généralement sur la construction du résumé d’une seule vidéo, seuls quelques uns se sont portés au problème

97

de résumés multi-vidéos où la prise en compte d’autres contraintes et éléments s’impose. Nous citons par exemple le fait que plusieurs informations (scènes, acteurs) sont présentes telles qu’elles sont ou d’une façon similaire dans diverses vidéos. La construction de résumés vidéos indépendamment les uns des autres peut provoquer une présence d’informations redondantes dans les résumés créés.

Des méthodes spécifiques doivent être conçues afin de prendre en considération ces similarités et produire un ensemble de résumés plus efficaces. Ainsi, le ré-sumé de chaque épisode doit contenir les éléments qui caractérisent le mieux cet épisode par rapport aux autres.

Afin de proposer une solution à ce problème, nous présentons une nouvelle approche. Cette dernière consiste à construire simultanément les résumés des différentes vidéos considérées. Ceci en prenant en compte leurs similitudes, de façon à inclure dans chaque résumé les éléments qui différencient le plus la vidéo qui lui correspond par rapport aux autres vidéos traitées.

Ce chapitre est construit de la manière suivante. Nous commençons par la présentation de l’extension de notre principe de reconnaissance maximale au cas des multi-vidéos. Ensuite nous proposons plusieurs sous-variantes de notre algo-rithme de construction et nous les comparons entre elles ainsi qu’avec deux autres algorithmes inspirés de travaux de recherche existants. Après nous analysons et discutons les résultats des différentes expériences réalisées. Une fois que les résumés sont construits, nous étudions leur robustesse. Enfin nous détaillons l’expérience réaliste d’évaluation de la qualité des résumés construits menée par des utilisateurs réels et nous concluons.