• Aucun résultat trouvé

détruit, enfin les diplomates retiennent les différents discours, les positions des états ainsi que les résultats des sondages. Il est clair que les besoins diffèrent d’un téléspectateur à l’autre, et chacun est contraint defiltrer lui même l’information qu’il désire au détriment de son temps personnel. A partir de ce simple exemple, nous relevons plusieurs questions concernant la structuration et la classification des informations, le résumé de ces dernières en fonction des besoins spécifiques des utilisateurs ainsi que la durée de leur disponibilité, sans oublier le degré de leur intérêt et leur vision des différents aspects des sujets traités par toutes ces chaînes.

En d’autres termes, ce genre de situation impose des mécanismes spécifiques et précis de filtrage des informations et ceci nous interpelle à créer et développer des outils performant pour le traitement des flux de données multimédia d’une manière générale.

Dans cette thèse nous nous concentrons sur la création et le développement d’un outil efficace parmi tous ceux nécessaires pour gérer et manipuler des bases de données multimédia. Cet outil consiste en un mécanisme qui résume le contenu d’un document multimédia. Plus particulièrement nous proposons tout au long de cette thèse des méthodes de construction et d’évaluation automatique de résumés de documents vidéos. J’insiste sur le fait que la réalisation d’un tel outil est d’une grande utilité et importance pour plusieurs raisons: il nous permet de faire une synthèse du contenu d’une vidéo après avoir fait une analyse de ses différents composants, et d’extraire des informations utiles et récapitulatives des sujets traités dans la vidéo ou bien des informations spécifiques à des questions et des propos bien définis. D’autre part la construction de résumés vidéos fait gagner aux utilisateurs un temps considérable et contribue au développement de techniques qui seront utilisées pour des applications nouvelles comme par exemple la télévision interactive.

1.2 Les contributions de cette thèse

Le cœur de cette thèse est cependant de rendre les documents vidéos plus utiles pour des utilisateurs n’ayant pas le temps nécessaire pour les visualiser et avoir une idée globale de leurs contenus respectifs. L’idée ne consiste pas à sélectionner d’une manière arbitraire des segments d’une vidéo originale ou des images clefs

pour les regrouper respectivement sous forme d’un résumé dynamique ou statique sans avoir une méthode objective loin des heuristiques ou des suppositions pour évaluer la qualité de ce résumé. Par contre notre idée de base est de définir une méthode de construction et d’évaluation de résumés vidéos optimaux par rapport à une tâche fixée préalablement. La méthode de sélection des images ou des segments composant le résumé s’inspire de la méthode d’évaluation en essayant d’optimiser la performance du résumé résultant par rapport à la tâche que nous voulons réaliser en stimulant le comportement d’utilisateurs réels lors de l’accomplissement de cette tâche réaliste.

Les contributions essentielles de notre travail peuvent être répertoriées selon quatre axes principaux. Avant de détailler ces éléments, nous exposons briève-ment quelques aspects généraux abordés tout au long de ce rapport, en d’autres termes les mots clefs représentant le contenu général de cette thèse. L’objectif principal de notre travail est de proposer une nouvelle méthode de construction et d’évaluation automatique de résumés vidéos. Sachant qu’une vidéo est composée de différents médias Vidéo, Audio et Transcription (sous-titres), nous avons pris en considération lors de cette étude uniquement la vidéo et le texte. Pour la partie vidéo nous avons traité les points suivants:

• La représentation des images composant la séquence par des vecteurs car-actéristiques du contenu visuel en utilisant seulement des descriptifs de couleur.

• Le jugement de la similarité visuelle d’une façon entièrement automatique en utilisant des mesures mathématiques.

• La sélection semi-automatique du seuil de similarité le plus adéquat à chaque vidéo considérée en fonction de la représentation des images la com-posant et la mesure utilisée.

• La construction et l’évaluation de résumés vidéos optimaux par rapport à une tâche que nous définissons et leur présentation aux usagers sous forme statique ou dynamique.

• La construction de résumés multi-vidéos où chaque résumé fait ressortir et met en valeur les spécificités de chaque vidéo par rapport aux autres vidéos traitées.

• L’ évaluation de la qualité des résumés résultants par des utilisateurs réels.

1.2. Les contributions de cette thèse 5

En ce qui concerne la partie texte, nous avons abordé ce qui suit:

• L’élimination des mots outils (très communs comme les articles,les pré-positions, etc...) et l’élaboration d’une étude probabiliste associant une information contextuelle à chaque mot.

• Pour les transcriptions en langue française, la mise en œuvre d’une étude morphologique pour le calcul des racines de mots (morphèmes) afin que l’étude de similarité ne soit pas stricte (identité).

• La construction automatique de résumés textuels.

• L’évaluation de la qualité des résumés textuels créés toujours par rapport à une tâche que nous définissons.

Enfin, nous avons combiné les deux flux vidéo et texte pour construire et évaluer d’une manière automatique des résumés vidéo-textuels.

1.2.1 Création de résumé optimal pour une tâche prédéfinie

Nous considérons notre processus de construction automatique de résumés vidéos comme étant un problème d’optimisation sous un ensemble de contraintes liées à une tâche prédéfinie. Afin d’optimiser, nous essayons de créer un résumé ayant un contenu maximal par rapport aux besoins dérivés directement par la tâche ainsi que ceux des utilisateurs intéressés par le résumé. Regarder le problème de construction automatique de résumés vidéos sous un angle d’optimisation nous garantit une évaluation objective liée à la tâche prédéfinie.

1.2.2 Construction de résumés multi-vidéos

Notre objectif principal est de construire automatiquement des résumés des doc-uments multimédia. Le plus simple pour le multi-vidéos consiste à construire de façon séparée le résumé de chaque vidéo. Cependant, cette approche ne prend pas en compte les similitudes pouvant apparaître dans les différentes vidéos, et ces résumés pourront donc contenir une certaine redondance. Pour remédier à ce problème, nous proposons une nouvelle approche qui consiste à constru-ire simultanément les résumés des différentes vidéo, en prenant en compte leurs

similitudes, de façon à inclure dans chaque résumé les éléments qui différencient le plus une vidéo par rapport aux autres vidéos traitées.

1.2.3 Réutilisation du principe de construction

Un document multimédia est composé de différents média ayant chacun ses car-actéristiques. Généralement, pour la construction d’un résumé multimédia, les médias sont analysés indépendamment puis une politique de combinaison est util-isée pour obtenir un résumé global. A chaque type de média, une méthode de sélection convenable à la nature du média est utilisée pour sélectionner les seg-ments les plus pertinents qui doivent être insérés dans le résumé global. Dans ce travail, nous proposons un Principe de Reconnaissance Maximale qui sera le noyau de chaque méthode de sélection quel que soit le type du média pris en considération. Cette réutilisation du même principe permet une cohérence entre les différents composants du document multimédia et nous permet d’affecter des explications significatives des raisons des choix des éléments composant le résumé final.

1.2.4 Combinaison du texte et de la vidéo

Une autre contribution de cette thèse consiste en l’élaboration d’une méthode de construction de résumé multimédia où les informations visuelles et textuelles sont utilisées conjointement lors de la création du résumé. Ce lien que nous créons entre les deux médias nous permet d’obtenir des résumés composés d’éléments de types différents mais complémentaires. Dans ce cas, l’optimisation du résumé global par rapport à la tâche définie prend en compte les différents média simul-tanément.