Description des états de l’art - THESE POUR OBTENIR LE GRADE DE DOCTEUR DE L’UNIVERSITE DE TOUR

coût min coût max

Pixels non O(P) O(6P)

Histogrammes non O(2N) O(11N)

Blocs non O(P+ 5B) O(10P)

Caractéristiques non O(3P +N) O(27P + 3N)

Mouvement non O(20P) O(105P)

Combinaison d’approches non O(3P + 3N) O(26P + 5N)

Coefficients de la TCD oui O(3B) O(6P + 19B)

Vecteurs de mouvement oui O(B) O(P + 2N + 4B)

Autres oui O(4B) O(12N + 27B)

TAB. 1.1 – Complexité des différentes méthodes de détection des changements de plans.

1.4 Description des états de l’art

Plusieurs états de l’art ont déjà été publiés dans la littérature. Aucun n’est exhaustif mais il est cependant possible d’avoir un aperçu global du domaine en se référant à plusieurs d’entre eux. Certains ont pour objectif de référencer l’ensemble des méthodes élaborées, d’autres se proposent de comparer expérimentalement les différentes approches, et enfin les derniers se focalisent sur un type particulier de méthodes.

– Ainsi, Ahanger et al. [Aha96] discutent des besoins et des architectures globales pour l’indexation vidéo. Quelques méthodes de segmentation, principalement liées au domaine non-compressé, sont présentées dans ce cadre. Idris et al. [Idr97] traitent de l’indexation d’images et de vidéos, dans les domaines compressé et non-compressé. Les caractéris-tiques liées aux images et les algorithmes de traitement des vidéos utiles pour l’indexa-tion sont décrits. La détecl’indexa-tion des changements de plans est un des traitements des vidéos nécessaire pour caractériser une séquence vidéo. Brunelli et al. [Bru99] présentent aussi l’indexation vidéo, et décrivent en particulier les algorithmes de détection des change-ments de plans, concernant principalement des séquences vidéo non-compressées. Ai-grain et al. [Aig96] proposent une revue des techniques pour l’analyse du contenu des vidéos. La détection des changements de plans dans des données compressées et non-compressées est l’une de ces techniques. Koprinska et al. [Kop01] effectuent une revue dans les deux domaines des algorithmes pour la détection des changements de plans et la reconnaissance des opérations de la caméra (translation, rotation, zoom, etc.). Lien-hart [Lie01] présente les différents types de changements de plans et propose quelques méthodes de détection. La présentation des méthodes ne se base pas sur une classification en méthodes pour des vidéos compressées ou non compressées car l’auteur considère que

1.4. Description des états de l’art 21 la plupart des méthodes travaillant sur des données non-compressées peuvent être adap-tées au domaine compressé après décompression partielle. Jiang et al. [Jia98] présentent une revue des méthodes classées en trois catégories : les vidéos non-compressées, les vidéos compressées, et les modèles.

– Plusieurs états de l’art ne comparent qu’un panel limité d’algorithmes en se basant sur une implémentation personnelle de l’auteur. Boreczky et al. [Bor96] comparent la per-formance de cinq algorithmes (certains traitant des vidéos non-compressées tandis que d’autres sont dédiés à des vidéos compressées) en utilisant une méthodologie d’évalua-tion commune. Lienhart [Lie99] compare quelques méthodes et caractérise leur capacité à déterminer correctement le type des changements de plans qui ont été détectés. Dailianas et al. [Dai95] comparent plusieurs algorithmes de segmentation dédiés à des séquences vidéo non-compressées. Quelques détails sont donnés quant à la complexité algorith-mique des méthodes évaluées. Yusoff et al. [Yus00] comparent plusieurs méthodes liées à des vidéos non-compressées et proposent des versions améliorées en utilisant un seuil adaptatif.

– Finalement, quelques articles proposent des revues ne concernant qu’un type de méthodes bien particulier. Ainsi ceux de Gargi et al. [Gar96, Gar00] sont dédiés aux méthodes de segmentation temporelle basées respectivement sur des histogrammes couleur et sur les informations de mouvement. Mandal et al. [Man99] se concentrent sur les méthodes travaillant dans le domaine compressé.

Malgré le nombre important de méthodes se proposant de résoudre le problème de la dé-tection des changements de plans, il nous a semblé qu’aucune d’entre elles n’était totalement adaptée à notre problématique en respectant les contraintesC_i énoncées en page 3. Nous ver-rons donc dans le chapitre suivant comment nous proposons [Lef00b, Lef01d] une solution à ce problème.

Chapitre 2

Détection adaptative de changement de plans :

Choix de l’espace TSL

Lors du chapitre précédent nous avons dressé un panorama des méthodes de détection des changements de plans proposées dans la littérature. Chacune de ces méthodes possède des avan-tages et des inconvénients mais aucune d’entre elles ne nous a semblé répondre aux différentes contraintes que nous nous posions, c’est-à-dire celles énoncées en page 3. Aussi proposons-nous ici une nouvelle méthode [Lef00b, Lef01d] permettant un traitement temps réel des séquences compressées ou non d’images couleur, robuste aux mouvements importants et aux changements d’illumination.

Dans ce chapitre, nous commencerons par énoncer plus en détail notre problématique. Puis nous effectuerons quelques rappels sur les différents moyens de représenter la couleur dans des images en indiquant les différents espaces de représentation. Nous décrirons notamment l’es-pace couleur TSL sur lequel notre méthode de détection des changements de plans est basée.

Afin de minimiser le temps de calcul nécessaire à l’algorithme, nous proposons de diminuer la résolution spatiale des images. Deux approches peuvent être utilisées, selon que les don-nées sont compressées ou non. Afin d’accroître la robustesse de la méthode dans le cas de mouvements importants, nous proposons d’utiliser une approche différente des méthodes clas-siques. En effet, alors que celles-ci consistent généralement à calculer une mesure de similarité entre deux images successives puis à comparer la valeur obtenue avec un seuil fixé a priori, notre approche ne compare pas directement la mesure de distance mais étudie plutôt l’évolution temporelle de cette mesure. De plus le seuil fixe classique est remplacé par un seuil adaptatif

2.1. Problématique 23 permettant une autoadaptation de la méthode à n’importe quel type de séquence vidéo. Enfin des résultats montrant l’efficacité de la méthode seront présentés.

2.1 Problématique

Lors du choix ou de l’élaboration d’une méthode de détection de changement de plans, il est nécessaire de prendre en compte le contexte dans lequel celle-ci sera employée même si l’on souhaite, le plus souvent, disposer d’une méthode aussi générale que possible. Ainsi, la sélection d’une méthode sera guidée par la compression ou non des séquences, la nature des images qui peuvent être en niveaux de gris ou en couleur, les contraintes imposées quant au temps d’exécution (le temps réel n’est pas toujours nécessaire), ou encore la nature même des séquences vidéo. Ainsi, une méthode qui permet la détection des changements de plans dans des documentaires pourra ne pas être adaptée à la détection des transitions dans des retransmis-sions sportives. En effet, certains contenus de séquence vidéo sont caractérisés par de faibles mouvements alors que l’on peut observer dans d’autres des déplacements importants.

La détection des changements de plans permet une segmentation temporelle des séquences vidéo et différents algorithmes seront appliqués sur les images afin d’interpréter leur contenu en fonction de la sous-séquence. Puique l’objectif de cette thèse est de proposer une architec-ture et des outils génériques pour l’indexation contextuelle de séquences vidéo de différents types, il est nécessaire que la méthode de détection des changements de plans utilisée permette d’analyser correctement des séquences vidéo les plus variées. Nous nous plaçons donc dans le cas où les informations contenues dans la séquence vidéo sont représentées en couleur. La mé-thode s’appliquera a fortiori sur des séquences en niveaux de gris. De plus, aucune contrainte n’est imposée quant à l’acquisition des images. Plus précisément, cela signifie que la caméra effectuant l’acquisition peut être fixe ou mobile, en intérieur ou en extérieur. La méthode à utiliser doit donc, d’une part gérer des séquences où le mouvement peut être aussi bien faible qu’important, et d’autre part assurer une robustesse aux changements d’illumination. De plus, les séquences à traiter peuvent être compressées ou non. Finalement, puisque l’indexation des séquences vidéo doit être réalisée en temps réel, il est évident que la détection des changements de plans, considérée comme la première étape du traitement global, doit l’être aussi.

Les différentes contraintes à prendre en compte lors de la détection des changements de plans sont donc celles énoncées précédemment :C_rapidité,C_couleur,Cillumination,C_mouvement,Ccompression. Les méthodes décrites dans le chapitre précédent permettent de gérer tel ou tel cas mais ne sont pas adaptées à une situation où les cinq contraintes énumérées ci-dessus seraient réalisées.

2.2. Représentation de la couleur 24

Dans le document THESE POUR OBTENIR LE GRADE DE DOCTEUR DE L’UNIVERSITE DE TOURS (Page 30-34)