• Aucun résultat trouvé

Représentations invariantes à l’illumination

Évaluation quantitative

Crispell 08 Asserv Visuel

6.2.3 Représentations invariantes à l’illumination

Nous avons évoqué au chapitre2les difficultés liées aux faux positifs générés par les effets de l’illumination. L’approche de détection de changements proposée dans le cadre de cette thèse utilise plusieurs mécanismes afin de filtrer un maximum de ces faux positifs, le premier étant la conversion des observations dans une représentation invariante à l’illumination. Nous avons donc évalué quantitativement l’impact de ces différentes représentations sur les performances de détection de changements.

Pour cela, nous avons effectué en pré-traitement la conversion des trois vidéos considérées, en utilisant tour à tour les trois types de coordonnées chromatiques et les quatre représentations décrites à la section3.2. Dans chacun des douze cas résultants, nous avons généré le modèle 3D d’apparence à l’aide de la vidéo Aérodrome 2 et nous avons évalué les performances de détection de changements sur la vidéo Aérodrome 1, qui a été acquise sous des conditions d’illumination différentes de celles de la vidéo Aérodrome 2. Les performances de détection de changements ont été analysées en effectuant une consolidation par lissage temporel.

La figure6.11présente les courbes ROC obtenues en combinant les différents types de coor- données chromatiques, c’est-à-dire les coordonnées chromatiques classiques, logarithmiques et L1L2L3, avec les différentes représentations, c’est-à-dire les représentations brute, normalisée, désaturée et compensée (voir les définitions à la section3.2). Les courbes sont tracées avec une couleur commune lorsqu’elles correspondent à des coordonnées chromatiques de même type, et avec un même type de point lorsqu’elles correspondent à une même représentation.

De manière générale, l’objectif des algorithmes d’atténuation de l’illumination est d’obtenir une représentation des observations qui soit invariante par rapport aux effets de l’illumination mais qui permette malgré tout de détecter les changements significatifs. Cependant, ces deux contraintes sont souvent contradictoires en pratique, ce qui débouche sur un compromis à trou- ver entre la minimisation des faux positifs et la minimisation des faux négatifs. Ce compromis est bien illustré par la figure 6.11, qui montre que pour des valeurs du taux de faux positifs supérieures à 15%, les meilleurs taux de vrais positifs sont obtenus sans atténuation de l’illumi- nation. Ainsi, lorsque la présence de fausses alarmes est tolérée, le meilleur moyen de parvenir à détecter la plupart des changements consiste à travailler avec les observations brutes, c’est-à- dire sans atténuation de l’illumination.

Néanmoins, la réduction du nombre de faux positifs est généralement souhaitable, en par- ticulier pour un système semi-automatique d’analyse vidéo, qui est censé alléger la charge de travail de l’opérateur. Pour cela, les algorithmes présentés à la section3.2 permettent de limi-

6.2.3 - Illumination CH. 6 - ÉVALUATION 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Taux de Vrais Positifs

Taux de Faux Positifs

Rep. Norm. Rep. Desat. Rep. Comp. CC. Class. CC. Log. CC. L1L2L3 Aucune

FIGURE 6.11 – Cette figure compare les performances obtenues sur la vidéo Aérodrome 1, à

l’aide des différents algorithmes d’atténuation de l’illumination : coordonnées chromatiques (CC.) classiques, logarithmiques et L1L2L3, selon les représentations brute, normalisée, désaturée et compensée.

ter les faux positifs dûs aux effets de l’illumination, au prix d’une réduction du taux de vrais positifs.

La figure6.11permet de comparer les performances de ces algorithmes. Ainsi, la technique permettant d’obtenir les meilleurs résultats pour des valeurs du taux de faux positifs inférieures à 15% est celle utilisant la représentation compensée basée sur les coordonnées chromatiques classiques. Cette technique donne des résultats légèrement meilleurs qu’avec la représentation brute, ce qui peut s’expliquer par le pouvoir discriminatif plus élevé de l’espace de couleur RGB classique. Comme mentionné à la section3.2.1, les performances obtenues avec la représenta-

tion normalisée associée aux coordonnées chromatiques classiques sont moins bonnes qu’avec la représentation brute, du fait de nombreux faux positifs générés dans les zones sombres. D’autre part, la représentation désaturée, qu’elle soit associée aux coordonnées chromatiques classiques, logarithmiques ou L1L2L3, donne des performances inférieures aux autres représen- tations car elle réintroduit dans les observations la variabilité due aux effets de l’illumination, ce qui a pour conséquence de générer de nombreux faux positifs supplémentaires.

Dans le cas des coordonnées chromatiques logarithmiques et L1L2L3, les représentations brutes donnent de mauvais résultats. Ceci peut s’expliquer par le fait que les représentations brutes associées à ces deux types de coordonnées chromatiques sont très instables et pas assez discriminantes, ce qui est confirmé par les illustrations de la section3.2. Pour ces deux types de coordonnées chromatiques, la reconversion des observations dans l’espace de couleurs RGB, à l’aide des représentations normalisée, désaturée ou compensée, permet une nette améliora- tion des performances, sans toutefois permettre d’atteindre celles associées à une détection de changements sans atténuation de l’illumination.

La figure6.12présente une comparaison visuelle des résultats obtenus sans atténuation de l’illumination et avec différentes techniques d’atténuation, dont celles utilisant la représentation brute associée aux coordonnées chromatiques classiques, logarithmiques et L1L2L3, et celle utilisant la représentation compensée associée aux coordonnées chromatiques classiques. Les résultats obtenus à l’aide des deux techniques basées sur la représentation brute associée aux coordonnées chromatiques logarithmiques et L1L2L3 sont considérablement inférieurs à ceux obtenus sans atténuation de l’illumination, du fait de la présence de nombreux faux positifs. En revanche, l’utilisation des coordonnées chromatiques classiques permet de réduire le nombre

CH. 6 - ÉVALUATION 6.2.3 - Illumination

(a) Rep. brute CC. log. (b) Rep. brute CC. L1L2L3 (c) Rep. brute CC. class.

(d) Sans atténuation (e) Rep. comp. CC. class. (f) Vérité-terrain

FIGURE 6.12 – Cette figure permet une comparaison visuelle des résultats typiques obtenus en

fonction de différents algorithmes d’atténuation de l’illumination, ici obtenus sur l’image100 de la vidéoAérodrome 1.

Temps (ms) Rep. brute Rep. norm. Rep. désat. Rep. comp.

Aucune 30.5 - - -

CC. class. 35.2 37.0 38.1 37.7

CC. log. 128.9 134.6 135.7 137.1

CC. L1L2L3 36.9 45.7 46.3 49.3

TABLE 6.2 – Temps de calcul moyens par image, exprimés en millisecondes, associés aux tech-

niques de représentation invariante à l’illumination, et obtenus sur la vidéoAérodrome 1, dont les images contiennent1280✂ 720 pixels.

de faux positifs par rapport aux résultats sans atténuation de l’illumination, la représentation compensée étant plus performante que la représentation brute.

Enfin, la table6.2présente les temps de calcul moyens par image associés aux différentes techniques d’atténuation de l’illumination. En plus de permettre les meilleures performances en détection de changements, cette table montre que les techniques de représentation basées sur les coordonnées chromatiques classiques sont également les plus rapides à utiliser. Au contraire, celles basées sur les coordonnées chromatiques logarithmiques sont environ quatre fois plus lentes, du fait de l’utilisation de fonctions exponentielles et logarithmiques dont l’évaluation est relativement longue. À titre de comparaison, cette table présente également le temps de calcul obtenu lorsqu’aucune atténuation de l’illumination n’est effectuée. Notons que ce der- nier est non nul, car l’implémentation utilisée effectue, en même temps que l’atténuation de l’illumination, des traitements secondaires mais nécessaires, qui doivent être exécutés même lorsqu’aucune atténuation de l’illumination n’est exigée.

Dans la suite de ce chapitre, sauf mention contraire, les résultats présentés sont obtenus en utilisant l’atténuation de l’illumination correspondant à la représentation compensée à base de coordonnées chromatiques classiques.