• Aucun résultat trouvé

appliqué à la constance chromatique

3.2.1 Méthodes basées sur les propriétés statistiques

Le patch blanc (White patch)

L’hypothèse faite par la méthode du patch blanc [CF99] est que, dans une scène, les valeurs maximales mesurées sont dues à un reflet direct de l’illuminant sur une surface. Intuitivement cela peut être comparé à une personne regardant une scène et étant éblouie par le reflet du soleil dans une vitre ou sur une surface blanche. La méthode du patch blanc consiste donc à récupérer les valeurs maximales obtenues pour chacun des canaux d’une image et de les considérer comme étant les valeurs de l’illuminant.

L’estimation de l’illuminant par la méthode du patch blanc est donc obtenue de la manière suivante : ˆ eR= max(IR) ˆ eG= max(IG) ˆ eB= max(IB) (3.6)

Où max(Ic)est la valeur maximale pour le canal c ∈ {R, G, B} des pixels de l’image

I.

Si la simplicité de la méthode est son point fort, elle possède néanmoins plusieurs faiblesses. En effet, le bruit des capteurs ainsi que les troncatures opérées par l’appareil, due aux saturations des capteurs (image surexposées), peuvent fausser les valeurs de l’image et impacter le résultat de l’algorithme. Dans une étude, Funt et

al. [FS10] ont montré qu’en utilisant des images HDR (High Dynamic Range), qui

sont des images capturées de manière à ne pas avoir de zones saturées, l’algorithme du patch blanc donne de bien meilleurs résultats, qu’avec des images classiques.

Chambah [Cha01] a proposé d’améliorer la robustesse de l’algorithme en affectant la moyenne des pixels dont la valeur est au-dessus d’un certain seuil plutôt que de récupérer uniquement la valeur maximale. Cela a pour effet de lisser les erreurs dues aux imperfections et traitement du capteurs.

Le monde gris (Gray world)

Si la méthode du patch blanc considère une approche locale en cherchant la couleur de l’illuminant dans des fortes réflexions, l’algorithme du monde gris de Buchsbaum et Gershon [Buc80], propose une approche globale. L’idée de l’algorithme a été ins-piré par Helmholtz [VHS05] qui a émis l’hypothèse que le phénomène de constance

chromatique chez l’être humain repose sur notre capacité à nous adapter à un niveau moyen de couleurs.

L’algorithme du monde gris repose sur l’hypothèse que, sous un éclairage de réfé-rence, la moyenne des réflectances des surfaces des objets composant une scène doit donner une couleur proche du gris. Ainsi, sous un éclairage quelconque, l’écart de la moyenne des pixels d’une image par rapport à la valeur de référence est dû à l’illuminant. L’estimation de l’illuminant est donc obtenue de la manière suivante :

ˆ eR= moy(IR) ˆ eG= moy(IG) ˆ eB= moy(IB) (3.7)

Où moy(Ic)est la moyenne des valeurs des pixels du canal c dans l’image I.

La faiblesse de la méthode repose sur l’hypothèse forte de la couleur de référence (couleur grise) d’une image. Par exemple, une image d’une forêt aura une teinte majoritairement verte qui ne sera pas due à l’illuminant, mais bien à la nature verte des surfaces photographiées. Si la couleur moyenne ne prend pas cela en compte et considère que le niveau moyen devrait être gris, l’estimation de l’illuminant sera faussée et l’image corrigée aura une teinte grise. Malgré cette faiblesse, l’algorithme du monde gris a démontré empiriquement des résultats satisfaisants et reste un des plus simples à utiliser. De plus, les résultats obtenus pour des images présen-tant une grande diversité des couleurs surpassent souvent certaines méthodes plus complexes.

Nuances de gris (Shades of gray)

Finlayson et Trezzi [FT04] ont amélioré l’algorithme du monde gris en considérant une généralisation de la fonction de moyenne en utilisant la norme de Minkowski ou Lp-norme.

Def. 3.3

Lp-norme

Pour tout entier réel p ≥ 1 la norme de Minkowski (ou Lp-norme) du vecteur x est égale à :

||x||p= (X i

|xi|p)1/p (3.8)

Cette formule, généralise plusieurs normes connues en fonction du paramètre p. Notamment, lorsque p = 1 alors la Lp-norme est égale à la distance de Manhattan, lorsque p = 2 il s’agit de la norme euclidienne et lorsque p = ∞ alors la Lp-norme est égale à la valeur maximale.

L’estimation de l’illuminant est obtenue en récupérant les normes Lp des compo-santes R,G,B d’une image :

ˆ eR= ||IR||p ˆ eG= ||IG||p ˆ eB = ||IB||p (3.9)

Finlayson et Trezzi ont constaté que si l’on choisit p = 1 alors l’algorithme est équivalent à celui du monde gris (à une constante de mise à l’échelle près) et que si l’on choisit p = ∞ c’est équivalent à la méthode du patch blanc.

Ils ont ensuite étudié les meilleures valeurs de p pour différentes bases de données et ont conclu que p = 6 donnait généralement de bons résultats.

Les bordures grises (Gray edges)

Finalement, Van de Weijer et al. [Wei+07] ont proposé une généralisation supplé-mentaire des algorithmes vu précédemment en reprenant la formule des bordures grises et en exploitant la dérivées n-ième des images.

Leur, formule exprimée comme suit, correspond à la norme p de Minkowski de la dérivée d’ordre n de l’image, obtenue par convolution d’un filtre de dérivation Gaussien d’écart type σ.

Z nfc,σ(x) ∂xn p dx 1/p = kec, c = {R, G, B}, (3.10) Le paramètre k est une constante de mise à l’échelle qui ne dépend pas du canal de couleur c.

L’équation signifie que la norme Lpde la dérivée n-ième des couleurs d’une image est liée à l’illuminant. Cette hypothèse est plus ou moins fondée en fonction des valeurs de n, p et σ. Dans leurs travaux, Van de Weijer et al. ont proposé plusieurs ensembles de valeurs possibles pour ces paramètres en fonction des bases de données considérées.

L’approche de Gao et al. [Gao+14]

La méthode qui a grandement inspiré nos travaux a été proposée par Gao et

al. [Gao+14]. En plus d’être, au moment de nos recherches, la méthode présentant

les meilleurs résultats, leur algorithme utilise une approche originale de la constance chromatique qui n’entre pas dans la famille des algorithmes généralisés par Van de

Weijer avec l’équation 3.10. Leur approche combine les informations locales de réflec-tance (patch blanc) à une estimation globale de l’illuminant (monde gris). C’est cette idée de comparaison d’informations à plusieurs niveaux (local et global) qui nous a paru intéressante et que nous avons voulu adapter aux réseaux de neurones.

L’originalité de la méthode de Gao et al. [Gao+14] est d’estimer directement les propriétés de réflectance des surfaces des objets en calculant le rapport entre des surfaces localement normalisées et une moyenne globale. Ils commencent par nor-maliser chacun des pixels de l’image par rapport à un voisinage local. Pour cela, ils divisent l’image en fenêtres de taille fixe et récupèrent les valeurs maximales de chacune des fenêtres. Les pixels de l’image sont ensuite normalisés en divisant leurs valeurs par la valeur maximale de la fenêtre à laquelle ils appartiennent. Cette image est appelée image des réflectances localement normalisées. Dans leur étude, ils ont testé plusieurs tailles de fenêtres possibles et ont montré qu’une taille de 20 × 20 obtenait les meilleurs résultats. L’obtention de l’estimation de l’illuminant se fait en divisant la moyenne des valeurs de l’image localement normalisées avec la moyenne de l’image d’origine. Ils ont montré à l’aide de plusieurs bases de données, que le rapport ainsi obtenus est comparable à la valeur de l’illuminant (à une constante de mise à l’échelle près).

La méthode ainsi développée possède un unique hyper-paramètre qui est la taille (en pixels) des fenêtres. Dans leurs travaux, Gao et al. ont fait un rapprochement entre leur méthode et les méthodes existantes. Ils ont notamment noté que, pour des valeurs extrêmes de la taille des régions, à savoir des régions de taille 1 pixel (res-pectivement une seule région de la taille de l’image) leur algorithme est équivalent à la méthode du monde gris (respectivement du patch blanc).

Leur méthode peut donc être considérée comme étant une combinaison de l’algo-rithme de monde gris et celui de patch blanc. C’est cette idée de combinaison que nous avons étudiée et que nous expliquons en détails dans la partie 3.3.