• Aucun résultat trouvé

F.2 Tests d'hypothèse de normalité pour les images de textures différentes

1.3.1.1 Construction de la base de données

Afin de mesurer l'apport de nos contributions, nous avons mis en place une base de données syn- thétique. Elle permet d'évaluer la qualité de notre gradient et du détecteur associé. Bien que notre proposition soit générique, le manque de résultat de référence en dehors du visible dans le domaine multi- ou hyper-spectral nous a conduit à effectuer cette évaluation dans le domaine couleur. De plus,

1.3. Résultats 31 la comparaison de gradient couleur est assez prolifique dans la littérature pour pouvoir nous y com- parer.

Nous présenterons comment les distributions couleurs sont créés, puis la mesure du taux de sé- parabilité. Ce dernier évalue la difficulté d'extraire un bord. Grâce à celui-ci et aux formes de distribu- tions couleurs nous avons une base de données synthétique. Enfin, nous présenterons le critère de comparaison basé sur la classification.

Magnier et al.(2018) proposent une méthode d'évaluation des gradients niveaux de gris sur des images réelles. La vérité-terrain dépendra toujours de l'humain qui a crée la vérité-terrain. Dans le domaine médical, de nombreux articles présentent les désaccords qu'il peut y avoir parmi les experts. Dans le domaine du patrimoine culturel, ces désaccords sont aussi fréquents. C'est pour ces raisons que nous avons choisi de construire une base de données synthétiques.

Nous partons du principe que la détection de régions est facile si les deux distributions sont uni- formes même si les couleurs sont proches. Cependant, la tâche se complique si les régions ne sont pas parfaitement uniformes. Dans ce cas, nous supposons que chaque région est définie par une distribu- tion couleur. La complexité de l'extraction du gradient dépend de l'intersection entre les distributions couleur. Plus les distributions couleur se chevauchent, plus la segmentation devient difficile.

Le protocole que nous proposons est basé sur deux distributions couleur générées avec un taux de séparabilité, des formes de distributions et des couleurs moyennes donnés (figure1.7).

Formes des distributions

La distribution couleur est générée avec un modèle Gaussien multivarié N3(µ, Σ) dans un es-

pace couleur donné (CIERGB ou CIELAB par exemple). Pour éviter le biais induit par la quan- tification, tous nos calculs sont faits avec une précision de type double.

La forme de la Gaussienne multivariée est contrôlée par la matrice de variance covariance Σ.

(a) r = 0.5, C1= (85;−47; 7), C2= (96;−42; 5). (b) r = −0.5, C1= (85;−47; 7), C2= (96;−42; 5). (c) r = 0, C1= (38; 52; 3),C2= (37; 60;−7). (d) r = −1, C1= (38; 52; 3),C2= (37; 60;−7).

Figure1.7 –Exemples d'images générées. Les valeurs du taux de séparabilité (r) et la localisation des paires de couleur sont données par images. Pour percevoir les différences de couleur, la distance entre les centres des distributions est fixé à 12 dans l'espace CIELAB.

32 Chapitre 1. Gradient couleur Celle-ci dépend d'une matrice de rotation R et d'une matrice de forme S (eq.1.18).

Σ = RTSR, (1.18) avec S =  a 00 a1 00 0 0 1 a2   . (1.19)

Le paramètre a ∈ [1; 5] détermine la forme de la distribution, sphérique lorsque a est proche de 1, plus oblongue lorsque a s'approche de 5 (eq.1.19). Ce paramètre est choisi aléatoirement. La matrice R est une matrice de rotation classique définie par le produit de trois matrices définissant chacune une rotation d'angle θi autour d'un axe principal (eq.1.20). Les angles sont aussi choisis aléatoire-

ment.

R = R1R2R3, (1.20)

avec R1 =

cos(θsin(θ11)) − sin(θcos(θ11)) 00

0 0 1   , (1.21) et R2 =   cos(θ0 2) 0 sin(θ1 0 2) − sin(θ2) 0 cos(θ2)   , (1.22) et R3 =  1 cos(θ0 3) − sin(θ0 3) 0 sin(θ3) cos(θ3)   . (1.23)

La figure1.8montre quelques exemples de formes obtenues. A cette étape, toutes les distribu- tions sont centrées (N3(0, Σ)). L'ellipsoïde représente l'enveloppe de la distribution à une distance

de Mahalanobis de 3 du centre.

Ensuite, nous modifions la moyenne et ajoutons un paramètre α pour contrôler la localisation et le volume de la distribution. La matrice de variance covariance finale est définie par Σ′

i = α2iΣi.

Cette étape permet de contrôler le chevauchement des distributions. Deux centres C1et C2sont sé-

lectionnés aléatoirement dans l'espace CIELAB pour être à une distance couleur ∆E de 3.

Taux de séparabilité

La complexité de détection du gradient est proportionnelle à l'intersection des ellipsoïdes rela- tive aux distributions de Gaussienne N3(C1, Σ′1) etN3(C2, Σ′2).

Nous proposons d'utiliser la distance algébrique normalisée entre deux enveloppes de distribu- tions (eq.1.24) pour définir le taux de séparabilité (r) comme illustré sur la figure1.9. L'enveloppe de la distribution considérée est définie par la surface ellipsoïde à une distance de Mahalanobis de 3 unités de la moyenne de la distribution. La distance de 3 permet de contenir 99.7% des données à l'intérieur de l'enveloppe. r = C1′C2′ ||C1C2||2 avec dΣ′ i(Ci, C ′ i) = 3, (1.24) et {C1′, C2} ∈ (C1C2).

Un taux de séparabilité nul exprime un unique point d'intersection entre les deux ellipsoïdes. Puisque C′

i est à une distance de Mahalanobis de 3, les deux distributions ne se chevauchent que

pour 0.3% des pixels couleur pour un taux de séparabilité nul. Une valeur négative indique une in- tersection plus importante, par opposition à une valeur positive qui ne montre aucune intersection

1.3. Résultats 33

(a) a = 1.0, θ = (247; 49; 162) (b) a = 1.8, θ = (280; 298; 251)

(c) a = 3.0, θ = (282; 117; 16) (d) a = 3.9, θ = (9; 110; 275)

Figure1.8 –Exemplesd'enveloppesdedistributions. L'enveloppe est à une distance de Mahalanobis de 3 du centre des distributions générées.

entre les deux enveloppes. Il peut cependant y avoir un léger chevauchement des distributions. La normalisation est relative à la distance entre les moyennes. Cela permet de comparer les résultats pour des distances aux centres différentes ou pour différents espaces couleur.

Une autre possibilité pour le taux de séparabilité aurait pu être la divergence de Kullback-Leibler. Cependant, la non-linéarité de sa formule rend la dynamique des résultats plus difficile à interpréter.

La base de données artificielles

Pour explorer un maximum du gamut1au cours de l'expérience, les paires de couleurs (C

1, C2)

sont choisies aléatoirement. Les coefficients multiplicateurs des distributions αisont calculés pour

un taux de séparabilité r donné :

α = α1 = α2 =

(1− r)dΣ1(C1, C2)dΣ2(C2, C1) 3(dΣ1(C1, C2) + dΣ2(C2, C1))

. (1.25)

Le taux de séparabilité varie dans l'intervalle [−1, +1]. De plus, nous vérifions que les deux distribu- tions couleur appartiennent au gamut de l'espace CIERGB. Les distributions couleur sont ensuite générées dans cet espace.

1. Gamut : ensemble des couleurs perceptibles ou reproductibles par un périphérique dans un espace de référence. Dans notre cas, le gamut correspond donc à l'ensemble de l'espace CIELAB.

34 Chapitre 1. Gradient couleur

(a) Distributions1.8b(verte) et1.8d(rouge) avec r =

0.5

(b) Distributions1.8b(verte) et1.8d(rouge) avec r =

−0.5

Figure1.9 –Illustration du taux de séparabilité (r) en fonction du chevauchement des deux distri- butions couleurs.

La figure1.7présente quatre images générées avec deux paires de couleurs (Ci, Cj).Pour facili-

ter la perception des différences, nous avons sélectionné un ∆E(Ci, Cj) = 12. Les paramètres des

distributions des figures1.7aet1.7binduisent une différence principalement sur la coordonnée lu- minance. Au contraire, les deux autres varient sur la composante teinte. Le taux de séparabilité sur la figure1.7b(resp.1.7d) est plus grand que sur la figure1.7a(resp.1.7c), car les distributions se che- vauchent plus. Elles seront plus délicates à segmenter.

Critère de comparaison

Pour évaluer la qualité d'un gradient, nous devons segmenter les images et utiliser un critère ha- bituellement utilisé en classification. Chaque image test est composée de deux régions R1et R2(la

figure1.7présente des images (I)aveccesdeuxrégions).Notreobjectifestd'évaluernotregestionde

l'inter-dépendance des canaux, pas l'estimation de la direction. C'est pourquoi, nous nous sommes focalisés sur un bord vertical. Nous estimons le bord comme étant le maximum par ligne de l'estima- tion du gradient. Les vrais positifs (T P), respectivement les vrais négatifs (T N ) sont les pixels affec- tés après détection de bord dans la région R1, respectivement la région R2. Les faux positifs (FP) et

les faux négatifs (FN ) correspondent aux pixels localisés du mauvais coté du bord après calcul. La figure1.10montre un résultat théorique de segmentation et un cas pratique pour deux régions 3×3.

Nous utilisons le calcul de précision pour évaluer les performances : Acc = #T P + #T N

#I , (1.26)

Les résultats de précision sont entre 0% et 100%, 100% étant la réponse parfaite.

Documents relatifs