• Aucun résultat trouvé

b) Transformée en ondelettes

Dans le document Indexation des bases de données images. (Page 53-57)

Malgré la capacité remarquable des filtres de Gabor à décomposer le spectre fréquentiel de l’image, les attributs texturaux extraits de ces filtres peuvent être corrélés en raison de la non-orthogonalité des filtres. Il peut dès lors s’avérer difficile de déterminer si une similarité observée entre échelles d’analyse est due aux propriétés de l’image ou à la redondance inhérente à la représentation. En outre, à chaque échelle d’application des filtres de Gabor, les paramètres définissant ces filtres doivent être modifiés. Ces contraintes sont levées par l’utilisation des ondelettes [MAL 89]. Celles-ci offrent en effet un cadre d’analyse multi- échelles uniforme (une seule paramétrisation pour toutes les échelles) et permettent de décomposer l’image en sous-bandes orthogonales et indépendantes limitant ainsi la redondance d’informations [REG 14].

f0 cos

f0 sin

f=2a 2b

La transformée en ondelettes continue d’une fonction f L2( ) est donnée par l’équation

1.13 :

𝛾(𝑠, 𝜏) = ∫ 𝑓(𝑡)Ψs,τ (𝑡)𝑑𝑡 (1.13)

Où * dénomme le complexe-conjugué. Cette équation montre comment une fonction est décomposée dans un ensemble de fonctions Ψs,τ appelées les ondelettes. Les variables s et sont les nouvelles dimensions, échelle et translation, de la transformée en ondelettes. La transformée en ondelettes inverse est donnée par l’équation 1.14.

𝑓(𝑡) = ∫ ∫ 𝛾(𝑠, 𝜏)Ψs,τ (𝑡)𝑑𝜏𝑑𝑠 (1.14)

Les ondelettes (équation 1.15) sont générées à partir d’une ondelette appelée l’ondelette mère, en appliquant des opérations de changement d’échelle et des translations.

Ψs,τ (t) = 1 √sΨ (

t − τ

s ) (1.15)

s est le facteur d’échelle, τ est le facteur de translation et 1

√s est un facteur de normalisation à travers les différents échelles.

En pratique, l’utilisation de la décomposition en ondelettes sur une image discrète à deux dimensions revient à appliquer le produit de filtres passe-haut (H) et passe-bas (L) à une dimension. Dans l’analyse multi-résolutions définie par [MAL 89], une approche de décomposition appelée transformée en ondelettes discrète (DWT : Discrete Wavelet Transform) est proposée. Celle-ci consiste à décomposer l’image en quatre sous-bandes sous- échantillonnées d’un facteur 2 (ondelettes dyadiques) à chaque échelle de décomposition. Ces sous-bandes sont le résultat de combinaisons entre filtre passe-haut et filtre passe-bas : LL, LH, HL, HH. La sous-bande LL ou sous-bande d’approximation est une version moyennée de l’image d’origine alors que les sous-bandes HL, LH et HH ou sous-bandes de détails contiennent les hautes fréquences de l’image respectivement dans la direction de x (horizontale), dans la direction de y (verticale) ou dans les deux directions x et y (diagonale). Pour obtenir le niveau d’échelle de décomposition suivant, la sous-bande LL est à nouveau filtrée et sous-échantillonnée (Figure 1.9). Généralement, l’essentiel de l’information texturale étant lissée par l’application du filtre passe-bas, seules les sous-bandes de détails HL, LH et HH sont exploitées dans l’analyse texturale [REG 14].

Figure 1.9 : Exemple de décomposition par ondelettes. Image d’origine (gauche), Schéma de décomposition de l’image par DWT avec 2 échelles de décomposition (centre), Résultat de la

décomposition (droite).

7.2.3. Forme

Au même titre que les descripteurs/caractéristiques de texture, les attributs de forme sont complémentaires de la description couleur [FOU 02]. La forme est un attribut visuel essentiel et est l'une des caractéristiques/descripteurs de base pour démontrer le contenu d'une image. La précision des descripteurs/caractéristiques de forme est largement basée sur le schéma de segmentation appliqué pour diviser une image en objets significatifs. Quoique, la description des formulaires est une tâche difficile. Une bonne caractéristique/descripteur de forme doit être invariante à la rotation à la translation, à et l'échelle [SUD 18].

Les techniques de modélisation sont regroupées en deux classes [BEN 17, FOU 02, SUD 18]:

1) l’approche contour (frontière) décrit une région au moyen des pixels situé sur son contour. Les techniques de description de forme représentatives sont le descripteur de Fourier, les codes de chaîne, le modèle par éléments finis et les approximations polygonales.

2) l’approche région considère une région par rapport aux caractéristiques des pixels que cette région contient. Un descripteur basé sur une région spécifie la structure de l'objet à l'intérieur de la frontière et la forme est documentée comme un groupe de primitives (par exemple, quadriques, cercles, rectangles,…). Cette approche fait classiquement référence aux moments invariants [HU 62]. Ces attributs sont robustes aux transformations géométriques comme la translation, la rotation et le changement d'échelle.

7.2.3.1. Les descripteurs géométriques de région

Les descripteurs géométriques de forme permettent de distinguer les différents types de forme que peuvent prendre les objets d’une scène. Ils nécessitent une segmentation en région préalable de l’image. Ils sont ensuite calculés sur les différentes régions de l’image [COI 05, LAFO 06]. La surface relative (ou normalisée) d’une région ℜ𝑘 de l’image I est le nombre de pixels contenus dans cette région par rapport au nombre total de pixels de l’image [FOU 02] :

𝑆𝑘 = 𝑐𝑎𝑟𝑑(ℛ𝑘)

ℎ𝑎𝑢𝑡𝑒𝑢𝑟 (𝐼) ∗ 𝑙𝑎𝑟𝑔𝑒𝑢𝑟(𝐼) (1.16) Le centre de masse des pixels de la région est définie par :

𝑃 = (𝑃𝑖, 𝑃𝑗) = (

𝑖=ℛ𝑘𝑖 𝑐𝑎𝑟𝑑(ℛ⁄ 𝑘) 𝑙𝑎𝑟𝑔𝑒𝑢𝑟 (𝐼) ,

𝑗=ℛ𝑘𝑗 𝑐𝑎𝑟𝑑(ℛ⁄ 𝑘)

ℎ𝑎𝑢𝑡𝑒𝑢𝑟 (𝐼) ) (1.17) La longueur du contour de la région est le nombre de pixels en bordure de la région:

𝑙𝑘 = 𝑐𝑎𝑟𝑑(𝑐𝑜𝑛𝑡𝑜𝑢𝑟(ℛ𝑘)) (1.18)

La compacité traduit le regroupement des pixels de la région en zones homogènes et non trouées:

𝐶𝑘= 𝑙𝑘 2

𝑆𝑘 (1.19)

Ces descripteurs très simples permettent d’obtenir des informations sur la géométrie des régions de l’image. Il existe d’autres descripteurs de forme, basés sur des statistiques sur les pixels des régions de l’image.

7.2.3.2. Les moments géométriques

Les moments géométriques permettent de décrire une forme à l’aide de propriétés statistiques. Ils sont simples à manipuler mais leur temps de calcul est très long.

On a:

Le moment d’ordre (p, q) est calculé par la formule suivante. 𝑀𝑝𝑞 = ∑ ∑ 𝑖𝑝𝑗𝑞𝐼 𝑁 𝑖=1 𝑀 𝑖=1 (𝑖, 𝑗) (1.20)

La superficie est calculée par la formule suivante.

M00 = ∑ ∑ I N i=1 M i=1 (i, j) (1.21)

Mass Center est calculé par les formules suivantes.

M01 = ∑ ∑ jqI N i=1 M i=1 (i, j) (1.22) M10 = ∑ ∑ ipI N i=1 M i=1 (i, j) (1.23) 𝑖 =𝑀10 𝑀00 and 𝑗 = 𝑀01 𝑀00

Les moments centrés pour être invariants en translation sont calculés par la formule suivante.

𝜇𝑝𝑞 = ∑ ∑(𝑖 − 𝑖) 𝑝 (𝑗 − 𝑗)𝑞𝐼(𝑖, 𝑗) 𝑁 𝑗=1 𝑀 𝑖=1 (1.24)

Les moments normalisés à mettre à l'échelle invariants sont calculés par la formule suivante.

ηpq= μpq μ001+

p+q 2

(1.25)

Dans le document Indexation des bases de données images. (Page 53-57)