• Aucun résultat trouvé

Impacts de la représentation en graphes sur la base Shape

2.8 Impacts de la représentation en graphes sur les performances

2.8.1 Impacts de la représentation en graphes sur la base Shape

Dans cette section, trois types d’extraction de graphes sont testés sur la base de silhouettes Shape [229] du laboratoire LEMS de l’université Brown2. Cette base contient 216 formes bi-naires réparties en 18 classes de 12 formes (Fig. 2.11). Chaque classe de cette base contient 12 déformations d’une forme, e.g. occultation, rotation, changement d’échelle.

FIGURE2.11 – Extrait de la base d’images Shape [229]

Pour étudier l’impact de la représentation d’images sous forme de graphes sur les perfor-mances de mesures de similarité entre graphes sur cette base, nous commençons par établir la liste des types de graphes adéquats pour ce type d’images (i.e. les silhouettes). Pour ce faire, nous discutons les éventuels avantages et inconvénients de l’utilisation de chaque type de graphes parmi les types évoqués précédemment dans ce chapitre.

Graphe de points d’intérêt : Dans cette base, un bon choix des points d’intérêt peut fournir

une bonne description de chaque silhouette. Intuitivement, le choix d’un ensemble des points d’intérêt à partir des contours semblerait intéressant. Cela est justifié par le fait que les contours des silhouettes appartenant à la même classe sont perceptiblement plus similaires qu’aux contours des silhouettes de classes différentes. Cette constatation est 2. http://www.lems.brown.edu/

Chapitre 2. Représentation d’images de documents sous forme de graphes

(a) Silhouettes dans la classe Bone

(b) contours des silhou-ettes dans la classe Bone

(c) Squelettes des silhou-ettes dans la classe Bone

(d) Silhouettes dans la classe Elephant

(e) Contours des silhou-ettes dans la classe

Ele-phant

(f) Squelettes des silhou-ettes dans la classe

Ele-phant

FIGURE2.12 – Représentation de deux classes de la base Shape en squelette et en contours

validée dans les figures 2.12(b) et 2.12(e) où les contours des silhouettes appartenant à deux classes (Bone Fig 2.12(a) et Elephant Fig 2.12(d)) sont présentés. En plus des points extraits des contours, nous pouvons aussi envisager l’utilisation des points d’intérêt de Harris [108] qui sont invariants à la rotation.

Graphe d’adjacence de régions : Dans cette base l’adjacence entre les régions n’est pas une

caractéristique discriminante entre les différentes classes de la base. En effet, toutes les images sont binaires et composées par deux régions ; la première est le fond blanc de l’image et la deuxième est la silhouette (en noir). Ainsi, une utilisation du graphe d’ad-jacence de régions pour représenter les images de cette base produira un ensemble de graphes où chaque graphe est composé par deux nœuds (deux régions) connectés par une arêtes. En conséquence, l’utilisation de ce type de graphes pour ce type d’image n’est pas approprié.

Graphe de relations spatiales : Dans cette base, chaque silhouette est considérée comme un

tout (une seule composante connexe). Donc, nous ne pouvons pas fournir une décomposi-tion adéquate des silhouettes en primitives. Par ailleurs, les graphes de reladécomposi-tions spatiales sont définis principalement sur les relations qui lient les différentes parties (primitives) d’une image. Ainsi une représentation des silhouettes sous forme de graphes de relations spatiales se révèle inappropriée.

Graphe du squelette : Dans la littérature, il est connu que les squelettes sont des

représenta-tions très appropriées des formes à partir desquelles ils sont calculés. L’utilisation d’un 24

2.8. Impacts de la représentation en graphes sur les performances

squelette pour représenter une forme se résume à abstraire la forme en une nouvelle représentation par des lignes fines (épaisseur d’un pixel) qui décrivent ses caractéristiques géométriques. Donc, l’utilisation des squelettes pour extraire les graphes représentants d’images de la base Shape semble être une piste très intéressante à explorer. Dans les fig-ures 2.12(c) et 2.12(f), nous illustrons les squelettes d’images de deux classes différentes (Bone Fig 2.12(a) et Elephant Fig 2.12(d)). Nous constatons, perceptiblement, que les squelettes appartenant à la même classe sont plus similaires que les squelettes de classes différentes. Ceci encourage à l’utilisation des squelettes pour extraire les graphes représen-tants de l’ensemble des silhouettes de la base Shape.

À partir de ces observations, nous constatons que l’utilisation des points d’intérêt et du squelette sont les deux méthodes les plus adéquates. À ce stade d’étude de l’impact du type de représentation, il reste à vérifier si les graphes de points d’intérêt et les graphes du squelette fourniront des performance similaires, et à déterminer lequel de ces deux représentations est la meilleure pour cette base de silhouettes. Pour répondre à cette question, nous avons construit trois bases de graphes à partir de la base Shape. La première base (Contours + Delaunay) con-siste à coder les contours de chaque silhouette dans un graphe des points d’intérêt des contours. Concrètement, pour chaque silhouette, nous appliquons l’algorithme de Canny pour détecter les contours, ensuite une polygonalisation est appliquée à ces contours. Ensuite, le graphe est con-struit à partir de la triangulation de Delaunay des points de jonctions du polygone. La deuxième base (Point d’intérêt de Harris + Delaunay) est similaire à la première base, sauf qu’au lieu d’utiliser les points d’intérêt des contours nous utilisons les points d’intérêt de Harris. Enfin, la troisième base (Squelette) consiste à coder le squelette de chaque silhouette dans un graphe où les nœuds représentent les points de terminaison et les points de jonctions, et les arêtes représen-tent les branches entre ces points dans le squelette.

Après la construction des bases de graphes, nous évaluons les performances les mesures de similarité entre graphes de chacune d’entre-elles. Nous considérons que les performances associées à chaque représentation sont les taux de classification effectués par l’algorithme de classification deskplus proches voisins. Le fonctionnement de cet algorithme sera détaillé dans le chapitre 5. Notons que la base est divisée en deux ensembles ; le premier constitue 30% de la totalité de la base et constitue l’ensemble d’apprentissage duk-ppv, tandis que le deuxième ensemble (70%) est utilisé comme un ensemble de test. Le choix de ces deux ensembles est totalement aléatoire. Dans la mesure où l’algorithme dek-ppv est sensible à cette configuration, nous avons répété 50 fois l’ensemble de l’expérimentation (sélection aléatoire de deux ensem-bles et l’application duk-ppv). Les résultats que nous affichons correspondent à la moyenne de ces 50 exécutions duk-ppv.

Pour approfondir notre étude nous utilisons sept mesures de distance de graphes. Ces méth-odes de mesure de distance entre graphes sont détaillées dans le chapitre 4. Rappelons que l’objectif de cette expérimentation est d’étudier l’impact de la représentation et non pas les per-formances des mesures de distance de graphes.

Dans la table 2.1, nous présentons les taux de classification (k-ppv) obtenus sur les trois bases de graphes par chaque méthode de mesure de distance de graphes. Nous nous intéressons à la lecture des lignes de cette table. Chaque ligne présente les résultats de la classification en utilisant une mesure de distance et différentes représentations en graphes de la base Shape. Nous

Chapitre 2. Représentation d’images de documents sous forme de graphes

Contours + Delaunay Point d’intérêt de Harris + Delaunay Squelette

Jouili 51,49% 56,60% 61.29% Robles-Kelly 53,04% 57,89% 67,52% Lopresti 35,50% 35,99% 34,72% Papadopoulos 42.33% 46,22% 40,16% PATH 45.87% 59.35% 63.40 % Riesen 29,17% 30,06% 47,73% Neuhaus 30,10% 30,53% 46,44%

TABLE2.1 – Taux de classification de la base Shape [229] avec différentes méthodes d’extraction de graphes. En gras les meilleurs taux par méthode d’appariement.

constatons que, dans toutes les lignes de la table, les résultats varient d’une représentation à une autre. Ceci montre bien que le choix du type de représentation en graphes a un impact sur les performances de la classification. Parmi les trois types utilisés dans cette expérimentation, les graphes du squelette fournissent, en moyenne, les meilleurs résultats. Donc, parmi toutes les représentations en graphes testées, le graphe du squelette est globalement la représentation la plus appropriée pour la base Shape.

Bien que le type de représentation a un impact sur les performances de la classification, l’appariement joue également un rôle important. En effet, en examinant les résultats de chaque méthode d’appariement, nous observons que le rang de ces méthodes varient suivant le type de représentation. Par exemple, la méthode Lopresti [157] est au rang 6 pour la représentation en graphe du squelette et au rang 4 pour les représentations en graphes de contours+Delaunay et graphes de points d’intérêt de Harris+Delaunay (idem pour la méthode de Riesen qui a les rangs : 6,6,3).