• Aucun résultat trouvé

Méthode de sélection des familles de caractéristiques 1. Définition d’une famille de caractéristiques

III Extraction et sélection de caractéristiques

9. Exploration des espaces de caractéristiques par Force Brute

9.2. Méthode de sélection des familles de caractéristiques 1. Définition d’une famille de caractéristiques

Pour regrouper les caractéristiques sous le terme de famille, j’ai choisi de suivre plusieurs règles afin de construire ces combinaisons de manière logique. Tout d’abord, chaque famille regroupe des caractéristiques avec les mêmes paramètres d’échelle. Ce que nous appelons paramètres d’échelles sont les paramètres définissant l’échelle d’analyse sur laquelle elles ont été calculées. Pour Haralick et le MBL, il n’y a qu’un seul paramètre d’échelle qui est le rayon de l’élément structurant. Ce premier regroupement est donc directement équivalent aux espaces de caractéristiques pour le MBL et les caractéristiques d’Haralick. Pour les filtres de Gabor, ce sont tous les paramètres définissant le support gaussien et la longueur d’onde d’analyse.

Cette première étape forme des groupes de 16 caractéristiques d’Haralick (l’espace d’Haralick à une échelle spécifique) et 8 caractéristiques de Gabor. Nous allons de nouveau regrouper les caractéristiques mais cette fois selon leurs propriétés intrinsèques (propres à un deuxième regroupement de caractéristiques).

Les 16 caractéristiques d’Haralick restantes sont les quatre statistiques calculées sur quatre directions différentes. Nous appelons famille d’Haralick la subdivision d’un espace d’Haralick selon ses quatre statistiques (le second moment angulaire, le contraste, la variance et la corrélation). Les familles ainsi formées ont une cardinalité de 4.

Les 8 caractéristiques de Gabor restantes sont la partie réelle et imaginaire de quatre filtres de Gabor. Un seul hyperparamètre diffère entre ces quatre filtres, c’est l’angle d’analyse Thêta. Néanmoins, je trouve plus judicieux de regrouper les caractéristiques selon le couple partie réelle et imaginaire car elles ont des propriétés différentes. La partie réelle est un détecteur de région et la partie imaginaire est une détecteur de contours [Mehrotra et al., 1992]. Nous appelons familles de Gabor les groupes ainsi formés, elles ont une cardinalité de 4.

66 Le Tableau 4 résume la conception des familles de caractéristiques. Elles ont toutes des cardinalités similaires. Cette propriété des familles est importante afin de permettre leur comparaison entre elles. Les métriques utilisées pour cette comparaison sont détaillés dans la Section 9.2.2 et la Section 10.2.2.

Espace de

caractéristiques Famille de caractéristiques à une échelle spécifique Cardinalité

RVB Idem 3

HSV Idem 3

CIE XYZ Idem 3

CIE L*a*b* Idem 3

Espace descriptif d’Haralick

Deuxième moment angulaire (A), Contraste (Con),

Corrélation (Cor) ou Variance (V) des quatre MCNG 4

Filtres de Gabor

Partie imaginaire (I) ou partie réelle (R) dans les quatre directions du filtre de Gabor (les autres

hyperparamètres sont fixés)

4

MBL Idem 1

Tableau 4 : Tableau résumant les éléments et la taille des familles de caractéristiques par espace de caractéristiques.

9.2.2. Critères de sélection des familles de caractéristiques

Pour comparer les familles de caractéristiques entre elles, nous proposons d’utiliser les critères de la valeur médiane ou moyenne de positions (VMeP et VmoP respectivement) d’une famille de caractéristiques qui est la moyenne de l’ensemble des valeurs médianes ou moyennes de positions de ses éléments (Figure 25). Cette valeur est proche de zéro si la caractéristique est présente dans les meilleures combinaisons de caractéristiques au sens du F-Score.

Les derniers critères pris en compte pour les familles de caractéristiques sont leur cardinalité (Section 9.2.1). Ces critères jugent de la quantité de temps et de mémoire nécessaires. Plus ces critères ont des valeurs élevées, moins la famille sera intéressante à calculer pour l’objectif de minimisation des coûts qui a été fixé pour objectif de ce travail.

Ces critères fournissent des éléments pour sélectionner des familles de caractéristiques pertinentes pour notre problème de segmentation. Ce procédé de sélection est détaillé Section 9.2.3. Cette optimisation est nécessaire avant de réaliser une sélection optimale de caractéristique, l’exploration par Force Brute étant coûteuse en ressources de calcul (voir Section 9.2.3).

67 Figure 25 : Exemple du calcul des valeurs médianes et moyennes de positions réalisé à partir des résultats de l‘exploration par Force Brute pour les caractéristiques de l’espace RVB. Dans le tableau de résultats, le ‘0’ indique l’absence et le ‘1’ indique la présence d’une caractéristique. L’ensemble RVB est une famille de caractéristiques et ses valeurs médianes et moyennes de positions sont toutes les deux de 3,66.

9.2.3. Sélection des meilleures familles de caractéristiques

Nous calculons les moyennes globales des VMeP et des VMoP à l’échelle des caractéristiques et des espaces, nous les appelons valeurs de positions globales. Les caractéristiques seront considérées comme avantageuses si leur valeur de positions est inférieure à la valeur de position globale des caractéristiques. De la même manière, un espace sera considéré comme avantageux si la valeur de position est inférieure à la valeur de position globale des espaces.

Ainsi, nous pouvons procéder à une sélection des familles de caractéristiques donnant les meilleurs résultats afin de réduire la complexité algorithmique (Section 10). Une famille est sélectionnée lorsqu’elle est issue d’un espace avantageux et que l’intégralité de ses caractéristiques sont avantageuses. Nous prenons en compte l’union des familles respectant toutes ces propriétés dans les deux étapes de validation (l’ensemble des familles sélectionnées par validation directe et par validation croisée). Les familles sélectionnées fournissent le nouveau vecteur de caractéristiques réduit par rapport à l’initial. Il est utilisé dans le procédé de sélection de caractéristiques suivant.

68

10. Sélection de caractéristiques par Force Brute

La sélection de caractéristiques est opérée en ne conservant que les meilleures familles de caractéristiques issues de l’analyse de la première étape de sélection. Le but est de réduire la complexité algorithmique de la sélection afin d’augmenter la limite de taille des vecteurs à explorer. Je propose dans ce paragraphe un nouvel algorithme de sélection utilisant les critères proposés dans la Section 9.2.2 et 10.2.2 afin d’agréger les caractéristiques optimales dans une combinaison de caractéristiques de taille minimale.