La fonction de sélection S δ - Segmentation d’ image en régions

2.3 Segmentation d’ image en régions

2.3.4 La fonction de sélection S δ

Il est immédiat de construire une fonction de sélection à partir de F en introduisant un seuil. Ce seuil devrait alors être choisi de manière à garantir que cette fonction de sélection, couplée avec l’heuristique d’exploration choisie, constitue un algorithme de segmentation ε- fiable. Mais un unique seuil a peu de sens. En effet, dans une image, il y a beaucoup plus de régions possibles de taille moyenne que de régions de très petite ou de très grande taille. De fait, pour une image de taille N × M , il y a seulement N × M régions de un seul pixel, et une seule région de N × M pixels. Entre ces deux extrêmes, le nombre de régions possibles croît puis décroît de façon exponentielle, de façon assez similaire à des coefficients binomiaux. Aussi, statistiquement, il est beaucoup plus probable d’observer par hasard de grandes différences au sein des couples de régions de taille moyenne qu’au sein des couples de petites ou grandes régions.

Une autre source de variabilité importante est l’heuristique d’exploration elle-même, qui peut être meilleure pour trouver les différences parmi les couples de régions d’une certaine taille, indépendamment du nombre de couples potentiellement analysables. Par exemple, une heuristique naïve qui regroupe itérativement les régions en suivant un ordre “scanline” (par- cours de l’image ligne après ligne) prend souvent de mauvaises décisions locales, et elle est donc moins susceptible de trouver des couples de grandes régions qui ont des différences signi- ficatives que des couples de petite taille, comme le montre la figure 2.12.

Pour prendre en compte ces variabilités et donc être plus discriminant, le seuil devrait donc être adapté à la taille des régions analysées. Il est à noter que l’on retrouve ici une motivation similaire à celles de [GM06] et [RMlHM07], qui ont pondéré les PFA des observations en fonction du nombre de candidats dans leur catégorie. L’intérêt d’un seuillage multiple dans notre cas sera confirmé expérimentalement dans la section 2.3.9. Il y a environ (N ×M )₂ 2 tailles possibles pour un couple de régions dans une image N × M . Ce nombre est trop grand pour associer un seuil à chaque taille, car les seuils seront estimés individuellement par des simulations de Monte-Carlo dans la section 2.3.5. Plus le nombre de seuils est élevé, plus la procédure d’esti- mation sera longue. Pour réduire le nombre de seuils à estimer, nous partitionnons les différents cas en reposant sur une fonction de quantification.

Définition 8. Fonction de partition.

SoitN × M la taille de l’image à analyser et K une constante entière positive. Une fonction de partitionJ est une fonction de quantification qui associe à chaque couple de tailles de régions un entier compris entre1 et K. Il s’agit donc d’une fonction de {1 . . . N × M }2_dans_{{1 . . . K}.}

Une fonction de partition quantifie donc les couples de tailles de région entre 1 et K. Pour construire une fonction adaptée à la segmentation d’image, il est naturel de commencer par une log-quantification des tailles. En effet, un compte précis au pixel près n’est pas nécessaire pour des régions de grande taille, seule une précision relative est utile. Donc, étant donné les dimensions de l’image N et M , nous introduisons lq_S(n), une fonction qui quantifie une taille

de région n (comprise entre 1 et N × M ) sur S niveaux (entre 1 et S) : lq_S(n) = S × log(n) log(N × M + 1) + 1

On peut maintenant associer à chaque couple de régions de tailles (N1, N2) le couple de tailles quantifiées (lq_S(N1), lqS(N2)). Il y a alors S2 tailles possibles. En ordonnant N1 et N2 de façon à ce que N1 ≤ N2, on réduit même ce nombre à S(S+1)₂ . Ceci permet finalement de partitionner les couples de régions en K = S(S+1)₂ tailles différentes, et nous appelons J2d la fonction de partition correspondante.

Cette fonction ne nécessite aucune hypothèse et est donc adaptée à n’importe quelle heuristique, à condition que K soit suffisamment grand pour assurer un échantillonnage assez fin. En pratique, S = 100 est un choix raisonnable pour log-quantifier la taille de chaque région, et le nombre de seuils est alors ramené à K = S(S+1)₂ = 5050. Cependant, une étude empirique sur les heuristiques que nous allons utiliser dans la section 2.3.9 montre que ce nombre de seuils peut être réduit encore plus sans perte significative de précision. En effet, la figure 2.11 montre que pour une taille minimale de région fixée, la taille de la plus grande région n’influence que faiblement la capacité à trouver de grandes différences. Ceci est particulièrement vrai pour les petites régions, qui sont également les plus sensibles. C’est pourquoi nous introduisons la fonction de partition suivante, qui dépend uniquement de la taille de la plus petite région :

J (N1, N2) = bK ×

log(min(N1, N2)) log(N ×M₂ + 1) c + 1

C’est la fonction J qui sera utilisée dans toutes nos expérimentations. Comme il n’y a plus qu’une seule dimension à quantifier, la section 2.3.9 montrera que le nombre de catégories de tailles peut être réduit sans incidence à K = 100.

Nous pouvons maintenant définir la fonction de sélection a contrario finale, basée sur un seuillage multiple de la fonction de différence F (définition 7).

Définition 9. Soit δ = (δ1, δ2, . . . , δK) un K−uplet de seuils réels, et J une fonction de partition. Nous appelons Sδ la fonction qui sélectionne un couple de régions w si et seulement si :

F (w) > δJ (N1,N2)

oùN1 etN2sont les nombres de pixels dans la première et la deuxième région.

Cette fonction sélectionne donc les couples de régions dont les différences, mesurées par la fonction F , sont supérieures au seuil correspondant à leurs catégories de taille. Il reste maintenant à rechercher les valeurs des K seuils qui permettent d’assurer l’ε-fiabilité de l’algorithme de segmentation pour une heuristique d’exploration donnée.

−200 0 200 400 600 800 1000 1200 0 20 40 60 80 100

Moyenne des F(w) observées

Catégorie de taille de R₂

FIG. 2.11 – Moyenne des valeurs de différences F observées en appliquant l’algorithme 4 (voir section 2.3.9) avec une initialisation par ligne de partage des eaux sur des images de bruit blanc uniforme de taille 256 × 256. Pour chaque couple de régions w, soit R1 la plus petite région et R2 la plus grande. Chaque courbe correspond à une catégorie de taille pour R1 fixe, allant de 1 (en bas) à 71 (en haut) par pas de 10 (pour des raisons de lisibilité, les 29 catégories restantes ne sont pas représentées). L’abscisse donne la catégorie de taille de R2. Les valeurs de F ne dépendent que de façon marginale de la taille de R2 pour une taille minimale donnée, surtout pour les petites régions, qui sont les plus sensibles. Ceci conduit au choix de la fonction J de la section 2.3.4.

Dans le document Apprentissage a contrario et architecture efficace pour la détection d'évènements visuels significatifs (Page 62-65)