• Aucun résultat trouvé

Critères de sélection de modèles géométriques

3.3 État de l’art sur la sélection de modèles géométriques

3.3.2 Critères de sélection de modèles géométriques

Alors que l’estimation des paramètres de transformation en vision par ordinateur a fait l’objet d’un nombre important d’études, la sélection de modèles a suscité très peu d’intérêt dans ce domaine. La ma- jorité des travaux concernent l’ajustement de courbe (curve fitting [Kan98]), le recalage d’image (voir par exemple [GBH08]), et la reconstruction de cartes de disparité (range images [BS98]). À notre connais- sance, seul Torr [Tor97,Tor98,Tor02] étudie le problème de la sélection de modèles dans le cadre d’étude qui nous intéresse : le groupement de correspondances entre paires d’images.

Les différents critères du paragraphe précédent permettent de prendre en compte le nombre de pa- ramètres du modèle considéré. Nous avons vu qu’il était également important de prendre en compte la façon dont est calculée l’erreur résiduelle entre les différents modèles.

GIC Pour y parvenir, Kanatani [Kan98,Kan04] montre qu’il faut prendre en compte la dimension de la variété décrite par le modèle utilisé en plus du nombre de paramètres k. Il définit le critère GIC, pour Geometric Information Criterion, fondé sur le critère AIC :

GIC = −2 log(L) + 2(k + Nd) ,

où d désigne la dimension de la variété du modèle utilisé. Kanatani illustre l’intérêt de ce critère pour la comparaison de différents modèles géométriques de courbes : ligne, cercle et ellipse dans le plan, ainsi que plan et droite en 3D.

GRIC Torr montre l’intérêt du critère GIC proposé par Kanatani dans le cas de groupes d’appariements de points d’intérêt [Tor97]. Rappelons que dans ce cas, les échantillons de données sont des correspon- dances appartenant à un espace de 4 dimensions, que l’on note d′ = 4. La dimension de la variété est

inférieure ou égale à 3 (d = 2 pour une transformation plane et d = 3 pour la géométrie épipolaire). Il montre dans un premier temps le gain de cette approche en comparaison du critère AIC sur des données synthétiques et réelles.

Dans [Tor99,Tor02], Torr propose ensuite à partir du critère BIC un nouveau critère intitulé GBIC (Geométric Bayesian Information Criterion). Ce critère, à la manière de GIC, est défini de manière à prendre en compte la dimension d de la variété :

GBIC = −2 log L + λ1N d + λ2k avec λ1= log 4 et λ2 = log 4N .

En raison du problème de la présence de données aberrantes (et ce, potentiellement en grande propor- tion), il montre que le critère GIC n’est pas robuste. En s’inspirant des travaux de Ronchetti [HRRS05], qui défini un critère AIC robuste (AICR) en utilisant une pondération sur l’erreur résiduelle (fenêtre de Hubert), il propose de manière analogue dans [Tor97, Tor98] le critère GRIC pour Geometric Robust Information Criterion, une extension robuste du critère GIC. Pour cela, il utilise une estimation robuste de l’erreur résiduelle, à la façon des M-estimateurs (procédé qu’il a par ailleurs utilisé pour MSAC et MLESAC [TZ00]). Les données sont entachées d’erreurs indépendantes et normalement distribuées, de moyenne nulle et de variance σ2 connue. Rappelons tout d’abord l’expression des critères AIC et GIC

dans le cadre des hypothèses utilisées par Torr :

AIC = −2 log(L) + 2k = 1 σ2 N X i=1 r2i + 2k et GIC = 1 σ2 N X i=1 r2i + 2(k + N d) .

En présence d’outliers, Torr préconise l’utilisation du critère suivant :

GRIC = N X i=1 ρ(ri) + λ1N d + λ2k avec ρ(r) = min{ r2 σ2 , λ3(d ′ − d)} ,

où le terme (d′− d) est appelé « co-dimension », représentant la dimension de la contrainte utilisée pour

le calcul de l’erreur résiduelle : d′−d = 2 pour les transformations planes et d−d = 1 pour la géométrie

épipolaire. La constante λ3représente l’opposé de la log-vraisemblance de la distribution uniforme des

outliers. Dans [Tor98], Torr fixe λ1 = λ2= λ3 = 2 pour ses expériences.

Dans [Tor02], Torr examine en détail les hypothèses sur les distributions des inliers et des outliers. Il redéfinit alors le critère GRIC selon ces distributions et le taux d’outliers :

GRIC = N X i=1 ρ(ri) + λ1N d + λ2k avec λ1 = log  L2 2πσ2  et λ2 = log N ,

où L2 est l’aire de l’image (supposée carrée, de côté L) et où la fonction de pondération ρ est définie

comme : ρ(r) =      r2 σ2 en absence d’outliers min{r 2 σ2 , λ3} en présence d’outliers , avec λ3 = 2 log  p 1− p  + (d′− d)λ1 ,

où p est un a priori sur le taux d’inliers.

Ce critère est utilisé par Pollefeys et al. [RP05] pour détecter, dans une séquence vidéo, les paires d’images où la transformation épipolaire l’emporte sur l’homographie. Ceci permet de sélectionner les vues principales servant à la reconstruction 3D de la scène. Schindler et al. [Sch06] utilise également ce critère pour sélectionner les modèles géométriques de chaque objet détecté entre plusieurs vues d’une scène.

Comme nous avons pu le voir dans ce chapitre consacré à l’état de l’art des méthodes de groupe- ment, la majorité des approches proposées reposent en pratique sur un certain nombre de paramètres de détection. Le réglage de ces différents paramètres suppose toujours une certaine connaissance a priori sur les données qui sont examinées. Dans le prochain chapitre, nous proposons une approche automa- tique de groupement multiple et de sélection de modèles géométriques qui ne requiert aucun réglage de paramètres. Cette approche s’inspire de la méthode de groupement a contrario proposée dans [MS04].

Chapitre 4

MAC-RANSAC : groupement multiple

et sélection de modèles

Dans le chapitre précédent ont été présentées les méthodes robustes de groupement multiple et de sélection de modèles, utilisées dans la littérature pour la reconnaissance d’objets. Nous avons vu que, pour l’essentiel, ces méthodes reposent sur un certain nombre d’hypothèses (en particulier sur la distri- bution des inliers et des outliers) qui nécessitent d’être vérifiées par les données, et qui requièrent en outre quelques connaissances a priori pour la prise de décision (typiquement la variance σ2sur l’erreur

résiduelle des points d’intérêt).

Dans ce chapitre, nous introduisons un algorithme de détection multiple qui ne requiert aucun réglage de paramètres de décision. Pour cela, nous nous sommes inspirés des travaux de Moisan et Stival [MS04], qui ont défini une mesure de qualité du groupement de correspondances sous contrainte épipolaire, dans le cadre de la théorie de la détection a contrario. Nous allons dans un premier temps rappeler son principe dans le cadre d’une utilisation usuelle1de RANSAC, que l’on désignera par la suite comme l’algorithme AC-RANSAC. Nous étudierons ensuite son application pour le groupement de correspondances obte- nues à l’aide d’un critère de mise en correspondance automatique de descripteurs locaux (section 4.2). Une nouvelle mesure de qualité du groupement de correspondances sera présentée pour les transforma- tions géométriques du plan dans la section4.3, en vue de la sélection de modèles. En section4.4, nous proposerons de nouveaux critères de groupement en vue de la reconnaissance d’objets multiples.

Le nouvel algorithme obtenu, MAC-RANSAC, est évalué expérimentalement sur de nombreux exem- ples en dernière section de ce chapitre.

Ces travaux ont fait l’objet d’une publication dans [RDGM10].

4.1 Rappel sur AC-RANSAC

Dans [MS04], deux améliorations importantes de l’algorithme RANSAC sont présentées. La pre- mière consiste en une nouvelle mesure de qualité des groupes testés lors du processus d’échantillonnage de RANSAC. Cette mesure, appelée rigidité, est introduite pour l’évaluation et l’optimisation de la trans- formation entre deux vues stéréoscopiques (géométrie épipolaire). Le seuil de détection de la rigidité est estimé de manière automatique, sans nécessiter de réglage de la part de l’utilisateur ou de connaissance a priori. La seconde contribution est une nouvelle stratégie d’échantillonnage, ORSA (Optimal Random SAmpling), qui s’appuie sur la rigidité des groupes testés. Nous nous référons à l’ensemble de l’algo- rithme par l’acronyme AC-RANSAC.

1C’est-à-dire tel qu’il a été proposé dans [MS04], pour la détection d’une unique transformation épipolaire entre une paire d’images.