• Aucun résultat trouvé

Estimateurs robustes des moindres carrés

3.2 État de l’art sur le groupement de correspondances de points

3.2.1 Estimateurs robustes des moindres carrés

Considérons le problème de l’estimation directe des paramètres de la transformation d’un objet à partir d’un ensemble de correspondances C de taille N. Nous avons vu qu’il suffisait de choisir n couples de points d’intérêt pour définir de manière unique une transformation T . En raison de l’erreur sur la position des points, il est alors nécessaire d’estimer la transformation d’un objet à partir d’un plus grand nombre de correspondances N > n. Dans ce cas, on obtient un système d’équations surdéterminé.

L’approche la plus simple pour estimer directement la transformation d’un ensemble de correspon- dances est la méthode des moindres carrés (notée LS, pour Least Square). Elle consiste à définir la trans- formation optimale TC pour l’ensemble C comme la transformation minimisant l’erreur, définie comme

la somme des résidus au carré de chaque couple de points :

e =

N

X

i=1

r2i .

Différentes définitions pour les résidus ri peuvent être utilisées (§3.1.3.3), un choix usuel étant l’erreur

algébrique.

Remarque 1 :

Si le modèle géométrique choisi est la similitude ou la transformation affine, la solution des moindres carrés peut être exprimée analytiquement. Par contre, dans le cas de l’homographie et de la géométrie épipolaire, les matrices sont définies à un paramètre d’échelle près (équations (3.1) et (3.2)), ce qui se traduit par un système d’équations linéaires surdéterminé, à second membre nul. Une solution consiste à utiliser l’algorithme DLT (Direct Linear Transformation), qui repose sur une décomposition en valeur singulière de la matrice des coefficients du système.

Notons qu’une définition alternative, les moindres carrés robustes, a été proposée par [GL97] pour prendre en compte l’erreur résiduelle maximale pour une classe de perturbation. Cependant, ce type d’approche n’a pas été – à notre connaissance – utilisé pour le groupement de correspondances, où les données sont généralement largement suffisantes pour permettre la définition d’une transformation robuste.

À titre d’exemple dans [Low04], pour une application de reconnaissance d’objets, la transformation affine est définie comme la solution des moindres carrés à partir de correspondances de points d’intérêt.

Estimateurs robustes Le principal défaut des méthodes aux moindres carrés est la définition de l’er-

reur quadratique e qui la rend très sensible aux données aberrantes (outliers). Pour qualifier ce phé- nomène, on parle de « point de rupture » (breakdown point en anglais) : il s’agit du taux maximal de données aberrantes auquel un estimateur est robuste. Avec les moindres carrés, il suffit théoriquement d’une seule correspondance incorrecte pour perturber l’estimation de la transformation. Autrement dit, le taux d’outliers toléré est nul.

Diverses alternatives ont été proposées pour obtenir un point de rupture plus élevé, dont voici les plus connues. Rousseeuw a tout d’abord introduit la méthode des Moindres Carrés Médians [Rou84] (notée LMS, pour Least Median of Squares), où l’erreur est définie de la manière suivante :

Avec l’utilisation du médian, le point de rupture est de 50%, ce qui signifie que la moitié des données peut être contaminée par des outliers. La contrepartie de ce gain énorme en termes de robustesse est que l’es- timation du modèle est seulement optimale pour la moitié des données, ce qui est une grandeur arbitraire. Pour remédier à cela, Rousseeuw a ensuite proposé dans [Rou85] une méthode des moindres carrés dits « tronqués » (notée LTS, pour Least Trimmed Square), qui consiste à fixer le nombre d’échantillons k utilisés dans le calcul de l’erreur :

e =

k

X

i=1

ri2,N2+ 1≤ k ≤ N .

La constante k permet d’ajuster le point de rupture de la méthode : plus k tend vers N/2, plus l’estimateur est robuste, et moins la précision est grande (à supposer qu’il existe plus de k inliers). L’inconvénient de cette approche est sa mise en œuvre, beaucoup plus lente et complexe que les simples moindres carrés.

Plus généralement, les méthodes appelées M-estimateurs [Hub81] (M faisant référence au maximum de vraisemblance), consistent à utiliser une fonction de coût ρ qui varie selon l’amplitude du résidu. L’expression de l’erreur devient :

e =

N

X

i=1

ρ(ri)

avec ρ une fonction de coût, telle que la fenêtre de Huber ou de Tukey. Cette fonction revient générale- ment à définir e comme une moyenne pondérée des résidus aux carrés. Les poids dépendent d’un seuil sur la valeur des résidus qui permet grossièrement de définir un échantillon en tant qu’inlier ou outlier. Les résidus plus petits que le seuil ont alors un poids proche de l’unité, tandis que les résidus plus grands que ce seuil ont un poids proche de 0. Le seuil est choisi en fonction de l’écart-type des erreurs sur les données. Bien que le point de rupture théorique des M-estimateurs est de 0%, ce sont des estimateurs connus pour être beaucoup plus robustes que les moindres carrés.

Considérations pratique pour la reconnaissance d’objets À ce stade nous devons rappeler que

dans notre cadre d’étude, la proportion d’outliers est très variable selon le type de scénario envisagé. Lorsque l’on compare deux images n’ayant aucun objet en commun, toutes les correspondances validées par le processus de mise en correspondance seront donc fausses. La proportion d’outliers est dans ce cas de 100%. Il nous faut donc un critère de décision robuste nous permettant d’affirmer qu’il n’y a pas d’objet à détecter dans un tel cas de figure, ce que ne permettent pas les différents estimateurs présentés ici. Un autre cas de figure auquel on s’intéresse est la reconnaissance d’objets multiples, c’est-à-dire de plusieurs objets ayant chacun une transformation qui lui est propre. Nous avons vu dans la section d’introduction à ce chapitre que le problème de leur détection se ramenait à celui du groupement multiple de correspondances. Or, il est important de noter qu’en cherchant à estimer la transformation d’un seul objet, les correspondances liées aux autres objets se comportent comme des outliers. Ceci signifie, dans le cadre de la détection multiple, que le taux d’inliers correspondant à un unique objet peut ainsi être très faible. Pour ces deux raisons essentielles, il n’est donc pas envisageable d’utiliser les différentes méthodes d’estimations présentées dans ce paragraphe.

Pour permettre la détection et l’estimation sur des données présentant de telles caractéristiques, une autre famille de méthodes a été proposée dans la littérature : la transformée de Hough [Hou59] et algo- rithme RANSAC [FB81]. Ces deux approches, très différentes dans leur mise en œuvre, reposent sur la même notion de consensus (ou de « vote ») : en échantillonnant aléatoirement les données, on cherche à détecter un groupe de points cohérents selon une même transformation géométrique. Dans les deux pa- ragraphes suivants, nous présentons en détail ces deux méthodes qui sont très largement utilisées dans le domaine de la vision par ordinateur, et dont diverses extensions ont été proposées pour la reconnaissance d’objets.