Evaluation des Contributions Présentées

Résumé en Français Sommaire

A.5 Evaluation des Contributions Présentées

Ce chapitre présente une évaluation quantitative de la contribution de cette thèse. Tout d’abord, nous résumons pour le lecteur les aspects spécifiques de chaque contribution (plusieurs images requises par modèle objet pour la première et la troisième méthodes (resp. Sections A.2 et A.4), nécessité d’images d’arrière-plan pour l’apprentissage de la troisième méthode) et nous justifions dès lors le choix de la base de test utilisée pour les expériences. Quelques images de cette base sont présentées en Figure A.9 (la base totale contient 11 objets modèles et plus de 2800 images de test, elle est conçue pour simuler de manière réaliste la vision d’un système robotique embarqué).

Ensuite, un examen en profondeur des performances est effectué sur cet ensemble de données pour chaque contribution présentée précédemment. Nous nous comparons également de manière quantitative avec les algorithmes les plus populaires de l’état de l’art (un RANSAC de base avec des points d’intérêt SIFT, une variation de RANSAC de Chum et al. [CMK03] et Philbin et al. [PCI07] et la méthode de Lowe [Low04]). Les résultats principaux sont présentés dans la Figure A.10 en termes de courbes ROC (plus haut est la courbe, meilleur est le résultat). Nos contributions sont compétitives par rapport à l’état de l’art, en particulier pour la troisième méthode proposée (Section A.4) qui affiche des résultats largement supérieures à toutes les autres méthodes.

Figure A.8 – Exemples de détections sur plusieurs classes issues de la base Caltech-101. Haut : images utilisées pour l’apprentissage (les 20 premières images de la catégorie “Background_Google” de Caltech-101 sont utilisées comme images négatives) ; Bas : exemples de reconnaissance. Les détections montrées ici sont toutes soutenues par un nombre important de votes (i.e. plus de 10).

Figure A.9 – Exemples de détections sur notre base de données en utilisant la troisième méthode proposée (taux de fausses alarmes fixé à 0,01/image pour chaque modèle). Cette méthode est robuste aux occultations, changements d’échelle, changements de point de vue et aux bruits divers comme le flou de mouvement. Les détections correctes sont représentées par des carrés verts, les détections erronées par des carrés rouges et les objets non-détectés par des rectangles bleus en pointillés.

All models averaged. All instances. 0 0,2 0,4 0,6 0 0,1 0,2 0,3 0,4 0,5 TPR FPPI 0 0,2 0,4 0,6 0 0,1 0,2 0,3 0,4 0,5 TPR FPPI RANSAC LO-RANSAC LOWE Our method

Figure A.10 – Performances de détection en termes de courbes ROC. Gauche : moyen-nage vertical ; droite : indifférent au modèle.

de chacune des méthodes présentées (e.g. les types d’objets qui leur conviennent le mieux) à travers quelques expérimentations supplémentaires. Globalement, nos conclu-sions sont que la stratégie de réduire le nombre de points d’intérêt dans les modèles (au moins pendant la première étape du processus de détection) permet d’améliorer les résultats, indifféremment de la méthode utilisée. En outre, nos expériences montrent qu’une faible proportion de l’information totale du modèle suffit pour générer suffi-samment d’hypothèses à faible coût sans pour autant sacrifier le taux de vrais positifs. Cela indique qu’un système de détection efficace peut être décomposé en deux parties : une première partie rapide génère des hypothèses “brutes” en utilisant seulement une fraction minuscule de l’information du modèle, et une seconde partie vérifie ces hypo-thèses avec le reste de l’information du modèle. Pour terminer, il semble extrêmement important d’ajouter d’autres types de caractéristiques dans le processus de reconnais-sance, comme nous l’avons fait pour notre troisième méthode. Cela augmente en effet fortement la robustesse au bruit et améliore les performances dans toutes les situations.

A.6 Conclusion

Dans cette thèse, nous avons présenté trois contributions au domaine de la sance d’objets, avec un accent sur la reconnaissance d’objets spécifiques. La reconnais-sance d’objets spécifiques est un problème qui peut paraître plus simple à résoudre que la reconnaissance de classes d’objets, mais comme nos expériences l’ont montré, le che-min est encore long avant d’atteindre un taux de détection de 100% dans des conditions réalistes d’utilisation. Nos recherches ont cependant abouti sur une nette amélioration des performances de détection en particulier grâce à la deuxième et troisième méthodes

proposées (resp. Sections A.3 et A.4). La première méthode (Section A.2), bien qu’offrant des performances légèrement inférieures à l’état de l’art, permet cependant de récupé-rer la pose 3D d’un objet à faible coût (pas de maillage 3D requis, création du modèle très rapide). Elle peut donc éventuellement être combinée avec une des deux autres méthodes.

Les différentes perspectives qui s’offrent à nous pour poursuivre ce travail de re-cherche concernent aussi bien l’extension de nos travaux à la reconnaissance de classes d’objets (à ce titre, l’utilisation des sous-graphes modèle de la troisième méthode semble particulièrement intéressante) que la prise en compte de la 3D pour les deux dernières méthodes, ou encore la gestion de grande bases d’objets modèles en temps-réel.

