• Aucun résultat trouvé

Présentation générale de l’approche

L’approche émerge du fait que l’on peut superposer des fonctions de base afin de représenter les objets. Comme illustré la figure 3.1, cela correspond à se demander quelle fraction de chacun des blocs de base devrait être utilisée pour construire un objet.

Les fonctions définies sur la surface d’une sphère peuvent être représentées comme une com- binaison linéaire de fonctions de base. Lors de l’étape de reconstruction 3D présentée dans la section 2.3, nous avons obtenu un objet représenté par des voxels que nous cherchons maintenant à identifier. Nous allons utiliser une combinaison de deux techniques utilisant la décomposition en harmoniques sphériques. La première approche, à laquelle je réfèrerai

Figure 3.1 – Reconstruction d’un objet à l’aide de superposition de fonctions de base

ultérieurement comme étant l’approche classique, reprend une idée de Thomas Funkhouser, Michael Kazhdan et de leurs collaborateurs qu’ils ont présentée dans Funkhouser et collab.

(2003). Une traduction française d’une image prise dans leur publication schématise bien leur approche à la figure3.2dans la page24de ce mémoire. L’idée est de segmenter l’espace occupé par l’objet d’intérêt en plusieurs sphères concentriques, pour ensuite décomposer les équations représentées par la présence ou l’absence de l’objet à la surface de chacune des sphères, afin de connaitre quelle proportion de chacune des fonctions de base est nécessaire pour composer cet objet. Nous utiliserons les coefficients, issus de ces proportions, comme critères pour comparer à quel point cet objet ressemble aux autres dans la base de connaissances.

Figure 3.2 – Approche classique de décomposition d’un objet permettant d’en faire son analyse harmonique

La deuxième approche, que je nomme l’approche structurée, s’effectue en trois principales étapes.

1 - La première étape consiste en un regroupement des voxels utilisant une méthode de pro- pagation à partir du voxel le plus près du centre de masse, afin de les segmenter en groupes. 2 - La deuxième étape correspond à effectuer une décomposition à l’aide des harmoniques sphériques de chacun des groupes. On segmente l’espace occupé par les groupes de voxels en plusieurs sphères concentriques, puis on décompose les équations représentées par la présence ou l’absence de voxels à la surface de chacune des sphères, afin de connaitre quelle proportion

de chacune des fonctions de base est nécessaire pour composer cet objet. La position du centre des sphères est égale au centre de masse de chacun des groupes de voxels à décomposer. 3 - Lors de la troisième étape, nous comparons chacun des groupes de l’objet d’intérêt avec chacun des groupes des modèles d’animaux contenus dans la base de connaissances, en tenant compte de la structure hiérarchique des groupes.

La figure 3.3 présente l’approche structurée et donne un aperçu du résultat de l’agrégation des voxels. Elle schématise aussi la décomposition individuelle de chacun des groupes lors de l’utilisation de l’approche structurée. Ces figures proviennent du traitement réel de séquences vidéos de la base à l’aide de notre algorithme.

Figure 3.3 – Approche structurée de décomposition d’un objet afin d’en faire son analyse harmonique

(a) (b)

(a) Résultat du groupement des voxels.

(b) Décomposition en harmoniques sphériques de chaque groupe, tenant compte de la structure de l’objet.

L’approche classique obtient d’excellents résultats avec des objets rigides. Cependant, les ani- maux sont sujets à diverses déformations qui ont des effets drastiques sur le résultat d’une décomposition. Les modèles 3D des animaux ont de fortes variations de forme en raison de leur nature. Par exemple, il suffit que l’animal décide de s’assoir, fléchisse une patte, tourne la tête pour obtenir des résultats différents lors de la décomposition. Malheureusement, il n’est pas vraiment possible d’avoir un exemple de toutes les variations de postures de tous les animaux existants sur terre dans notre base de connaissances. Il serait de toute façon difficile, avec les capacités de calcul actuelles, d’envisager d’avoir le temps de toutes les comparer à chaque identification.

L’approche structurée, à la manière de celle de type «sac de mots», compare chaque petite partie des animaux aux petites parties du modèle de chaque animal. Cependant, à la manière de celle de type «signature squelettique», elle tient compte de la distance entre chaque partie et celle qui est la plus proche du centre de masse du modèle. Comme nous le verrons plus en détail à la section 3.3.1, elle tient compte du nombre de groupes de voxels qui la sépare du groupe de voxels à l’origine de la propagation de voxels. Ainsi, elle prend en compte la structure du modèle. L’approche structurée est beaucoup moins affectée par les variations causées par les

déformations des animaux que l’approche classique, mais utilise moins l’information contenue dans la posture globale de l’animal.

Dans la base de connaissances de l’approche structurée, il y a généralement un seul modèle par animal, et il contient plusieurs petites parties de l’animal. Avec l’approche classique, on peut obtenir de bons résultats en incluant les postures des animaux que l’on a le plus de chance d’observer dans notre environnement d’intérêt. Selon l’application du projet, l’approche ne sera pas la même. Si l’on cherche à identifier une grande variété d’animaux différents, on aura avantage à miser sur l’approche structurée, quitte à mettre plus d’un modèle par animal. Si l’on cherche à différencier une seule catégorie d’animal des autres, on aura avantage à miser plus sur l’approche classique et avoir plusieurs modèles des postures probables de cet animal. Mon concept final concerne un cas général et consiste en un hybride des deux approches.

Documents relatifs