Reconstruction de surface

Appendix C C.2. Reconstruction de surface

Appendix C C.2. Reconstruction de surface

Appendix C C.2. Reconstruction de surface

Il est aujourd’hui possible d’afficher des modèles 3D de taille de plus en plus importante. Les

pro-grès récents des cartes graphiques et des méthodes de gestion de la complexité rendent possible la

manipulation de modèles gigantesques. Ainsi par exemple dans les jeux vidéos actuels, plus personne

ne s’étonne de pouvoir se déplacer dans une ville. Néanmoins, la question de créer des modèles de

cette taille se pose toujours. Même s’il est toujours possible de faire appel à un ou plusieurs «artistes»

qui réaliseront cette tâche «à la main», cette approche nécessite de plus en plus de temps en temps et

semblent de moins en moins raisonnable. Quelques méthodes sont apparues pour créer des bâtiments

automatiquement mais peu de solutions convaincantes existent pour les objets de taille réduite (boîte

aux lettres, bancs, statues, etc). Cette remarque nous a été notre motivation initiale pour étudier le

problème de la reconstruction de la surface d’un objet à partir d’une séquence d’images. L’objectif

est de mettre au point un processus automatique qui crée un modèle tridimensionnel d’un objet

sim-plement à partir de quelques photographies.

Cette technique vient en complément de l’approche «à la main». De nombreux modèles pourraient

être acquis avec une intervention minimum de l’utilisateur, libre à ce dernier de retoucher les modèles

ainsi obtenus par la suite.

C.2.2 État de l’art

Initialement de nombreux travaux ont été menés pour imiter la vision humaine. Nos deux yeux

as-sociés à notre cerveau sont la preuve que deux images d’une même scène sont suffisantes pour en

retrouver un modèle tridimensionnel.

Les problèmes à deux images (potentiellement étendus à trois) ont été très largement étudiés et

nous ne nous attarderons pas sur leur description. Les principaux résultats qu’il faut néanmoins en

retenir sont :

• La reconstruction consiste essentiellement à être capable de «reconnaître» le même point de

l’espace dans plusieurs images. Une fois plusieurs points 2D associés comme étant les

projec-tions d’un même point 3D, reconstruire ce point n’est qu’une classique triangulation.

• Le problème de la reconstruction à partir d’images est intrinsèquement mal posé i.e. il existe

plusieurs scènes 3D qui produisent exactement les mêmes images.

Avec plusieurs images, on espère améliorer les points suivants par rapport au cas à deux images : une

plus grande robustesse face aux possibles imperfections des images (bruit, flou, etc), la possibilité

de travailler malgré des occultations partielles (quand un objet est caché par un autre seulement dans

quelques images) et une plus grande précision grâce à la redondance de l’information disponible.

Pour résoudre ce problème mal posé, la plupart des méthodes existantes introduisent une

connais-sance a priori sur la scène observée, généralement l’hypothèse que les objets sont (plus ou moins)

lisses. Cette hypothèse est introduite formellement sous la forme d’unefonctionnelle (une

expres-sion mathématique) qui associe une composante qui, pour une reconstruction 3D donnée, évalue la

cohérence ce modèle avec les images et qui évalue aussi à quel point l’hypothèse a priori est

respec-tée. Intuitivement, la fonctionnelle «note» une reconstruction, l’objectif étant d’avoir la

reconstruc-tion avec la «meilleure note possible». D’un point de vue mathématique, il s’agit là d’un problème

d’optimisation.

Les méthodes suivantes sont regroupées selon la forme de leur fonctionnelle et selon la méthode

d’optimisation utilisée.

Pas de fonctionnelle, enveloppe visuelle Ces méthodes se basent la connaissance des silhouettes

de l’objet qui sont obtenues à l’aide de méthode type «écran bleu» ou soustraction d’arrière-plan. Ces

méthodes ont le désavantage de nécessiter cette connaissance supplémentaire et manquent aussi de

détails si peu de points de vue sont disponibles. Néanmoins, elles sont très rapides et robustes aux

effets comme les reflets ou la transparence.

Pas de fonctionnelle, sculpture À partir d’un volume englobant l’objet, l’algorithme supprime

(sculpte) petit à petit les parties incohérentes avec les images. Ces techniques nécessitent aussi de

nombreux points de vue pour être précises et sont peu robustes aux imperfections des images. Elles

sont toutefois simples à implémenter et à mette en œuvre.

Fonctionnelle par ligne, programmation dynamique L’objet est reconstruit tranche par tranche.

Comme dans chaque tranche, on cherche une ligne 1D et non plus une surface 2D, on peut utiliser

la technique de programmation dynamique qui permet de résoudre exactement une fonctionnelle

im-posant une certaine régularité. Néanmoins cette régularité n’est imposée que ligne par ligne et un

post-traitement est nécessaire pour obtenir une régularité entre lignes. Ces méthodes sont aujourd’hui

délaissées au profit des méthodes suivantes plus récentes qui évitent cette séparation en lignes et dont

les résultats sont meilleurs.

Fonctionnelle intrinsèque, niveaux Grâce à la méthode des niveaux, une surface est représentée

implicitement par une fonction potentielle dont elle est un niveau. Cette technique permet de définir

une fonctionnelleintrinsèque (qui ne dépend pas de la paramétrisation de la surface) et gérer

sim-plement la topologie de la surface. Toutefois, cette technique impose que la surface soit deux fois

différentiables partout ce qui produit des résultats trop lisses (sans coin ni arête). Par ailleurs, la

convergence du processus d’optimisation n’est pas garantie en théorie même si elle est observée en

pratique.

Fonctionnelle paramétrique, coupure de graphe La méthode de coupure de graphe permet de

pro-duire des résultats très précis au niveau des silhouettes des objets. Cette approche contrôle la

conver-gence de l’optimisation, voire pour certaines méthodes, en garantit la converconver-gence exacte. Néanmoins

la fonctionnelle proposée est paramétrique (dépend de la paramétrisation de la surface) et surtout, ces

techniques sont appliquées à des cartes de disparité qui sont une représentation «images» des objets

3D. Pour la plupart, ces résultats manquent aussi de précision pour la profondeur.

Fonctionnelle intrinsèque, coupure de graphe Récemment une méthode est apparue pour

manip-uler une fonctionnelle intrinsèque avec une coupure de graphe. Cette approche semblent prometteuse

mais est principalement appliquée au problème de la segmentation de données. Son utilisation dans

le cadre de la reconstruction 3D n’est pas trivial et l’étude en serait intéressante.

Méthodes hybrides Des approches mélangeant plusieurs des techniques précédentes existent et

apparaissent comme une voie naturelle pour tirer profit des qualités de plusieurs techniques. Des

résultats confirmant cette intuition ont été obtenus et cette voie mérite d’être explorée plus encore

qu’elle ne l’est aujourd’hui.

Au vu de cet état de l’art, nous avons choisi une approche basée sur une coupure de graphe afin de