• Aucun résultat trouvé

C HAPITRE 4 Les volumes

sémantiques

« Ceci n’est pas une pipe. »

René MAGRITTE- La Trahison des images - 1929.

Los Angeles, County Museum.

Dans le chapitre précédent nous avons proposé une réponse purement numérique au problème de placement de caméra virtuelle. Comme nous l’avons montré, les solutions obtenues répondent le mieux possibleau problème posé par l’utilisateur, c’est-à-dire en maximisant le nombre de propriétés satisfaites du problème. Toutefois, le résultat de notre algorithme MAX-NCSP consiste simplement en une instan- ciation des paramètres de la caméra. Cette approche ne permet donc pas de calculer plusieurs solutions lorsque la description utilisateur donne naissance à différentes classes de solutions équivalentes. L’iden- tification et la caractérisation de ces configurations numériquement équivalentes (c.-à-d. solutions du problème) mais sémantiquement différentes (c.-à-d. répondant au problème de manière distinctives) est impossible par application de l’algorithme MAX-NCSP. En effet, les méthodes numériques usuelles de résolution utilisées (propagation de contraintes et recherche locale) ne permettent pas de conserver l’as- pect sémantique des propriétés au cours de la résolution du problème. Dans ce chapitre, nous proposons une approche dédiée à l’identification et à la classification des solutions d’un problème de placement de caméra : la méthode des volumes sémantiques ou plus simplement volumes sémantiques. Les travaux et résultats présentés dans ce chapitre ont fait l’objet d’une publication internationale : [CN05].

4.1 Introduction

L’approche orientée propriété que nous proposons pour le problème de composition visuelle est basée sur la méthode de partition spatiale BSP (Binary Space Partitioning) proposée par Fuchs, Kedem et Naylor [FKN79, FKN80] et utilisée en informatique graphique. Cette méthode consiste à subdiviser les objets de l’espace en les découpant successivement à partir de plans identifiés dans la scène 3D (cf. figure 4.1). Cette subdivision est effectuée jusqu’à ce qu’un critère d’arrêt soit atteint, ce dernier étant spécifié en fonction de l’application visée.

110 CHAPITRE 4 — Les volumes sémantiques A C X Y D E X B C A B C C D E X X Y

Figure 4.1 – Arbre BSP de découpe d’un polygone suivant l’axe X puis l’axe Y.

En imagerie numérique, la méthode BSP peut être utilisée à la fois pour améliorer l’efficacité du rendu d’une scène et pour améliorer l’efficacité du calcul de collisions. Dans le premier cas, le critère d’arrêt de la subdivision est la convexité d’un polygone (c’est-à-dire que l’on subdivise les objets jusqu’à ce que chaque partie soit convexe), dans le deuxième cas il concerne la simplicité des objets de la scène par rapport aux tests de collisions. L’application de la méthode BSP permet la création d’un arbre qui catégorise les polygones d’une scène par rapport à une subdivision de l’espace. Cette structure de don- nées permet une élimination très rapide des polygones lors de l’exploration d’une scène 3D à décor fixe (les polygones du décor appartiennent à l’arbre BSP). En effet, une simple étude de la position de l’ex- plorateur dans le monde permet d’éliminer tous les polygones ne pouvant être vus depuis cette position. Un arbre BSP permet d’améliorer l’efficacité du rendu lors de l’exploration d’une scène 3D à décor fixe (dans un jeu vidéo par exemple) de manière significative.

Concernant la détection de collisions (en robotique par exemple), la méthode BSP permet de décou- per les objets complexes en fragments plus simples pour lesquels un algorithme de détection de collisions efficace peut être employé.

Dans nos travaux, nous proposons de découper successivement l’espace de recherche des positions de caméra. Cette technique est à rapprocher des travaux de Koenderink et van Doorn [KvD79] concernant les aspects visuels et de Plantinga et Dyer [PD90] sur le partitionnement de l’espace en fonction du point de vue (viewpoint space partitioning) dans le domaine de la reconnaissance d’objets.

L’idée sous-jacente aux aspects visuels est de réunir dans un même ensemble de positions 3D tous les points de vue d’un unique polyèdre menant à une image ayant les mêmes propriétés topologiques par rapport à celui-ci. Les frontières des espaces ainsi obtenus sont définies lorsqu’une modification du point de vue amène à un changement d’apparence du polyèdre dans l’image résultat, cf. figure 4.2.

Une fois toutes les frontières calculées pour un même objet, il est possible de recréer des régions consistantes de l’espace par rapport à l’aspect de l’objet à l’écran, ce que les auteurs ont appelé les partitions de l’espace par point de vue (ou viewpoint space partitions).

Nous proposons une extension des aspects visuels et des partitions de l’espace par points de vue selon deux axes :

CHAPITRE 4 — Les volumes sémantiques 111

Figure 4.2 – Graphe d’aspects d’un tétraèdre, d’après Koenderink et van Doorn [KvD79]. On distingue trois types d’aspects suivant le nombre de faces visibles à partir d’un point de vue.

2. la prise en compte de caractéristiques cinématographiques (p. ex. l’occlusion entre objets, les angles de vue relatifs à un objet, etc.) plutôt que topologiques.

Conformément aux viewpoint space partitions, nous introduisons la notion de volume sémantique, comme étant un volume des positions possibles d’une caméra virtuelle qui aboutissent à des rendus qualitativement équivalents en termes de propriétés cinématographiques, c’est-à-dire aboutissant à des prises de vue sémantiquement équivalentes.

La figure 4.3 illustre deux prises de vue sémantiquement équivalentes issues d’un volume séman- tique dont la description associée est : « Obtenir une vue de profil de Super Calvin ». Cette description ne spécifiant pas quel profil est visé, les deux vues sont donc possibles. Chaque volume sémantique est accompagné d’une liste d’étiquettes sémantiques permettant la caractérisation de ce volume en fonc- tion des propriétés satisfaites. En effet, un même volume peut correspondre à plusieurs propriétés ci- nématographiques à la fois. Ces étiquettes sont identifiées à partir de la littérature cinématographique [Ari76, Mas65, Kat91] et concernent soit (i) un unique objet, p. ex. pour la propriété d’angle de vue, soit (ii) un couple d’objets (par exemple pour les propriétés d’occlusion ou de positionnement relatif à l’écran). Il est donc possible de découper l’espace 3D des positions de caméra pour chaque objet et pour chaque couple d’objets de la scène.

Les différentes étapes de création et d’exploitation des volumes sémantiques sont résumées dans le schéma 4.4 qui présente l’approche globale en séparant le niveau d’interaction utilisateur du niveau numérique.

La procédure suivie pour la création des volumes sémantiques consiste à extraire les propriétés (cf. section 4.2) spécifiées sur les objets composant la scène 3D d’intérêt à partir d’une description effectuée par un utilisateur. La prise en compte de chacune d’elles aboutit à la création d’un ou de plusieurs volumes sémantiques satisfaisant la propriété en question. Une fois tous les volumes créés, nous devons

112 CHAPITRE 4 — Les volumes sémantiques

Figure 4.3 – Deux images sémantiquement équivalentes correspondantes à la description « Voir le profil de Super Calvin ».

Machine

...

Résolution

Utilisateur

Présentation

Numérique