• Aucun résultat trouvé

Processus de résolution

objet X representé via sa sphère englobante

4.3 Processus de résolution

Une fois présentées toutes les propriétés offertes à l’utilisateur, nous pouvons détailler le processus de résolution utilisé lors de la construction des volumes sémantiques. Comme nous l’avons présenté dans l’introduction (section 4.1), le processus de résolution est composé de quatre étapes :

1. la description du problème par l’utilisateur via des propriétés cinématographiques sur les objets de la scène 3D,

2. la création et l’intersection des volumes sémantiques répondant au problème, 3. le calcul des meilleurs candidats pour chacun des volumes sémantiques solutions, 4. la présentation des résultats à l’utilisateur.

Nous allons maintenant décrire chacune de ces quatre étapes.

4.3.1 Description du problème

Cette phase correspond à la spécification du résultat souhaité par l’utilisateur. Pour ce faire, celui-ci doit spécifier les relations entre objets grâce aux propriétés décrites dans la section précédente. Dans notre méthode des volumes sémantiques, nous devons connaître toutes les informations relatives à la scène 3D étudiée, c’est-à-dire les positions, les vecteurs d’orientation intrinsèques et les tailles des volumes englobants (cf. section A.2 sur la représentation des objets) de chacun des objets d’intérêt.

Dans l’implémentation actuelle de l’approche des volumes sémantiques (cf. section 4.5), la descrip- tion des propriétés se fait par le biais d’un langage de script. L’utilisateur spécifie une liste de propriétés cinématographiques, en fonction des objets présents dans la scène.

Nous avons également envisagé de proposer une interface graphique permettant la description d’un problème de composition visuelle, en particulier en proposant des greffons (plug-ins) pour les principaux modeleurs du marché (MAYA, 3D STUDIO MAX, etc.). Toutefois, cette interface graphique n’est pas

implémentée dans le système actuel, nous y revenons dans la section 4.8 consacrée aux perspectives.

4.3.2 Le partitionnement sémantique de l’espace : le processus géomé-

trique

L’application du partitionnement sémantique fournit un ensemble (potentiellement vide) de volumes sémantiques : {vs0, . . . , vsn}, avec ∀i, vsi = hSi, Vii (cf. définition 4.1). Du fait des propriétés de

correction de l’opérateur Gf et du processus d’intersection, l’absence de volume sémantique à l’issue de l’étape de partitionnement sémantique nous permet de conclure à l’inconsistance du problème. Toutefois, en aucun cas l’existence d’un volume n’atteste de la présence de solutions, puisque l’orientation de la caméra doit encore être déterminée.

CHAPITRE 4 — Les volumes sémantiques 129

Comme détaillé dans la section précédente, un problème de placement de caméra est modélisé par un ensemble de propriétés cinématographiques pi. La résolution d’un problème de placement de caméra consiste au traitement de la conjonction des pi, c’est-à-dire:

S ipi =TiGf(pi) =T ihSi,Vii =hV iSi, T iVii

Ainsi, le(s) volume(s) solution(s) d’une description utilisateur correspond(ent) à l’intersection Boo- léenne des volumes sémantiques (Vi) de chacune des propriétés. De même, l’étiquette sémantique asso- ciée correspond à la conjonction des étiquettes Si.

Le partitionnement sémantique de l’espace de recherche, aboutissant à la construction des volumes sémantiques vsi (associés aux propriétés pi) permet à la fois d’identifier une inconsistance à partir de

la description utilisateur et dans le cas contraire, de déterminer le nombre de classes de solutions du problème de placement de caméra. En effet, deux cas de figure se présentent :

• l’existence de plusieurs volumes sémantiques disjoints : il existe différentes classes de solutions pour le problème spécifié. Chacune d’entre elles possède des caractéristiques distinctes par rapport aux objets composant la scène 3D. Ces dernières sont identifiées en étudiant les étiquettes séman- tiques associées à chaque volume non-connexe. Nous devons appliquer un processus numérique à chacun de ces volumes, afin de calculer le meilleur représentant de chaque classe de solutions. • l’absence de tout volume sémantique : le problème est sur-contraint. Ce cas de figure illustre l’avan-

tage de la méthode des volumes sémantiques par rapport aux approches existantes. En effet, sans avoir à mettre en œuvre aucun processus numérique nous pouvons conclure à l’inconsistance du problème énoncé.

4.3.3 Calcul de configurations consistantes : le processus numérique

À partir d’un ensemble de volumes sémantiques, le processus numérique détermine le meilleur repré- sentant de chacun d’eux. Cette étape consiste à calculer, à l’intérieur de chacun des Vi, une configuration de caméra consistante, tant au niveau de la position, obtenue par construction des volumes, que de l’orien- tation et de la distance focale. Cette configuration doit à la fois maximiser la satisfaction des propriétés utilisateur et satisfaire :

• les propriétés de cadrage, • les positionnements relatifs, • les orientations.

La satisfaction des propriétés est exprimée par le biais d’une fonction objectif associée à chaque propriété. Le processus d’optimisation est guidé par une fonction de coût définie comme une agrégation de la satisfaction de chacune des propriétés, c’est-à-dire de chacune des fonctions objectif.

Exemple 4.8 (Maximisation de la satisfaction d’une propriété cinématographique). Soit la pro- priété cinématographique d’orientation suivante :

« Voir Calvin de profil gauche ».

Nous associons à cette dernière l’étiquette sémantique : «ProfilGauche(Calvin) ».

Les meilleurs représentants possibles (dont un exemple est représenté en figure 4.17) correspondent aux configurations positionnées sur une droite perpendiculaire au vecteur orientation de Calvin (droite en pointillés) et orientées de façon à regarder son profil gauche (zone délimitée par les droites). Ceci peut

130 CHAPITRE 4 — Les volumes sémantiques

être trivialement exprimé par un produit scalaire exprimé entre l’orientation de Calvin (représentée par un flèche sur la figure) et un vecteur reliant Calvin à la position de la caméra.

Figure 4.17 – Illustration d’une position de caméra maximisant la propriété « Voir Calvin de profil gauche ».

Maximiser la satisfaction d’une propriété revient donc à minimiser les fonctions de coût associées à celle-ci. Le problème du calcul de configurations consistantes consiste à déterminer un septuplet c de valeurs (correspondant aux sept degrés de liberté de la caméra, cf. annexe A.1), tel que :

   minP icostpi(c) ∀j, fj(c) est satisfaite c∈ Vi

Où costpi(c) correspond à la fonction de coût associée à la propriété piet fjreprésente la j

epropriété de framing spécifiée par l’utilisateur.

Comme nous l’avons présenté dans le chapitre précédent, les approches classiques d’optimisation ou d’optimisation sous contraintes, requièrent le plus souvent des fonctions objectif différentiables (p. ex. descente sous gradients). De telles méthodes ne sont donc pas applicables pour la méthode des volumes sémantiques puisque certaines propriétés ne sont pas exprimables algébriquement (non appartenance à une frame par exemple). De plus, nous devons prendre en compte la contrainte non algébrique d’appar- tenance d’un point à un volume 3D (c ∈ Vi). Nous proposons ainsi d’utiliser l’algorithme de Recherche Locale Continue (RLC) numérique présenté dans le chapitre précédent, en section 3.2.13.6.