• Aucun résultat trouvé

2.3 Syst`emes MoCap

2.3.2 Syst`eme MoCap optique sans marqueurs

Nous avons vu dans le paragraphe pr´ec´edent les avantages et les inconv´enients du syst`eme MoCap optique `a marqueurs. Le principal avantage d’un tel syst`eme est sa pr´ecision de recon-struction 3D `a cause de la haute r´esolution des cam´eras utilis´ees. Malheureusement, le coˆut exhaustif de ces mˆemes cam´eras pr´esente l’inconv´enient majeur de ce syst`eme.

Ici, vient le rˆole d’un syst`eme MoCap optique sans marqueurs comme une solution aux probl`emes dont souffre le syst`eme MoCap optique `a base de marqueurs. Cette technique

ap-pel´ee : ”Markerless Motion Capture (MMC)” en anglais, consiste `a reconstruire le mouvement d’un acteur `a partir d’une ou de plusieurs images 2D enregistr´ees d’une fac¸on `a retrouver les positions et les orientations des parties du corps de l’acteur au fil du temps. Chaque partie est mod´elis´ee par un ”voxel” (un objet interm´ediaire entre le pixel et le vecteur), qui repr´esente un nuage de cubes color´es positionn´es dans l’espace. Le volume de chaque cube d´efini approxima-tivement une des parties du corps, pour enfin, extraire le squelette virtuel tout entier de l’acteur (figure 2.12) [19].

Figure 2.12: Mod´elisation de squelette par voxel [4].

De ce fait, cette technique utilise un mod`ele g´eom´etrique : sous forme de ”Squelette”, (compos´e de cubes ou cylindres articul´es), sous forme d’une grille de surfaces ou sous forme de repr´esentations de densit´e de probabilit´e li´ees au corps de l’acteur [20], pour une identification facile et simple du corps de l’acteur en mouvement `a partir des images 2D acquises.

Les images 2D repr´esentent des donn´ees complexes `a traiter `a cause de multiples facteurs, tels que : textures, lumi`eres, occultations, manque d’informations de profondeur, calibration des cam´eras.

Selon [15], l’auteur propose de diff´erencier les syst`emes MoCap optiques sans marqueurs en deux classes de familles, suivant la nature de l’information extraite:

1. Les syst`emes MoCap optiques sans marqueurs `a estimation de mouvement 2D : cette ap-proche analyse le mouvement humain par l’extraction de ces caract´eristiques (forme, type de mouvement, trajectoire et position des objets d’int´erˆet ...etc.) `a partir des images 2D.

G´en´eralement, un mod`ele 2D explicite de la forme `a suivre est recal´e sur le mouvement ob-serv´e dans les images par l’utilisation de diff´erentes caract´eristiques d´efinies par le type de mod`ele (contours, r´egions de l’image, simples points ...etc.). Ces approches sont utilis´ees pour des applications qui ne n´ecessitent pas une estimation pr´ecise (reconnaissance de geste, surveillance ...etc.) [15].

2. Les yst`emes MoCap optiques sans marqueurs `a estimation de mouvement 3D : Ces ap-proches donnent une meilleure compr´ehension du mouvement en estimant ces param`etres, par l’utilisation d’un mod`ele 3D du corps humain. Le squelette d’animation form´e est habill´e par diff´erentes primitives g´eom´etrique simples, de fac¸on `a mod´eliser les propri´et´es physiques du corps humain [15].

Selon [21], les syst`emes MoCap sont divis´es en trois grandes familles, suivant les algo-rithmes qui tentent de calquer le mod`ele g´eom´etrique `a l’image pour retrouver sa posture au cours du temps:

1. Les algorithmes bas´es sur les mod`eles de mouvement : Ils utilisent les connaissances sur le mouvement pour pr´edire les images futures.

2. Les algorithmes utilisant la vid´eo inverse : Ils utilisent la vid´eo inverse pour inverser la projection et retrouver une posture approchante du squelette `a partir de l’image vid´eo.

3. Les algorithmes utilisant la st´er´eoscopie : Avec plusieurs points de vue d’une mˆeme sc`ene, ces algorithmes essayent de limiter les probl`emes dˆus aux occultations en analysant les im-ages.

Un syst`eme MoCap optique sans marqueurs, utilise g´en´eralement des techniques `a base de deux types de cam´eras : soit des cam´eras ”Red Green Bleu (RGB)” simples ou des cam´eras 3D Kinect de Microsoft(figure 2.13).

Pour la technique qui utilise le premier type de cam´eras RGB, on exige une calibration initiale des cam´eras en d´etectant d’abord l’arri`ere plan de la sc`ene. Ensuite, pour les nouvelles images captur´ees, l’arri`ere plan est soustrait afin d’isoler le sujet en question. De cette fac¸on,

Figure 2.13: Cam´era 3D Kinect de Microsoft et prise d’images de profondeur.

le squelette de l’acteur est extrait et on peut extraire ainsi les positions des articulations dans l’espace. Malheureusement, il n’y a aucune information de profondeur fournie par une cam´era RGB, ce qui limite la pr´ecision de positions des articulations pour cette technique.

L’autre technique (`a base de cam´eras 3D), utilise un mod`ele articul´e (squelette) du corps humain pour une bonne pr´ecision de capture de mouvement. Une fac¸on facile offerte par cette technique, pour l’extraction du squelette (figure 2.14) `a partir des images de profondeur fournies pas ce type de cam´eras. La r´esolution de la cam´era 3D utilis´ee, limite la pr´ecision de la capture pour cette technique [22].

Figure 2.14:Extraction des articulations.

Le processus de capture de mouvement est compl`etement effectuer `a travers des logiciels, en supprimant toutes les limitations physiques ce qui impose des contraintes de calculs [23].

L’avantage majeur de ce type de syst`eme est son coˆut mat´eriel minime, ce qui permet de l’utiliser pour des applications `a faible budget. Dans un tel syst`eme, le sujet ne pr´esente au-cune contrainte physique, ce qui permet `a l’acteur de bouger librement dans la sc`ene; donc

peu de contraintes sont impos´ees pour l’environnement (possibilit´e de prendre des mesures `a l’ext´erieur).

Ce type de syst`eme n’est pas parfait et il souffre de quelques probl`emes, telle que l’analyse complexe des images par des techniques de traitement d’images et de vision par ordinateur et qui n´ecessite parfois l’intervention de l’utilisateur. Il souffre aussi du probl`eme d’occultations et de manque de l’information de profondeur surtout pour les syst`emes mono-cam´era. De tels syst`emes doivent avoir de la robustesse et un temps d’ex´ecution raisonnable pour qu’ils puissent ˆetre appliqu´es dans le monde de l’animation ou de l’´etude du mouvement humain [13].

Documents relatifs