• Aucun résultat trouvé

Suivi bas´ e sur la mod´ elisation d’objets

Introduction au suivi d’objets en vision artificielle

1.5 Pr´ esentation des m´ ethodes de suivi d’objets

1.5.3 Suivi bas´ e sur la mod´ elisation d’objets

Nous avons vu que dans les approches traditionnelles de suivi bas´ees sur la mod´elisation d’objets, deux approches principales sont g´en´eralement distingu´ees.

Les approches bas´ees sur la mise en correspondance de primitives visuelles utilisent des caract´eristiques locales comme des points, des segments de droite, des arˆetes ou des r´egions. Avec ces techniques, il est possible de localiser l’objet [73] dans l’image courante et de pr´edire les positions des caract´eristiques dans les images suivantes, selon un mod`ele de mouvement [112] [114] et un mod`ele d’incertitude [81]. L’avantage de cette m´ethode est de pouvoir travailler en trois dimensions : les translations et rotations de l’objet peuvent donc ˆetre estim´ees. Dans cette approche, il s’agit donc de mettre en correspondance un mod`ele de r´ef´erenceM et une projectionP de cet objet dans l’image courante. Ceci est r´ealis´e par le biais de l’estimation des param`etres caract´erisant la transformation T du mod`ele d’objet M en la projectionP de cet objet dans l’image. Lorsque l’on s’int´eresse uniquement au suivi de l’objet

1.5. Pr´esentation des m´ethodes de suivi d’objets 27

dans l’image, une alternative consiste `a utiliser des mod`eles approximatifs et `a n’exploiter que des mod`eles d’objet et de mouvement 2D. Il est alors n´ecessaire d’introduire une composante d´eformable pour pouvoir s’adapter aux d´eformations non lin´eaires des projections de l’objet dans le plan image li´ees `a des effets de perspective non prises en compte par ces mod`eles 2D.

Koller et al. [72] obtiennent de bons r´esultats de suivi en utilisant un mod`ele param´etrique 3D d’un v´ehicule. Ce type de mod`ele peut ˆetre ajust´e pour diff´erentes gammes de v´ehicules.

Les mouvements compliqu´es, tels que les demi-tours ou les manoeuvres pour se garer, ont ´et´e correctement suivis en incluant une mod´elisation de l’ombre dans le mod`ele 3D du v´ehicule pour l’am´eliorer de mani`ere satisfaisante. A la diff´erence des m´ethodes de suivi bas´ees sur le mouvement, seul un objet mod´elis´e peut ˆetre suivi. Nous citons ´egalement les travaux de Strom et al. [104] et Basu et al. [7]. Ils d´ecrivent un syst`eme temps r´eel de suivi et une mod´elisation 3D. L’id´ee directrice est de s´electionner un ensemble dense de points caract´eristiques. Ils sont ensuite mis en correspondance d’images en images pour mettre `a jour la pose du mod`ele 3D.

Pour cela, un mod`ele g´en´erique 3D (approximation polygonale) de l’objet est n´ecessaire. D’une mani`ere g´en´erale, les techniques de recherche de pose sont naturellement moins sensibles aux occultations. En effet, elles sont bas´ees sur des correspondances locales. Si plusieurs correspon-dances sont manquantes, la pose peut encore ˆetre calcul´ee.

Ces techniques de suivi, bas´ees sur des primitives [92] [20] extraites de chaque image de la s´equence, diff´erent par les outils de mise en correspondance utilis´es (dans le cas de suivi de points par exemple, choix du plus proche voisin valid´e par des mesures de corr´elation ou par coh´erence temporelle des trajectoires). Des filtres de Kalman sont g´en´eralement employ´es pour r´ealiser le suivi et la pr´ediction des primitives dans l’image suivante. La qualit´e des r´esultats de ces techniques d´epend fortement du contenu de la sc`ene et est tr`es sensible `a la densit´e des primitives dans l’image. Par cons´equent, la robustesse du suivi est ´etroitement li´ee `a la m´ethode utilis´ee pour le calcul des caract´eristiques dans l’image.

Notons ´egalement qu’il est int´eressant de pouvoir suivre les contours d’un objet non rigide et d’analyser leurs mouvements. C’est ainsi que Terzopoulos et al. [71, 83] ont introduit la no-tion de contours actifs ou snake model, c’est `a dire des contours qui peuvent se d´eformer sous l’action de certaines contraintes internes. Par la suite, Curwen et Blake [33] ont propos´e une repr´esentationB-spline des contours actifs et Dubuissonet al.[41] ont utilis´e une repr´esentation polygonale dans les probl`emes de suivi de v´ehicules. Ces diff´erentes techniques sont bas´ees sur

28 Chapitre 1 : Introduction au suivi d’objets en vision artificielle

la mesure spatiale des niveaux de gris ou sur la position des caract´eristiques dans une image.

D’autre part, les approches globales ou bas´ees sur un mod`ele (ou un motif ) uti-lisent le mod`ele dans sa totalit´e. Il ne s’agit plus, dans ce cas, d’utiliser de primitives de haut niveau (points d’int´erˆet) mais plutˆot l’apparence de l’objet. Il s’agit donc de d´eterminer la correspondance entre le mod`ele de l’apparence choisi et l’estimation de la pose. Ces techniques utilisent, par exemple, une classification par hyperplan (“Support Vector Machine”) [93], une repr´esentation des variations de l’apparence de l’objet par une distribution possibiliste [94]

[95], des histogrammes de champs r´eceptifs multidirectionnels [36] ou des transformations de caract´eristiques optimales [62]. Une m´ethode hybride d´evelopp´ee par T.F. Cootes, G.J. Ed-wards et C.J. Taylor [25] utilise un mod`ele statistique de forme et d’apparence en niveaux de gris de l’objet.

Le point fort de ces m´ethodes est leur capacit´e `a traiter des motifs ou des mod`eles com-plexes qui ne peuvent ˆetre mod´elis´es par des caract´eristiques locales. Elles sont tr`es robustes et ont ´et´e ´enorm´ement utilis´ees. Elles sont aussi appel´ees sum-of-square-difference (SSD) puisque elles consistent `a minimiser la somme des carr´es des diff´erences entre un mod`ele de r´ef´erence et une r´egion de l’image. Une norme L2 est g´en´eralement utilis´ee pour mesurer cette erreur.

Historiquement, une recherche exhaustive ´etait utilis´ee. Mais cette strat´egie n’est pas appli-cable dans le cas de transformations plus complexes que des translations 2D, qui n´ecessitent des espaces de param`etres de dimensions sup´erieures. Des m´ethodes plus r´ecentes posent le probl`eme comme un probl`eme de minimisation non lin´eaire, utilisant des algorithmes du type Newton ou Levenberg-Marquard. Darellet al. [35], Brunelli et al. [17] proposent de maximiser un crit`ere de corr´elation entre un vecteur caract´erisant le mod`ele de r´ef´erence et le contenu de l’image. Les temps de calcul, significatifs dans ce cas, peuvent ˆetre r´eduits en travaillant dans des sous espaces de la repr´esentation initiale de l’image [109, 85, 86].

La limitation principale de ces approches est leur manque de r´esistance au regard des occulta-tions. Black et Jepson [13] ont surmont´e cette limitation en reconstruisant les parties occult´ees.

Ils remplacent la norme quadratique g´en´eralement utilis´ee pour construire l’approximation de l’image dansl’espace proprepar une norme d’erreur robuste. Cette reconstruction revient `a une minimisation d’une fonction non lin´eaire, optimis´ee en utilisant une m´ethode de descente de gradient simple. Ils utilisent la mˆeme strat´egie pour trouver la transformation param´etrique alignant le motif sur l’image. Mais cette mise en correspondance est une op´eration coˆuteuse en