• Aucun résultat trouvé

Suivi par des techniques bas´ees sur les histogrammes

1.6 Suivi par des techniques bas´ees sur les

histo-grammes

Les m´ethodes bas´ees sur les histogrammes ont pour but de d´ecrire num´eriquement les caract´eristiques de couleur, de texture ou de contour d’un objet. Pour cela elles codent, dans chaque composante d’un histogramme, l’occurrence d’une information particuli`ere dans l’image. Il est utile de noter qu’un unique histogramme peut ˆetre calcul´e sur toute l’image, on parle dans ce cas de description globale, mais qu’il est aussi possible de calculer plusieurs histogrammes, un pour chaque r´egion de l’image, et on parle dans ce cas de description locale. Dans cette section, nous allons pr´esenter les techniques les plus r´epandues dans la litt´erature comme histogrammes de couleurs, spatiogrammes, HOG (histogrammes de gradients orient´es) et histogrammes de descripteur LBP (Motifs Binaire Locaux).

1.6.1 Histogramme de couleurs

Cette approche utilise la couleur afin de d´ecrire l’objet `a suivre. Dans le cas du suivi des nageurs, l’information de couleur est tr`es importante car, souvent, il y a un contraste entre les diff´erents objets pr´esents dans le bassin. Par exemple, l’eau a une forte composante bleue, la peau une forte composante rouge et le bonnet peut avoir diff´erentes couleurs. Dans ce contexte, l’id´ee principale de cette technique est de repr´esenter chacune des deux images, r´ef´erence et cible, par un histogramme o`u chaque composante code le nombre de pixels d’une couleur donn´ee [16–18]. Le nombre de composantes de l’histogramme, qui correspond aux intervalles de couleur pris en compte, est un param`etre de la m´ethode `a d´efinir `a l’aide d’un ensemble d’apprentissage. La comparaison entre les deux histogrammes, qui correspond `a la ressemblance entre l’image r´ef´erence et l’image cible, s’obtient grˆace au calcul de la distance en utilisant les coefficients de Bhattacharyyia, L2 ou χ2 (chi2) [58]. Dans le cas du suivi, cette m´ethode s’appuie sur l’algorithme de recherche exhaustive en d´efinissant une zone d’int´erˆet dans laquelle l’histogramme de l’image de r´ef´erence est compar´e avec les histogrammes des images cibles. L’image s´electionn´ee correspond alors `a celle ayant donn´e une distance minimum par rapport `a la r´ef´erence.

Malgr´e sa sensibilit´e par rapport au changement des conditions d’´eclairage et aux occultations, cette m´ethode de suivi bas´ee sur l’histogramme de couleurs est tr`es ro-buste, notamment, par rapport `a l’orientation de l’objet `a suivre. Pour cette raison, nous l’utiliserons par la suite pour notre application de suivi des nageurs.

1.6.2 Spatiogramme

Mˆeme si les histogrammes ont montr´e leur int´erˆet pour repr´esenter les couleurs d’une image, ils ne prennent pas en compte les informations spatiales qui peuvent fortement influencer la discrimination entre l’objet `a suivre et le reste de la sc`ene. Pour contourner cette limitation, Birchfield et Rangarajan ont r´ecemment introduit le concept de Spatio-gramme [59], qui ajoute des informations spatiales, moyenne spatiale et covariance des pixels, aux histogrammes. Cependant, cette approche tr`es discriminante rend parfois le suivi trop sensible par rapport `a l’orientation et `a la d´eformation. De ce fait, cette m´ethode est peu adapt´ee au milieu aquatique qui pr´esente de fortes d´eformations li´ees `a l’eau.

1.6.3 HOG

Cette m´ethode est bas´ee sur la construction d’histogrammes permettant de stocker l’orientation des gradients dans une image [21]. L’id´ee des auteurs est que l’apparence et la forme d’un objet peuvent ˆetre caract´eris´ees par la distribution des gradients d’in-tensit´e, ou par les contours, sans la n´ecessit´e de connaˆıtre leurs emplacements.

Le calcul du gradient de chaque pixel s’effectue en appliquant un filtre d´erivatif 1-D centr´e, dans les directions horizontales et verticales. Puis, pour chaque pixel l’angle et l’amplitude du gradient sont stock´es dans un histogramme appel´e histogramme de gradient orient´e.

Cette m´ethode robuste utilise principalement l’information de gradient pour effec-tuer le suivi. Dans le cas du suivi, certaines d´eformations locales, dues aux ´eclaboussures par exemple, vont affecter les contours, et donc les gradients, et rendre la m´ethode peu discriminante. Pour pallier ces limitations, nous combinerons cette approche avec d’autres m´ethodes pour tirer parti de ses avantages et renforcer la robustesse de notre algorithme de suivi des nageurs

1.6.4 LBP

Les motifs binaires locaux (LBP - Local Binary Patterns) [19, 20] sont des descrip-teurs qui d´ecrivent chaque pixel d’une image par leur texture, calcul´ee par rapport au niveau de gris relatif des pixels voisins. Le point fort de cette approche est sa robustesse par rapport `a la variation des conditions d’´eclairage obtenue grˆace `a la relation locale entre le pixel et ses voisins. Pour chaque pixel le descripteur LBP est obtenu grˆace `a l’algorithme de la figure 1.12. Premi`erement, une relation entre les intensit´es d’un pixel central et de ses voisins est calcul´ee en soustrayant l’intensit´e de ceux-ci par l’intensit´e

1.6. SUIVI PAR DES TECHNIQUES BAS´EES SUR LES HISTOGRAMMES du pixel central. Ensuite, on code par le bit 1 les voisins qui ont une intensit´e plus forte que le pixel central et par le bit 0 les autres. Grˆace `a une pond´eration, chaque pixel est d´ecrit par un nombre entre 20 et 27 (8 bits). Enfin, la somme de ces nombres donne la code LBP du pixel central et le descripteur final est une matrice de codes LBP qui peut ˆetre repr´esent´ee par un histogramme.

Bloc 3 x 3 120 121 112 123 119 117 119 116 119 1 2 -7 4 -2 0 -3 0 1 1 0 1 0 1 0 1 1 128 0 2 0 4 0 16

Différence Signe Pondération

LBP = 1 + 2 + 4 + 16 + 128

Figure 1.12 – Processus de calcul du motif binaire local (LBP).

Plusieurs variantes des LBP existent. Parmi les plus connues, on peut citer les LBP uniformes qui permettent de surmonter le probl`eme de la sensibilit´e au bruit et les LBP invariants en rotation qui ajoutent une invariance `a la rotation.

Les descripteurs LBP uniformes ne s’int´eressent qu’aux codes dits “uniformes”. Ceux-ci sont les codes qui contiennent au plus deux transitions de 0 vers 1 ou 1 vers 0. Les autres codes sont consid´er´es comme non-uniforme (bruit). Par exemple : 11100011 contient deux transitions, donc c’est un code uniforme par contre 11010101 ne l’est pas car il contient six transitions. La repr´esentation de l’image se fait en calculant l’his-togramme des codes uniformes puis en gardant tous les codes non-uniformes dans la premi`ere composante de l’histogramme [20].

Pour avoir une repr´esentation robuste par rapport `a la rotation il suffit de consid´erer tous les codes qui contiennent le mˆeme nombre de 1 et de 0 comme ´etant les mˆemes codes, ce que l’on appelle LBP rotation-invariant. Par exemple : 11100101 = 10010111 = 11111000 [20].

Il est possible de consid´erer comme identique les codes uniformes qui disposent d’un mˆeme nombre de 1 et de 0. Ainsi, les LBP obtenus permettent d’avoir une approche robuste par rapport au bruit et `a la rotation mais sensible aux d´eformations et aux occultations [20]. De part ses bonnes performances et sa robustesse par rapport au bruit et `a la rotation nous utiliserons par la suite l’approche LBP uniforme rotation-invariant, en association avec d’autres techniques, afin de renforcer notre suivi des nageurs.

1.6.5 Discussion

Dans cette section nous avons pr´esent´e des approches de suivi par histogrammes bas´ees sur diff´erents descripteurs : la couleur, le gradient et la texture. Dans le prochain chapitre, nous utiliserons les approches bas´ees sur l’histogramme de couleurs, HOG et LBP afin d’effectuer des tests et de les adapter `a notre approche de suivi des nageurs. Partant du principe que chaque m´ethode a des avantages et des limitations, nous pro-poserons de fusionner ces techniques afin de cr´eer une nouvelle approche plus robuste et plus discriminante. Dans ce cadre, nous pr´esentons dans la suite une ´etude g´en´erale traitant de la fusion de descripteurs.