• Aucun résultat trouvé

2.3 Mise en correspondance de blocs

2.3.5 Approche multir´ esolution

Les m´ethodes exhaustives posent clairement un probl`eme de complexit´e de calcul, surtout lorsque les d´eplacements `a prendre en compte peuvent aller jusqu’`a plusieurs centaines de pixels comme c’est le cas dans certaines s´equences en haute d´efinition. Or ces s´equences justement posent ´egalement probl`eme aux m´ethodes rapides. Les m´ethodes pr´edictives pr´ec´edentes ne convergent pas et tombent facilement dans des minima locaux, ce qui a pour effet de r´eduire les performances des encodeurs vid´eo : le champ de vecteur ne correspond pas au mouvement r´eel, ce qui a tendance `a augmenter l’entropie et donc le coˆut de codage des vecteurs. De plus les r´esidus restent ´elev´es, et des d´efauts de blocs apparaissent.

Une solution pour combiner une robustesse `a des mouvements complexes et de grande amplitude avec un calcul rapide est d’utiliser une technique hi´erarchique bas´ee sur une d´ecomposition multir´esolution de l’image.

2.3.5.1 Pr´esentation g´en´erale

Dans la litt´erature, on retrouve le terme estimation de mouvement hi´erarchique as- soci´e `a diff´erentes techniques : estimation de mouvement `a taille de bloc variable, recherche en diamant avec un motif de taille variable, ou bien les approches mul- tir´esolution [GRA83, SR99]. C’est plus sp´ecifiquement la troisi`eme technique qui nous int´eresse dans cette partie. Par la suite, le terme estimation de mouvement hi´erarchique sera associ´e `a une technique multir´esolution.

Cette technique consiste `a r´ealiser des estimations successives des champs de vec- teurs sur des repr´esentations des images `a des niveaux de r´esolution de plus en plus fins. Les correspondances obtenues `a un grain ´elev´e permettent de restreindre l’espace de recherche des niveaux plus fins. Les op´erations sur le niveau de r´esolution le plus

2.3 mise en correspondance de blocs 37

´

elev´e consiste en une recherche pr´edictive avec des pr´edicteurs fiables issus des niveaux sup´erieurs.

Les diff´erentes variantes de cette technique r´esident dans le choix des param`etres : – la m´ethode de filtrage et de sous-´echantillonnage pour passer d’un niveau `a

l’autre,

– le nombre de niveaux,

– la taille des blocs `a travers la pyramide d’image,

– la pr´ediction `a chaque niveau (propagation des vecteurs entre les niveaux), – la m´ethode de recherche `a chaque niveau.

Nous allons nous int´eresser plus particuli`erement `a l’estimateur de mouvement d´evelopp´e `a Thomson. Il s’agit du HME (Hierarchical Motion Estimator).

2.3.5.2 HME

Une d´ecomposition pyramidale multir´esolution des images permet un raffinement suc- cessif des vecteurs de mouvement. La corr´elation spatiale du champ de vecteur est prise en compte avec une m´ethode pr´edictive `a chaque niveau.

La premi`ere ´etape de la technique consiste `a calculer les pyramides d’images. Pour l’image courante et l’image de r´ef´erence, les repr´esentations `a diff´erents ni- veaux de r´esolution sont calcul´ees. Une image d’un certain niveau est obtenue en sous-´echantillonnant l’image du niveau inf´erieur d’un facteur deux (Fig. 2.13). Un filtre passe-bas Gaussien est au pr´ealable appliqu´e afin d’´eviter des probl`emes li´es au sous-´echantillonnage (repliement de spectre notamment).

Ensuite, l’estimation de mouvement proprement dite peut commencer, en partant du niveau le plus ´elev´e (r´esolution la plus faible). Comme l’image est de taille r´eduite, une recherche exhaustive peut ˆetre effectu´ee, avec pr´ediction du centre de la fenˆetre de recherche grˆace aux vecteurs des blocs voisins d´ej`a calcul´es. La taille des blocs reste constante `a travers la pyramide. Seuls les mouvement dominants sont donc estim´es dans les niveaux de faible r´esolution. Des blocs trop petits ne prendraient pas en compte assez de donn´ees et introduiraient du bruit dans le champ de vecteur.

Les vecteurs sont ensuite propag´es et raffin´es `a travers la pyramide (Fig. 2.13). Pour chaque niveau, une technique pr´edictive est utilis´ee : des pr´edicteurs spatiaux (blocs voisins, m´edian) et hi´erarchiques (issus du niveau sup´erieur et mis `a l’´echelle) sont ´

evalu´es. Un recherche tr`es r´eduite est effectu´ee autour du meilleur pr´edicteur (celui donnant le crit`ere d’erreur le plus faible) pour raffiner la pr´ediction. Pour augmenter la robustesse de l’estimation, une deuxi`eme recherche r´eduite peut ˆetre effectu´ee autour par exemple du second meilleur pr´edicteur, mais cela augmente la charge de calcul. Cette technique permet d’obtenir un champ de vecteur `a la pr´ecision du pixel pour l’image de r´esolution initiale.

Cet algorithme limite les calculs `a effectuer en restreignant la zone de recherche `a chaque niveau. La recherche finale autour du meilleur pr´edicteur peut ˆetre pr´ecise. La zone de recherche couverte est tr`es importante du fait du m´ecanisme hi´erarchique. La technique est donc peu sensible aux minima locaux. De plus, grˆace au m´ecanisme de pr´ediction, le champ de vecteur est homog`ene, et correspond au mouvement r´eel, ce qui est un atout pour un encodeur vid´eo.

En g´en´eral, ce type d’algorithme est moins populaire qu’un algorithme pr´edictif classique, car il requiert plus de puissance de calcul pour la construction de la pyramide

Meilleur candidat à chaque niveau Prédicteur 2 1 0 0 1 Niveau 2 M/4 x N/4 pixels Niveau 1 M/2 x N/2 pixels 0 2 3 Niveau 0 M x N pixels

Zone de recherche réduite

Fig. 2.13 – Estimation de mouvement hi´erarchique

et des traitements dans les niveau hi´erarchiques. Cependant, il offre une meilleure robustesse, et d´etecte les mouvement de grande amplitude. Le r´esultat est tr`es proche du mouvement r´eel et demeure en r`egle g´en´erale homog`ene, ce qui lui permet d’ˆetre plus efficace qu’une recherche exhaustive dans un contexte de compression vid´eo. De plus c’est un algorithme r´egulier, dans le sens o`u le nombre de calcul est relativement constant, ind´ependant de la s´equence.