• Aucun résultat trouvé

Principes de la méthode proposée

Modèle adaptative d'apprentissage on-line via la cohérence temporelle

4.2 Principes de la méthode proposée

du nerf automatiquement an d'assurer une localisation correcte dans le temps. En eet, la co-hérence temporelle représente une information relativement stable dans le temps, par exemple la forme et la position du nerf dans une séquence d'images US contiennent une certaine information répétitive. Cette répétition dénie la cohérence temporelle. Cependant, pour trouver l'information cohérente dans un intervalle de trames successives, nous utilisons un apprentissage on-line, capable de modéliser la cohérence temporelle en s'adaptant aux diérentes situations de cette cohérence.

Une fois les problématiques de cohérence temporelle et d'apprentissage on-line dénies, nous avons mené une étude sur ces problématiques an de trouver la modélisation adéquate à l'aspect spatial et dynamique du nerf dans une séquence d'images US.

Dans ce chapitre, nous commençons par montrer les principes de la méthode proposée dans la Section 4.2, d'une part. D'autre part, la méthode proposée est présentée et analysée dans la Section 4.3. Ensuite dans la Section 4.4, une comparaison quantitative est donnée pour prouver la performance de notre méthode. Finalement, le document se termine par quelques conclusions dans la Section 4.6.

4.2 Principes de la méthode proposée

4.2.1 Cohérence temporelle

La cohérence temporelle a été utilisée pour diérentes problématiques comme le traitement d'images, l'évaluation de performance et la détection d'objet par suivi. Par contre, la cohérence temporelle a été moins utilisée pour résoudre les problèmes de traitement d'images US. Cependant, il existe quelques travaux traitant de la cohérence temporelle pour améliorer les images US, par exemple dans [19], un algorithme basé sur la régularité temporelle a été proposé pour ltrer et améliorer les séquences d'images multimédia qui soufrent de tremblements visuels. D'autre part, la cohérence temporelle a été appliquée pour l'évaluation de la qualité de détection par suivi sans recours à la vérité terrain. Ces méthodes se basent souvent sur des propriétés d'estimation de trajectoire comme la cohérence de zone [31], l'erreur dynamique de spectre [198] ou leurs com-binaisons [116, 217]. Pour ce qui concerne la détection d'objet par suivi basée sur la cohérence temporelle, il est souvent lié à la cohérence de mouvement [142, 155]. Dans [142], les auteurs ont proposé une approche basée sur la classication de chaque paire de trames successives selon la co-hérence du mouvement de l'objet associé. Une autre méthode de détection d'objet par suivi à base des positions cohérentes dans le temps a été proposée dans [155], en exploitant aussi la cohérence de mouvement. Autrement, la plupart des travaux sur les méthodes de détection d'objet par suivi basées sur la cohérence temporelle utilisent l'estimation de mouvement pour analyser la cohérence entre les trames dans une séquence d'images. Toutefois, ces techniques sont moins ecaces dans les séquences d'images US. Néanmoins, dans [154], les auteurs ont étudié les algorithmes de détection basés sur la cohérence temporelle du mouvement à grande échelle dans des séquences d'images US

4.2. PRINCIPES DE LA MÉTHODE PROPOSÉE

an de gérer les problèmes cardiaques et respiratoires. il en ressort que ces méthodes sont insuf-santes pour le détection du nerf dans une séquence d'images US, à cause de leur sensibilité aux bruits et leur dépendance à l'initialisation manuelle.

4.2.2 Apprentissage on-line

Le principal dé de détection des nerfs dans une séquences d'images US est souvent lié à la qualité visuelle des structures nerveuses ; le bruit, le faible écho, les artéfacts et les frontières discontinue, redant la tâche d'identication particulièrement dicile. Pour contourner ces écueils, plusieurs travaux à base de connaissances préalables de la forme et de l'apparence ont été proposés. Tous utilisent un modéle d'apprentissage. Certains s'appuient sur une approche Bayesienne [99]. D'autres sur la modélisation de la forme avec priorité de la texture [82, 205] et quelques uns proposent l'usage des contours actifs à base d'apprentissage [96]. Ces travaux ont montré l'utilité de la multimodalité pour représenter des ROIs dans les images US. Cependant, l'apprentissage on-line a été moins abordée pour la détection dans les séquence d'images US. Or, ce dernier peut apporter des informations utiles liées aux variations morphologiques dans les séquences d'images US. Par exemple dans [252], un modèle d'apprentissage DeepBoost on-line a été utilisé an de rectier les erreurs de détection dans des scènes mutimédias. Dans [131], les auteurs ont proposé un modèle on-line capable d'identier l'arrière plan pour faciliter la détection des objets dans des images aériennes. Les modéles d'apprentissage on-line sont aussi utilisés pour détecter les erreurs de diagnostic. Par exemple dans [266], un modèle de Markov caché adaptatif basé sur un apprentissage on-line a été proposé pour détecter le changement dynamique des machines durant leur durée de vie.

4.2.3 Concept

Dans notre travail, une analyse sur la cohérence temporelle est mise en ÷uvre an de construire un modèle dynamique capable à la fois de prendre en compte les variations morphologiques de la structure du nerf dans les séquences d'images US et d'estimer la qualité de détection pour corriger une fausse détection. Notre modélisation du nerf dans une séquence d'images US est représentée par une machine à états nis, comme illustrée dans la Figure 4.3. Une séquence d'images est donnée en entrée, où chaque trame est passée par l'étape "régions générées par SVM" an de sélectionner les coordonnées de positions (voir la gure 4.4), les conances de classications et les formes associées aux régions prédites.

Notez que dans ce travail, les coordonnées de positions de n trames t (t = 1 . . . n), sont sé-lectionnées à partir d'un ensemble de régions S = {01, . . .0n} prédit par m instances de SVM. Chaque 0tcorrespond aux régions candidates (RSV M k

t )générées par les k instance de SVM pour la trame t, où k = {1, . . . m} et 0t= {RSV M 1

t , . . . RSV M m

t }. Les centroïdes des régions RSV M k t pour

4.2. PRINCIPES DE LA MÉTHODE PROPOSÉE

Figure 4.3  Illustration de la méthode proposée pour détecter le nerf dans une séquence d'images sous forme de machine à états nis

la trame t et l'instance SVM k sont utilisés comme coordonnées de positions (xt k, yt

k). La position (xt

k, yt

k) est représentée par une direction et une amplitude, où un vecteurAB avec A = (0, 0) et B = (xtk, ytk), est utilisé pour calculer sa norme (direction) et son angle (amplitude) de la région RSV M k

t . Un ensemble des régions candidates (S = {01,02, . . .0t}) appartenant aux premières trames est utilisé pour construire le modèle de position, où il est sélectionné selon un seuil de stabilité de leurs coordonnées de position dans le temps (Cpos > τ). Une fois le modèle calculé (CM = 1), les régions candidates sont passées directement à l'étape de prédiction, an de calculer la probabilité de position des nouvelles régions candidates. Ensuite, si la probabilité d'une de ces régions candidates est supérieure à 70% alors une étape de mesure de qualité de détection est lancée pour conrmer la détection du nerf. La machine à états nis est représentée par 3 états principaux, dénis comme suit :

(1) Régions générées par SVM : cette étape génère les régions candidates en utilisant le système de détection basé sur l'information spatiale. Elle fournit les positions (xt

k, yt

k) de l'ensemble des régions candidates 0t obtenu pour t trames, accompagnées par leurs mesures de conance de classication (Conf) (i.e. distance entre l'hyperplan SVM et le vecteur de caractéristiques de cette région candidate) et de leurs formes (Shp) (i.e. segmentation de la régions candidate à partir de l'algorithme PGVF). Cette méthode est décrite en détail dans le Chapitre précédent (cf. Section 3.7).

(2) Le modèle de position : dans cette phase, nous recueillons les coordonnées des régions prédite par SVM en respectant la condition de cohérence de zone (Cpos > τ) an de construire le modèle d'apprentissage on-line, où les positions des régions candidates (pos) sont représentées par les directions (φ) et les amplitudes (η). Une fois que le modèle est construit, la probabilité

4.2. PRINCIPES DE LA MÉTHODE PROPOSÉE

Figure 4.4  Illustration d'un exemple des coordonnées de positions des régions générées par SVM pour une seule trame US. Les coordonnées de position (x1

k, y1k)correspondent aux centroïdes des régions RSV M k

1 générées par k instance de SVM pour la trame 1. Par exemple la région RSV M 5 1

est la région prédite dans la trame 1 par l'instance SV M5 avec un maximum de conance de classication ayant le couple (x1

5, y1

5)comme coordonnées de position de cette région.

a posteriori de la cohérence d'une nouvelle position est calculée an de prédire l'appartenance d'une région d'intérêt au modèle du nerf. Si celle-ci dépasse les 70% (QposPtpos> 0.7) alors la forme et la conance de classication de cette région sont utilisées pour mesurer la qualité de détection. Cependant, le modèle on-line de position est recalculé dans le cas où les positions des régions candidates sont incohérentes (Cpos< τ).

(3) La mesure de qualité de détection : une fois que la région du nerf est trouvée en utilisant le modèle de position, un modèle bayésien naïf est utilisé pour mesurer la qualité de la détection. Ce modèle est basé sur la connaissance préalable pour représenter deux caractéristiques indé-pendamment : la conance de classication (conf) et la forme (Shp). Ce modèle permet de calculer la probabilité de cohérence de la forme et de la conance de classication. Toutefois, si la probabilité est inférieure à un seuil (Q PConf

t PtShp < 0.7) alors tout le processus est re-démarré (CM = 0) pour reconstruire à nouveau le modèle de position avec une nouvelle série de régions candidates.

L'objectif principal de notre méthode est d'exploiter l'évolution temporelle de la structure du nerf dans une séquence d'images US. La méthode proposée est basée sur l'analyse de la cohérence temporelle de position, la forme et la conance de classication an de construire un modèle adaptatif on-line. Cette méthode est capable de gérer la variation d'un environnement anatomique du nerf dans une séquence d'images US.