• Aucun résultat trouvé

CHAPITRE 2 REVUE DE LITTÉRATURE

2.2 Suivi oculaire : traitement des données

2.2.3 Mesure de qualité des données

Les grandeurs usuelles de comparaison des systèmes de suivi oculaires et des techniques de détermination du point de regard 3D sont la précision, qui réfère à la différence entre la mesure et la donnée réelle, par exemple de la position du point de regard, et la stabilité qui correspond au bruit que l’on observe dans les mesures alors que le regard demeure parfaitement fixe. Il est possible d’améliorer les performances d’un système à ces deux niveaux, en particulier en effectuant une procédure de calibration pour le premier et en lissant les données pour le second. Holmqvist et al. (2012) soulignent qu’actuellement la manière la plus commune de rendre compte de la précision d’un système de suivi de regard est de se référer aux spécifications données par le constructeur, bien qu’il soit possible d’effectuer ses propres mesures.

Procédure de calibration

La calibration des systèmes de suivi oculaire est une étape essentielle afin de s’adapter aux différences entre les participants ou entre les sessions d’expérimentations (par exemple au niveau de la position relative de la tête par rapport à la caméra). Elle consiste la plupart du temps à demander à l’individu d’observer successivement n points de calibration disposés sur une grille 3D rectiligne dans l’espace réel (Talmi and Liu, 1999, Essig et al., 2006, Kwon et al., 2006). Soit P = pi l’ensemble des vecteurs mesurés par le système, Q = qi l’ensemble

des vecteurs « corrects » correspondants, il s’agit de construire la fonction d’interpolation f : R3 7→ R3, telle que f (p

i) = qi∀i = 1...n (Zachmann et al., 2000). Une fois définie,

l’application de cette fonction sur un nouveau vecteur mesuré p fournit le vecteur q corrigé correspondant.

Dans le cas de la méthode basée sur les multi-quadriques de Hardy (Zachmann et al., 2000), utilisée par exemple pour la calibration des systèmes de repérage électromagnétique dans les voûtes de réalité virtuelle, la forme générale de la fonction est

f (P ) =P

Aiωi(P ), P, Ai ∈ R3 avec ωi(P ) = q

(P − Pi)2+ R2, R > 0

Il s’agit d’une méthode globale, c’est-à-dire qu’elle utilise pour la correction d’une donnée l’ensemble des couples (pi, qi) enregistrés. Les coefficients Ai sont déterminés en résolvant,

selon chacune des coordonnées x, y et z, les systèmes d’équations linéaires résultant de l’ex- pression de f : Pn

j=1Ajωj(pi) = qi

Concernant le paramètre R2, qui influe sur le lissage de la fonction d’interpolation, bien qu’il

n’existe pas de valeur « magique » ou de formule simple et robuste pour le déterminer, les valeurs optimales obtenues expérimentalement sont 10 ≤ R2 ≤ 1000 pour un ensemble de

100 à 200 mesures.

Essig et al. (2006) ont quant à eux mis au point une technique de calibration basée sur des anaglyphes et l’utilisation d’une PSOM, un type de réseau de neurones artificiel. Les participants étaient invités à observer 27 marqueurs situés sur un cube 3 x 3 x 3 dont les plans, parallèles à l’écran, étaient positionnés à 8 cm devant celui-ci, à son niveau, ou à 8 cm derrière. Les enregistrements effectués ne servaient alors pas à déterminer une fonction d’interpolation mais à entraîner une PSOM, chargée ensuite de corriger les vecteurs mesurés dans l’ensemble du volume de stimuli. Comme évoqué en section 2.2.2, ils ont ainsi amélioré la précision de leur système, passant d’une erreur moyenne de 6,18 cm avec une calibration géométrique classique à 2,78 cm, cette diminution étant notablement supérieure pour la coordonnée en z et pour l’arrière-plan.

Débruitage des données

Une étape de prétraitement des données brutes consistant à réduire le bruit peut s’avérer nécessaire afin d’en extraire les informations substantielles, par exemple identifier les mouve- ments oculaires (voir la section 2.2.4). Celui-ci provient de périodes où les caractéristiques de l’œil utilisées (telles que la pupille et le reflet cornéen avec une méthode PCCR) n’ont pu être détectées et suivies, par exemple lorsque « les lunettes, les lentilles de contact, les cils ou les clignements de paupières empêchent la caméra de capturer clairement l’œil »13 (Holmqvist

et al., 2012).

Le débruitage du signal consiste la plupart du temps à lui appliquer un filtre afin de le lisser. Duchowski et al. (2011) ont prétraité leurs données empiriques de profondeur du point de regard en éliminant tout d’abord les mesures aberrantes, situées au-delà de 2 fois la valeur de l’écart-type calculé avec tous les points de mesure pour une même profondeur de cible. Ils ont ensuite appliqué un filtre passe-bas de Butterworth de degré 6 afin d’augmenter la stabilité de leur estimation de profondeur sans latence ou perte significative de précision. Hillaire et al. (2008a) ont également utilisé un filtre passe-bas, avec une fréquence seuil de 15 Hz, afin d’éliminer les tressaillements haute fréquence dans les coordonnées du point de regard 2D fournies par leur système de suivi.

Les méthodes de la médiane et de la moyenne consistent quant à elles à remplacer un enregistrement par l’une ou l’autre de ces valeurs calculée sur une fenêtre temporelle, par exemple de 10 images (Daugherty et al., 2010). Cette dernière est généralement centrée sur l’enregistrement, plutôt que située en amont, ce qui permet de réduire le temps de latence introduit et d’augmenter la réactivité du signal lissé aux mouvements oculaires réellement effectués, mais nécessite la connaissance des enregistrements suivants.

Le filtre ROWA peut a contrario être utilisé « en ligne » car il détecte et remplace les données bruitées en s’appuyant uniquement sur les mesures précédentes. Comparé à d’autres filtres image et audio existants, en utilisant la mesure de déviation angulaire entre une cible et le point de regard associé, il obtient l’une des meilleures performances en termes de PSNR moyen ; 84,41 dB contre 69,67 dB pour un filtre médian (Chartier and Renaud, 2008). En revanche, si le bruit s’avère trop important, ce filtre retournera après un certain temps une valeur constante.

Enfin, afin de gérer une mauvaise qualité du système de suivi de regard et de maximiser la validité des résultats, il peut s’avérer nécessaire d’exclure certaines mesures. Les critères cités par (Holmqvist et al., 2012) comprennent le pourcentage de valeurs nulles dans les données brutes, une faible précision ou encore un nombre élevé d’évènements ayant une vélocité supérieure à 800◦/s.