• Aucun résultat trouvé

7. La méthode des Images de Classification

7.9. CIs auditives, tentatives récentes

Comme nous l’avons décrit au début de ce chapitre, la méthode des CIs visait initialement à déterminer si, chez un auditeur donné, la détection de ton dans le bruit est réalisée par un Détecteur Énergétique, un Détecteur Spectral, ou un Détecteur d’Enveloppe (Ahumada & Lovell, 1971; Ahumada et al., 1975; Gilkey & Robinson, 1986).

La méthode fut ensuite rapidement adaptée à la modalité visuelle et les applications à des tâches auditives momentanément abandonnées, faute d’une résolution spectro-temporelle suffisante. Le développement des CIs visuelles donna naissance à de nouvelles techniques de calcul, plus puissantes, parmi lesquelles la corrélation inversée.

Ces développements pouvaient dès lors être réinvestis dans le domaine auditif. Près de 40 ans après les premières études d’Ahumada, plusieurs groupes de recherche tentèrent à nouveau d’utiliser les CIs pour répondre { la question de la détection d’un ton dans le bruit.

En 2007, une première tentative, basée sur la méthode de corrélation inversée, appliquée au spectrogramme du bruit, a été proposée par Ardoint et ses collaborateurs (Ardoint et al., 2007). Elle était basée sur un paradigme très similaire { celui d’Ahumada, mais la cible à détecter était ici une sinusoïde porteuse (à 1 kHz) modulée en amplitude à la fréquence de 4 Hz. Chacun des 10 participants exécuta 10000 essais, divisés en 100 sessions. En effectuant la moyenne des spectrogrammes des bruits conduisant à une réponse positive (« la cible est présente ») et en lui soustrayant la moyenne des spectrogrammes des bruits conduisant à une réponse négative (« la cible est absente »), les chercheurs établirent les CIs auditives des participants sur cette tâche de détection.

115

Sur les 10 CIs, 4 montraient une composante modulée à 4 Hz dans la bande correspondant { la porteuse. L’absence de cette composante chez les 6 autres participants fut interprétée par les auteurs comme un signe de l’incertitude du système quant à la phase des signaux auditifs: un stimulus présentant une composante modulée similaire à la cible mais légèrement décalée en phase aura de fortes probabilités d’être détecté en tant que cible. Or la moyenne de toutes ces sinusoïdes déphasées est globalement nulle.

Une étude comparable fut menée en 2012, pour une détection de ton simple, comme dans les expériences d’Ahumada, mais en appliquant un paradigme de choix forcé : { chaque essai, 2 stimuli étaient présentés, l’un contenant la cible dans le bruit et l’autre le bruit seul ou avec un ton non-cible (Joosten & Neri, 2012). Comme précédemment, la technique de corrélation inversée a été employée sur les spectrogrammes des sons, donnant une image possédant une résolution faible mais néanmoins supérieure aux précédentes. Elle était divisée en 7 segments temporels de 40 ms chacun et 30 échantillons fréquentiels répartis selon une échelle logarithmique entre 1247 Hz et 8818 Hz. Chaque participant réalisa environ 7400 choix forcés. La CI résultante, bien que très bruitée, laissait apparaitre un pic positif à la position temps-fréquence de la cible, entouré de pondérations négatives pour les temps-fréquences et les instants adjacents. Ce résultat, cohérent avec celui de l’expérience d’Ahumada (Ahumada et al., 1975), confirmait donc que le système est capable de se focaliser sur une région très restreinte de l’espace temps-fréquence et procède par comparaison avec l’énergie des régions adjacentes du spectrogramme.

En 2009, Shub et Richards utilisèrent un paradigme de détection à la volée (free-running), inspiré des STRFs, pour étudier la détection de ton à une fréquence cible (1000 Hz ou 2431 Hz) dans un bruit diffusé en continu et composé, lui aussi, de tons répartis aléatoirement en temps et en fréquences (Shub & Richards, 2009). Le signal était présenté en 10 blocs de 5 minutes chacun, séparés par des pauses, et les trois participants avaient pour instruction de presser une touche le plus rapidement possible lorsqu’ils entendaient le ton cible. Le calcul de la moyenne des spectrogrammes précédant chaque réponse faisait là encore ressortir la fréquence cible, avec des poids négatifs associés aux fréquences adjacentes. En revanche la variabilité des délais de réponse entraînait une perte importante de résolution temporelle, ce qui conduisit à un abandon de la technique.

Ces trois tentatives récentes d’applications des CIs { des tâches de catégorisation ou de détection auditives se basent sur une transposition directe de la technique de corrélation inversée au spectrogramme du bruit, ou à des versions dérivées du spectrogramme. Leur résolution en temps et en fréquence et leur précision sont intrinsèquement limitées par la quantité de données nécessaires pour ajuster un modèle linéaire contenant un nombre très élevé de paramètres. Il est donc tentant de leur appliquer les développements théoriques plus récents dans le domaine des CIs,

116

comme le GLM. Schönfelder et Wichmann démontrèrent par simulation l’efficacité de la régression pénalisée dans le cadre de la détection de ton dans le bruit (Schönfelder &

Wichmann, 2012). Ils employèrent pour cela une pénalité de parcimonie, légèrement différente de la pénalité de lissage présentée précédemment. Néanmoins le principe reste inchangé : cette régression pénalisée favorise les modèles simples (ici les modèles contenant peu de paramètres non nuls) par rapport aux modèles complexes (contenant un grand nombre de paramètres non nuls), prévenant ainsi tout risque de surapprentissage. Après avoir simulé le comportement de différents observateurs théoriques (Détecteur Energétique, Détecteur Spectral, et Détecteur d’Enveloppe) pour la tâche de détection de ton dans le bruit, les auteurs montrèrent de manière probante que la régression pénalisée permettait de déterminer clairement sur quel caractéristique du son (énergie, spectre ou enveloppe) s’appuyait chaque participant simulé, d’après ses réponses, et ainsi d’identifier le type de stratégie employée. Cette approche est par ailleurs robuste pour une large gamme de SNRs et de bruits internes, contrairement à la corrélation inversée et au GLM non pénalisé.

Bien que ces derniers résultats soient particulièrement encourageants, l’application du GLM pénalisé pour l’identification de la stratégie employée par un participant « réel » lors d’une tâche auditive n’a, { notre connaissance, encore jamais fait l’objet d’une publication.

117