• Aucun résultat trouvé

3.4 Le test de vérification

3.4.2 La normalisation des scores

La variabilité du canal de transmission est un facteur important de perte de per-formance en VAL [Bin et al.,2007; Li et Porter,1988]. Elle est souvent nommée varia-bilité inter-session, car c’est la différence de contexte entre plusieurs enregistrements qui la caractérise. Les différences de contexte d’enregistrement entre les sessions de test et d’apprentissage introduisent des disparités entre les données. Les paramètres, ex-traits du signal, sont influencés différemment par le canal de transmission et projetés dans des espaces différents. Ceci implique notamment une grande variabilité des scores de vérification. Le seuil de décision, fixé empiriquement, est commun pour toutes les conditions de test rencontrées. Il ne peut être optimal au regard de la variabilité des données. Pour renforcer la robustesse d’un système de VAL, des techniques de com-pensation au niveau des scores ont été proposées.

La normalisation de scores a pour but de proposer un score optimal pour chaque locuteur, Z-norm[Li et Porter,1988;Reynolds et al.,2000], ou pour chaque test, T-norm [Auckenthaler et al.,2000], plus approprié à la comparaison avec un seuil de décision global. Les techniques de normalisation sont essentiellement basées sur l’analyse des distributions de scores clients et imposteurs du système de VAL, supposées distribuées selon une loi normale.

En général il est plus aisé d’estimer la moyenne et la variance des scores imteurs, car les accès imposteurs sont facilement réalisables, alors qu’il est rare de pos-séder,a priori, plusieurs jeux de données étiquetés d’un même locuteur, pour pouvoir estimer correctement sa distribution de scores client. Les techniques de normalisation consistent à retrancher la moyenne de la distribution des scores imposteurs aux scores de vérification, puis à les diviser par la variance :

Score(~^x|S) = Score(~x|S)−µimp

σimp

(3.16) oùµimpetσimpsont respectivement la moyenne et la variance des scores imposteurs.

Il est à noter que le rapport de vraisemblance peut être considéré comme une pre-mière étape de normalisation des scores [Rosenberg, 1992; Reynolds et Rose, 1995].

L’étape de division par la vraisemblance de l’énoncé de test sur le modèle du monde permet de diminuer la variance des scores. Les deux techniques Z-norm et T-norm sont les plus couramment utilisées en VAL, et se différencient par l’estimation des para-mètresµimpetσimp.

3.4.2.1 Z-norm

Dans le cas de la Z-Norm, µimp et σimp sont les scores des séquences imposteurs comparées au modèle de locuteur cible (cf. figure 3.6). Il s’agit d’une normalisation dépendante du locuteur. Des énoncés imposteurs sont utilisés comme accès de test.

Les scores obtenus par ces accès permettent d’estimer la moyenneµimp et la variance σimp. Cette normalisation ne nécessite pas de connaissance sur les énoncés de test. Les paramètres de normalisation peuvent être estimés dès l’apprentissage d’un modèle de locuteur.

La Z-norm a pour but de définir un seuil de décision, dépendant du locuteur et de la qualité de son modèle.

3.4.2.2 T-norm

L’approche de normalisation T-norm repose également sur l’utilisation d’énoncés imposteurs. La différence réside dans le fait qu’ils sont utilisés pour apprendre des mo-dèles imposteurs. Les paramètresµimpetσimpsont estimés par les scores de l’énoncé de test sur cet ensemble de modèles de locuteurs imposteurs (cf. figure3.7). Il s’agit d’une normalisation dépendante du test. La T-norm permet de compenser les variations de conditions d’enregistrements observées dans les tests. Généralement l’effet de cette nor-malisation est d’améliorer les performances pour les points de fonctionnement à faible taux de fausses acceptations. En pratique, les durées des séquences imposteurs de test et d’apprentissage des modèles GMM imposteurs sont choisies de même durée que les séquences envisagées dans le système de VAL, pour coller au mieux aux distributions réelles de scores de fonctionnement. Ces méthodes sont d’autant plus performantes que les imposteurs choisis sont proches des locuteurs cibles [Sturim et Reynolds,2005]. Ces deux normalisations sont souvent combinées, pour compenser à la fois les variabilités de l’apprentissage et des conditions de test. Elles sont appliquées l’une après l’autre pour former ZT-norm ou TZ-norm.

3.4.2.3 La normalisation WMAP

Une autre normalisation WMAP ou World + MAP a été proposée par [Fredouille et al.,1999]. L’idée ici est de projeter les scores dans un espace probabiliste. L’intervalle de mesure de vérification est restreint d’un intervalle non borné (LLR) à un intervalle [0,1]. Le rapport de vraisemblance est remplacé par la probabilitéa posteriorid’être en présence d’un accès client, sachant le rapport de vraisemblance. PosonsY le locuteur de l’énoncé testyetXle modèle de l’identité proclamée. Alors le rapport de vraisemblance LLR(y|X)est remplacé, selon l’approche WMAP, parP(X=Y|LLR(y|X)). En posant LLR(y|X) = Sy et en appliquant la règle de Bayes cette probabilité s’exprime sous la forme :

P(X =Y|Sy) = p(Sy|X=Y)p(X =Y)

p(Sy|X=Y)p(X=Y) +p(Sy|X 6=Y)p(X 6=Y) (3.17) oùp(Sy|X =Y)est la probabilité du score de l’accèsy, sachant que l’accès est client et, respectivement,p(Sy|X 6=Y)la probabilité du score de l’accèsy, sachant que l’ac-cès est imposteur. Les probabilitésp(Sy|X = Y) etp(Sy|X 6= Y)sont estimées à par-tir des distributions de LLR obtenues sur une base de développement. p(X 6= Y) et

2

3

4 1 N

N

N

N Modèle du locuteur X

Signal de test imposteur 2: y

Signal de test imposteur 3: y Signal de test imposteur 1: y

Signal de test imposteur 4: y

Estimation des paramètres de la technique Znorm µ

Distribution des vraisemblances

µ Estimation des vraisemblances:

L (y )X i N

caractérisée L (y )X i

σ

par la moyenne et la variance N σ

X X

X

X

FIG.3.6 –Illustration z-norm, extrait de [Fredouille,2000]

p(X=Y)sont les probabilitésa priorique l’accès soit un accès imposteur et, respective-ment, client. Elles sont constantes et fixées pour une application donnée. A partir de ces paramètres, une fonction WMAP est déterminée. Elle associe une probabilité à chaque valeur de LLR. Les résultats obtenus par cette technique de normalisation sont

compa-N

Estimation des paramètres de la technique Tnorm Signal de test : y

FIG.3.7 –Illustration T-norm, extrait de [Fredouille,2000]

rables à ceux obtenus par les approches état de l’art décrites auparavant. Néanmoins, les auteurs ont démontré que l’apprentissage des paramètres de la fonction de norma-lisation WMAP détermine son efficacité. Elle est alors dépendante de la similitude des deux jeux de données considérés (développement et test).