• Aucun résultat trouvé

Performances de l’Analyse en Composantes Principales

Dans cette section, les vecteurs obtenus par ACP sont compar´es aux i -vecteurs [Larcher et al., 2012b] sur le plan des performances et de temps de calcul pour la v´erification du locuteur.

Syst`emes et protocoles

Les di↵´erents syst`emes consid´er´es dans cette ´etude ont ´et´e ´evalu´es sur la partie homme de la tˆache principale de NIST-SRE081.

Tous les syst`emes propos´es partagent des composantes communes :

— les param`etres acoustiques sont compos´es de 13 coefficients PLP ainsi que de leurs d´eriv´ees premi`eres et secondes ;

— un unique mod`ele du monde `a 512 distributions a ´et´e appris sur des donn´ees t´el´ephone et microphone provenant de NIST-SRE04 et NIST-SRE05 ;

— ces mˆemes bases de donn´ees augment´ees de NIST06 et SwitchBoard ont ´et´e uti-lis´ees pour l’apprentissage des di↵´erents param`etres des syst`emes ;

— tous les vecteurs extraits sont centr´es, r´eduits et divis´es par leur norme euclidienne comme d´ecrit dans [Garcia-Romero et Espy-Wilson, 2011].

Quatre syst`emes sont compar´es :

IV-PLDA est un syst`eme i -vecteurs classique. Le Factor Analyser est utilis´e pour apprendre une matrice de rang 500. Les i -vecteurs extraits selon l’´equation 5.1 sont normalis´es avant que les scores de v´erifications ne soient calcul´es grˆace `a un mod`ele PLDA. Ce syst`eme constitue le syst`eme de r´ef´erence ;

IV-Mahalanobis est un syst`eme identique au pr´ec´edent except´e que les scores de v´erifications sont calcul´es grˆace `a une distance de Mahalanobis ;

ACP-Mahalanobis pour chaque session, les super-vecteurs sont estim´es par une adap-tation MAP du mod`ele du monde et projet´es dans un sous-espace propre de dimen-sion 500 grˆace `a une ACP. Les vecteurs obtenus sont normalis´es de la mˆeme fa¸con

1. http://www.itl.nist.gov/iad/mig/tests/spk/2008/index.htmlvu le 15/10/2018

que les i -vecteurs et les scores de v´erifications sont calcul´es grˆace `a une distance de Mahalanobis ;

IV-ACP-Mahalanobis des i -vecteurs sont extrait selon l’´equation, 5.1 mais la ma-trice ⌃ utilis´ee est la matrice de projection de l’ACP calcul´ee pour le syst`eme ACP-Mahalanobis. Les i -vecteurs obtenus sont normalis´es comme pour les autres syst`emes et les scores sont calcul´es grˆace `a une distance de Mahalanobis.

Except´e pour le syst`eme de r´ef´erence qui correspond au syst`eme ´etat-de-l’art `a l’´epoque o`u les travaux ont ´et´e r´ealis´es [Garcia-Romero et Espy-Wilson, 2011], les autres syst`emes compar´es utilisent tous une distance de Mahalanobis en raison des bonnes performances obtenues avec cette m´etrique pour le syst`eme qui nous int´eresse ici : ACP-Mahalanobis. De plus, l’utilisation de la distance de Mahalanobis permet de supprimer pour ce syst`eme toute utilisation du Factor Analyser et d’estimer les performances d’un syst`eme enti`erement d´eterministe.

Performances pour la v´erification du locuteur

Les taux d’´egales erreurs (EER) obtenus par les 4 syst`emes consid´er´es sont pr´esent´ees dans le tableau 5.1 pour les 8 conditions de l’´evaluation homme NIST-SRE08.

Table 5.1 – Performances des di↵´erents syst`emes pour les 8 conditions de l’´evaluation NIST-SRE08 (tests hommes) en termes de taux d’´egales erreurs (% EER).

Condition

Syst`emes

IV-PLDA IV-Mahalanobis IV-ACP-Mahalanobis ACP-Mahalanobis

det 1 5.15 4.95 3.77 4.90 det 2 0.81 0.62 1.21 1.04 det 3 5.37 5.13 3.91 5.11 det 4 3.73 4.10 3.87 3.95 det 5 3.14 3.61 4.06 3.64 det 6 4.12 5.03 4.35 5.56 det 7 1.37 1.96 1.37 2.49 det 8 0.56 1.32 0.44 1.19

Conform´ement `a nos attentes, l’approche IV-PLDA obtient les meilleures performances dans 4 des 8 conditions. Il est cependant int´eressant de noter que dans les deux conditions 1 et 3, ce mˆeme syst`eme est moins bon que tous les autres syst`emes pr´esent´es.

CHAPITRE 5. APPROCHES D´ETERMINISTES

Cependant, les taux d’´egales erreurs obtenus dans les conditions incluant des donn´ees t´el´ephoniques (conditions 4 `a 8) laissent penser que la classification par distance de Mahalanobis est moins robuste a la variabilit´e du canal de transmission que l’Analyse Lineaire Discriminante Probabiliste.

Le syst`eme IV-ACP-Mahalanobis utilisant la matrice calcul´ee par ACP pour extraire des i -vecteurs obtient les meilleures performances dans 4 des 8 conditions tout en ´etant rela-tivement proche du syst`eme IV-PLDA dans les 4 autres conditions. D’apr`es ces r´esultats, il semble que l’utilisation de la matrice obtenue par Analyse en Composantes Principales sur les super-vecteurs peut ˆetre utilis´ee directement afin d’extraire les i -vecteurs.

Le syst`eme ACP-Mahalanobis utilisant directement la projection orthogonale des super-vecteurs sur la matrice obtenue par PCA ne se distingue dans aucune des conditions. En revanche, il obtient des taux d’erreurs plus faibles que le syst`eme IV-PLDA dans 2 des 8 conditions. Ces r´esultats sont d’autant plus int´eressants que ce syst`eme est totalement d´eterministe.

Comparaison des temps de calcul

Le temps de calcul des deux types d’extracteurs de vecteurs utilis´es est pr´esent´e dans le tableau 5.2. Dans le cas de l’analyse en composantes principales (ACP), le temps de calcul de la matrice correspond au temps total tandis que pour le Factor Analyser le temps donn´e ne correspond qu’`a une it´eration de l’algorithme EM alors qu’il est fr´equent de faire plusieurs it´erations. Les r´esultats pr´esent´es pr´ec´edemment sont donn´es avec 3 it´erations d’EM. Pour la dimension du syst`eme consid´er´e, l’estimation de la matrice d’ACP est 4 fois plus rapide qu’une unique it´eration d’EM pour le Factor Analyser . Mˆeme si ce gain de temps n’est pas primordial dans notre cas, car la matrice peut ˆetre calcul´ee hors ligne sans contrainte de temps, il est int´eressant de voir qu’estimer la matrice d’ACP est plus rapide, d’autant que cette matrice peut ˆetre utilis´ee pour extraire des i -vecteurs.

Table 5.2 – Temps de calcul (en secondes) mesur´e sur un CPU Xeon 3.47GHz pour des extracteurs de vecteur utilisant le Factor Analyser ou une ACP, de rang 500.

Extracteur Calcul de la matrice Extraction des vecteurs Factor Analyser

18,930 2.59

(1 iteration)

ACP 4,498 5.7⇥ 10 4

Comme escompt´e, l’extraction des vecteurs par ACP est beaucoup plus rapide que le calcul des i -vecteurs : 4500 fois plus rapide dans la configuration choisie pour cette

´

etude. L’utilisation d’une ACP pour r´eduire la dimension des super-vecteurs peut aussi ˆ

etre consid´er´ee si les performances ne sont pas critiques pour l’application consid´er´ee. `

A la suite de ces travaux, plusieurs approches ont ´et´e propos´ees pour acc´el´erer le temps de calcul des i -vecteurs et r´eduire les ressources n´ecessaires, notamment en ce qui concerne la m´emoire, [Glembeck et al., 2011] certaines pr´eservant les performances des syst`emes i -vecteurs [Cumani et Laface, 2013a,b]. Ces approches reposent sur une compression complexe de la matrice de variabilit´e totale et une approximation des i -vecteurs qui utilise un algorithme d’optimisation par descente de gradient.