• Aucun résultat trouvé

4.3 Evaluation des performances du système

4.3.3 Influence de la détection d’activité vocale

Des travaux [Bonastre et al.,2004] ont démontré qu’effectuer une sélection plus res-trictive, basée sur un critère d’énergie, apporte un gain de performances en RAL. La fi-gure4.2illustre les courbes DET de performances d’un système de VAL pour différentes configurations de sélection de trames. Le critère de sélection est le critère d’énergie. Le pourcentage de sélection des trames est d’environ 60% pour la configuration ED0.0. Le facteur, permettant de sélectionner des trame classées dans la Gaussienne de moyenne

FIG.4.1 – Influence du genre (NIST SRE 2008, LIA08-ztnorm). Les signaux masculins bénéficient d’un EER plus favorable (6.40%) que les signaux fémninins (8.92%).

FIG.4.2 – Influence de la sélection de trames (NIST SRE 2004).

intermédiaire, est progressivement augmenté. Le taux de trames sélectionnées est maxi-mal pour la configuration ED0.9. Les résultats démontrent la forte corrélation entre la sélection de trames et les performances du système de VAL. Le meilleur résultat est

obtenu pour le système ED0.0 qui n’utilise que les trames de forte énergie (Gaussienne de moyenne la plus élevée).

4.3.3.1 Influence du canal

Pour illustrer les différences de performances, quand le canal d’enregistrement uti-lisé entre les sessions d’apprentissage et de test n’est pas le même, nous présentons les résultats du système de RAL LIA08 sur les données de l’évaluation NIST SRE 2008. La figure4.3 a présente la courbe DET de performance du système de RAL, lorsque les données d’apprentissage et de test sont enregistrées sur le réseau téléphonique. La fi-gure4.3présente la courbe DET de performance du système de RAL, lorsque différents microphones ont été utilisés pour la session de test, alors que les données d’apprentis-sage sont enregistrées sur le réseau téléphonique. Le système de RAL, utilisé pour ces expériences, implémente des mécanismes de compensation de la variabilité du canal de transmission (LFA). Pourtant, une perte relative de 32% est observée à l’EER, lorsqu’il existe une différence de conditions entre l’apprentissage et le test.

a) b)

FIG.4.3 –Expériences sur des signaux d’apprentissage et de test enregistrés : a) sur le même canal (téléphone) , b) sur des canaux différents (microphones) (NIST SRE 2008, LIA08-ztnorm)

4.3.3.2 Influence dumismatchentre les langues

Depuis 2004, dans les bases de données d’évaluation NIST SRE, les langues repré-sentées sont multiples. Le modèle du monde doit être appris en fonction de la ou des langues de test considérées. Pour évaluer l’influence de l’utilisation de la même langue dans le modèle du monde et dans les tests nous proposons deux expériences. Dans un premier temps le modèle du monde est appris avec des données de la base TIMIT

50 40 30

20

10

5

2

0.5

0.1

50 40 30 20 10 5 2 0.5 0.1

Miss probability (in %)

False Alarms probability (in %) (dcf:1.98,eer:3.30) Modele-Monde-Anglais (dcf:1.44,eer:2.56) Modele-Monde-Francais

FIG.4.4 – Exemple de mismatch apprentissage-test, évaluation sur des données de parole de langage français (base BREF). Courbes DET avec l’utilisation d’un modèle du monde utilisant des données anglaises (base TIMIT) et françaises (base BREF).

(anglais). Ensuite nous utilisons des données de la base BREF (français). La lange des modèles de locuteur et des signaux de test est le fançais. La figure4.4présente les ré-sultats de ces deux expériences. Les réré-sultats démontrent que l’utilisation d’un modèle du monde, créé à partir d’enregistrements de langue anglaise, différente de la langue de test, engendre une perte de 29% pour la mesure EER et 37 % pour la mesure DCF, relativement à l’utilisation d’enregistrements de langue française.

4.3.3.3 Influence de la compensation de canal

Nous présentons ici les résultats de l’implémentation de deux approches très répan-dues, pour la compensation de la variabilité canal :

– leFeature mapping, – leLatent Factor Analysis.

4.3.3.3.1 Utilisation duFeature mapping

La figure 4.5 présente les courbes DET d’un système du RAL LIA06-tnorm avec et sans l’utilisation dufeature mapping. Un gain de 10% relatif pour la mesure DCF et de 20% relatif pour la mesure EER est observé lorsque la technique est utilisée.

50 40 30

20

10

5

2

0.5

0.1

50 40 30 20 10 5 2 0.5 0.1

Miss probability (in %)

False Alarms probability (in %) (dcf:4.52,eer:9.42) sans-Feature-Mapping (dcf:4.13,eer:7.83) avec-Feature-Mapping

FIG.4.5 –Expériences avec et sans utilisation de la technique de feature mapping (NIST SRE 2006, LIA06-tnorm). La méthode apporte un gain significatif.

50 40 30

20

10

5

2

0.5

0.1

50 40 30 20 10 5 2 0.5 0.1

Miss probability (in %)

False Alarms probability (in %) (dcf:1.83,eer:4.42) avec-LFA

(dcf:3.83,eer:7.15) sans-LFA

FIG.4.6 –Influence du Latent Factor analysis (NIST SRE 2005, LIA08-ztnorm). La méthode ap-porte un gain conséquent au niveau de la DCF et de l’EER.

4.3.3.3.2 Utilisation duLatent Factor Analysis

La figure 4.6 présente les courbes DET du système LIA08-ztnorm qui implémente la compensation de canal LFA. Le résultat du système de référence sans méthode de compensation est donné pour comparaison. La méthode du LFA apporte dans ce cas une amélioration de 36% relatif pour la mesure EER. La figure4.7 présente les résul-tats de l’utilisation de la méthode LFA appliquée dans l’espace des paramètres et selon la méthode desymmetrical compensation sur le système LIA08-ztnorm. La méthode sy-métrique surpasse la méthode de LFA appliquée dans l’espace des paramètres de 15%

pour la mesure DCF.

50 40 30

20

10

5

2

0.5

0.1

50 40 30 20 10 5 2 0.5 0.1

Miss probability (in %)

False Alarms probability (in %) (dcf:1.94,eer:4.42) LFA-feature-znorm (dcf:1.64,eer:4.21) LFA-symmetrique-znorm

FIG. 4.7 – Comparaison de l’application de la méthode LFA sur les paramètres (feature) et par la méthode symétrique. Z-norm est appliquée (NIST SRE 2005, LIA08-ztnorm). Il apparaît que la méthode LFA sur les paramètres est légèrement moins performante que la méthode LFA symétrique.

La surveillance de réseaux

professionnels de communication

Sommaire

5.1 Description des réseaux professionnels de communications . . . . . 79 5.2 Description du scénario opérationnel . . . . 80 5.3 La surveillance de réseaux professionnels de communications par la

RAL. . . . 81 5.3.1 Spécificités des réseaux professionnels de communication . . . 82 5.3.2 Spécificités du scénario . . . . 85 5.4 Quelques approches envisagées . . . . 87 Nous présentons dans ce chapitre une description des réseaux professionnels de communication et du scénario applicatif envisagé.

Nous exposons les diverses contraintes auxquelles nous devons répondre, notamment les dégradations du signal de parole, introduites par l’environnement d’utilisation par-ticulier de ces réseaux (facteur peu évalué en RAL). Ces contraintes sont induites par le matériel et les conditions d’utilisation spécifiques aux réseaux PMR, mais elles sont aussi induites par le scénario applicatif. Nous illustrons l’impact de ces contraintes sur notre système de RAL de référence. Enfin, quelques solutions à ces différentes contraintes sont détaillées.

5.1 Description des réseaux professionnels de communications

La structure des réseaux professionnels de communication (PMR, Private Mobile Ra-dio networks) est normalisée. Ces derniers reposent sur une architecture maillée com-mune à tout type de réseaux de communication. Les terminaux mobiles se connectent au réseau via des points d’accès sans-fil, appelés stations de base. Les liens entre les stations de base sont majoritairement filaires. Ceci permet notamment l’interception du

flux audio en de multiples points du réseau. Le schéma 5.1 représente ce type d’ar-chitecture. La chaîne complète de transmission, entre l’acquisition du signal sur le

FIG.5.1 –Illustration de l’infrastructure d’un réseau de communication professionnel type TETRA Digicom 25.

terminal mobile et la réception du flux sur le réseau, se décompose selon plusieurs traitements :

– l’acquisition du signal sur le terminal mobile,

– le codage à bas, ou très bas débit de la parole (entre 4,6kbit/s et 600 bits/s) , – la quantification des paramètres des codeurs,

– le codage canal pour la protection contre les erreurs.

Une spécificité singulière des réseaux PMR est le codage à bas débit de la parole. Le réseau GSM utilise un codeur à 13 kbit/s. Aujourd’hui, un codeur très employé sur les réseaux professionnels est le codeur MELP à 2.4 kbit/s [Supplee et al.,1997](décrit en section6.1.2.1.2). Des versions de ce codeur sont même disponibles en 1200 bit/s et 600 bit/s ; ce codage s’explique par la volonté de ne pas surcharger le réseau. D’autres trai-tements, comme le cryptage, sont souvent ajoutés et consomment alors plus de bande passante. Les faibles débit permettent aussi une plus grande portée du signal.