Exp´ eriences

L’identification automatique des langues : m´ ethodes & approches

2.6 Le syst` eme du LIMSI [49]

2.6.2 Exp´ eriences

Les expériences ont été menées sur le corpus CallFriend pour une tâche de v´ eri-fication avec les mêmes contraintes que pour la campagne d’évaluation Nist 2003 (voir

§2.5).

La structure du système correspond à l’architecture PPRLM décrite plus haut (figure 2.3). Il y a trois décodeurs acoustico-phonétiques (anglais, espagnol et arabe). Chacun de ces décodeurs est entraˆıné avec des corpus différents. Pour l’espagnol et l’arabe, des conver-sations extraites du corpus CallHome (parole téléphonique conversationnelle, http:

//www.ldc.upenn.edu) sont utilisées. Pour l’anglais, il s’agit de conversations extraites deSwitchBoard(parole téléphonique conversationnelle,http://www.ldc.upenn.edu).

A la sortie de chacun des d´` ecodeurs, 12 mod`eles de langage tri-grammes (correspondant

a chacune des langues à reconnaˆıtre) sont entraˆınés sur les données d’apprentissage de

Callfriend. La décision est prise soit en moyennant les probabilités a posteriori obtenues pour chaque décodeur acoustico-phonétique soit en employant un réseau de neurones.

Les résultats sont résumés dans le tableau suivant :

Tab. 2.2 : Résultats (en taux d’erreur EER) du système de référence (PPRLM), du système employant les treillis de phones effectuant ou non la fusion des scores par réseaux de neurones

M´ethode 3s 10s 30s

R´ef´erence (PPRLM) 23,7 12,6 6,8 PPRLM (Treillis) 18,3 8,3 4,0 PPRLM (Treillis et RN) 18,3 7,9 2,7

Sur ces données, le système du LIMSI est actuellement le plus performant (2,7% d’EER par rapport à 2,8% pour le MIT (§2.5.2)). La principale différence entre ces deux approches est le temps de calcul nécessaire, beaucoup plus faible pour le LIMSI (0,5xRT contre 15*RT pour le MTI).

2.7 Conclusion

Ce panorama des systèmes actuels d’identification automatique des langues montre que soit les caractéristiques acoustiques des langues, soit les caractéristiques phonétiques ou phonotactiques sont privilégiées.

L’ensemble des sources d’information présentées au chapitre 1 n’est pas toujours pris en compte. La dimension prosodique, malgré l’intérêt certain qu’elle présente, n’est que marginalement employée, voire pas du tout lorsque l’objectif premier est la performance.

Lors de l’évaluationNist précédente de 1996, tous les systèmes présentés n’utilisaient que la modélisation phonotactique. Au cours de la dernière évaluation, nous avons pu voir une évolution, avec des systèmes employant des modélisations acoustiques, qui exploitent une autre source d’information. Les principales améliorations des performances sont dues : – au nombre de lois gaussiennes employé dans les MMG, qui a nettement augmenté, – à la création et l’adaptation de modèles UBM

– à l’émergence de nouveaux paramètres, les Shifted Delta Cepstra.

Dernièrement, le système du LIMSI montre que l’emploi de treillis de phones per-met d’obtenir des estimations des fréquences de n-grammes plus précises, ce qui offre de meilleures performances.

Nous allons voir dans le chapitre suivant quelques modélisations de certains aspects de la prosodie. Les systèmes présentés ne sont plus alors dirigés vers les performances mais sont établis dans une optique de vérifications de théories linguistiques.

Chapitre 3

L’identification automatique des langues : m´ ethodes & approches

prosodiques

Sommaire

3.1 Systèmes comparatifs . . . 54 3.1.1 Les travaux de Ramus . . . 54 3.1.2 Les travaux de Grabe . . . 55 3.1.3 Les travaux de Galves . . . 55 3.2 Systèmes descriptifs (intonation) . . . 57 3.2.1 Le système ToBI [119] . . . 58 3.2.2 Le système IViE [51] . . . 60 3.2.3 Modèle Intsint [60] . . . 62 3.2.4 Modèle de Fujisaki [42] . . . 63 3.2.5 Modèle de G˚arding [48] . . . 67 3.2.6 Modèle de Mertens [89] . . . 68 3.3 Systèmes applicatifs . . . 71 3.3.1 Modèle de Leavers [76] . . . 71 3.3.2 Modèle d’Itahashi [66] . . . 72 3.3.3 Le système de Cummins [24] . . . 74 3.3.4 Le système de Li [78] . . . 76 3.3.5 Modèle d’Adami [2] . . . 77 3.4 Conclusion . . . 79

C

ê chapitre est consacré aux approches prosodiques employées ou employables pour l’identification automatique des langues. Ces systèmes peuvent être classés en trois grandes catégories :

– les systèmes comparatifs, con¸cus dans le but de vérifier les hypothèses linguistiques de différences entre les langues (classes rythmiques, isochronie),

– les systèmes descriptifs, con¸cus pour prendre en compte les réalités perceptuelles et de production de parole, qui peuvent permettre de mettre en valeur des différences entre les langues,

– les syst`emes applicatifs, con¸cus dans un but d’am´elioration de performances en iden-tification des langues.

Les systèmes comparatifs sont consacrés à l’étude des différences rythmiques entre les langues. Le point faible de ces systèmes est le manque d’automatisation des processus (une segmentation et un étiquetage manuel sont souvent nécessaires), ce qui rend difficile les expériences portant sur des bases de données de taille importante.

Les systèmes applicatifs peuvent aussi bien prendre en compte des paramètres ryth-miques qu’intonatifs, voire corrélés à la fois au rythme et à l’intonation. Ces systèmes sont directement appliqués à des tâches d’identification des langues sur des bases de données conséquentes, et permettent ainsi de mesurer les apports de la modélisation de la proso-die. Cependant, le manque de lien avec des théories linguistiques nuit à l’intérêt de tels systèmes.

Les systèmes descriptifs sont uniquement con¸cus pour la représentation et la com-préhension des phénomènes prosodiques. Ils sont souvent appliqués à une seule langue, même si les recherches s’orientent de plus en plus vers des descriptions indépendantes de la langue. L’application de ces systèmes à plusieurs langues permet de visualiser les différences exploitables pour l’identification des langues.

Dans le document Caractérisation et identification automatique des langues ~ Association Francophone de la Communication Parlée (Page 73-78)

L’identification automatique des langues : m´ ethodes &amp; approches

2.6 Le syst` eme du LIMSI [49]

2.6.2 Exp´ eriences

2.7 Conclusion

Chapitre 3

L’identification automatique des langues : m´ ethodes & approches

prosodiques

Sommaire

C

L’identification automatique des langues : m´ ethodes & approches