• Aucun résultat trouvé

Les consonnes nasales et les semi-consonnes Fongbe

3.2 Structure acoustique des consonnes

3.2.3 Les consonnes nasales et les semi-consonnes Fongbe

On distingue trois consonnes nasales en Fongbe. Il s’agit des consonnes / m/, / n/ et / N/ qui sont respectivement produites dans les zones bilabiales, alvéolaires et palatales de la bouche. Leur configuration articulatoire indique le passage de l’air par les fosses nasales pendant que le voile du palais est abaissé. Ce qui les rends comparables aux occlusives sonores du point de vue articulatoire [59]. Ainsi elles se réalisent avec les fréquences fondamentales les plus faibles comparées aux occlusives sonores. Comparées aux autres consonnes du système consonantique du Fongbe, les consonnes nasales sont produites avec l’intensité la plus faible de la voix et constituent avec les semi-consonnes les moins brèves dans la prononciation. La réalisation des semi-consonnes s’effectuent avec presque les mêmes rythmes de vibration périodique des cordes vocales (valeurs de pitch) et la même pression sous-glottique (intensité) que les occlusives sonores.

Figure 3.2 – Les valeurs pitch par consonnes.

Conclusion

Cette étude s’est intéressée à la production des sons du Fongbe en contexte isolé. La configuration acoustique des voyelles révèle une large variation des trois premiers for-mants dont les fréquences dépendent fortement de la configuration articulatoire de chaque

Figure 3.3 – L’intensité de chaque phonème consonne.

voyelle. Le triangle vocalique reste conforme à la configuration articulatoire du système vocalique du Fongbe. Il montre que les voyelles du Fongbe occupent un large espace acous-tique. Pour décrire acoustiquement les consonnes du Fongbe, nous avons basé notre étude sur la vibration périodique des cordes vocales, la durée de prononciation et la pression sous-glottique. L’étude réalisée dans ce chapitre permet l’élaboration d’une référence sur les caractéristiques acoustiques des sons du Fongbe. Cette référence a été, par la suite, exploitée pour proposer une recette complète d’algorithmes depuis la segmentation de la parole à la reconnaissance de phonèmes dans un signal de parole continue [57].

Reconnaissance automatique des

phonèmes du Fongbe dans un contexte

isolé

"adö t´O bö nya ąé yí jon´O azön atön bö asitön gbe ado e ma kple bo wà à ´O, e nö kplé bo ąu a"

Sommaire

4.1 Etat de l’art . . . 61 4.1.1 La classification de phonèmes . . . 61 4.1.2 Méthodes de fusion de décisions . . . 63 4.2 Algorithmes et méthodes de classification . . . 64 4.2.1 Le classifieur bayésien naïf . . . 64 4.2.2 La quantification vectorielle à apprentissage ou LVQ . . . . 65 4.3 Architecture proposée pour la classification de phonèmes 67 4.3.1 Vue globale du système proposé . . . 67 4.3.2 Fusion de décisions par simple moyenne pondérée . . . 69 4.3.3 Fusion de décisions basée sur la logique floue . . . 69 4.3.4 Fusion de décisions basée sur les DBNs . . . 72 4.4 Evaluation de performances : résultats expérimentaux . . 73 4.4.1 Première étape - résultats des classifications . . . 74

4.4.2 Seconde étape - fusion de décisions des classifieurs . . . 76 4.4.3 Analyse de performance . . . 76

Introduction

La Reconnaissance de phonèmes est un processus intégré au système de reconnaissance automatique de la parole spontanée ou continue. Depuis les années 60, des progrès de re-cherche significatifs, liées au développement de méthodes statistiques et de techniques d’intelligence artificielle, ont essayé de surmonter les problèmes d’analyse et de caracté-risation du signal de parole. L’un des problèmes majeurs est la spécificité acoustique et linguistique des différentes langues.

L’objectif d’un système de reconnaissance de la parole est de convertir le signal acous-tique en un ensemble de mots à partir d’une segmentation du signal en petites unités phonétiques ou syllabiques. La reconnaissance de phonèmes, une composante du système de reconnaissance de la parole, est un processus par lequel on caractérise un segment de signal parlé par une empreinte phonétique. Ainsi pour obtenir de bonnes performances de reconnaissance, la reconnaissance de phonèmes doit être bien réalisée dans le but de produire des connaissances acoustiques des phonèmes d’une langue donnée. Il faut noter que, la reconnaissance de phonèmes est utilisée dans de nombreuses applications telles que la reconnaissance de la parole et du locuteur, l’indexation du locuteur, la synthèse vocale etc.

Dans ce chapitre, nous proposons une approche de reconnaissance de phonèmes isolés du Fongbe en utilisant plusieurs classifieurs. Elle traite particulièrement de la fusion de décisions provenant de deux classifieurs différents à savoir : le bayésien naîf et la quantifica-tion vectorielle à apprentissage (LVQ). Depuis les années 60, la combinaison de classifieurs a été l’un des axes de recherche les plus soutenus dans le domaine de la reconnaissance de formes. Depuis lors, des methodes de fusion de décisions ont été appliquées avec succès dans divers domaines tels que la reconnaissance et la vérification de signatures, la recon-naissance et l’identification de visages ou encore l’analyse d’images médicales. Elle a été introduite dans la reconnaissance automatique de la parole pour reconnaitre les phonèmes, la parole, l’âge et le genre d’un locuteur et pour identifier avec de bonnes performances une langue donnée. L’idée derrière la proposition dans ce chapitre est de construire un système discriminatoire robuste de phonèmes consonnes et voyelles à partir d’une com-binaison intelligente de classifieurs basée sur la fusion de décisions [60, 5]. Pour ce faire, nous avons étudié la performance, des approches paramétriques (utilisant les DNNs) et

non-paramétriques (utilisant une combinaison pondérée) et une approche adaptative uti-lisant la logique floue que nous avons proposée. Cette fusion intelligente de décisions utilise les coefficients acoustiques MFCC, PLP et Rasta-PLP qui ont été d’abord fusionné avant d’etre appliqués aux classifieurs afin de fournir une identité phonétique des sons du Fongbe. Pour finir, les expériences ont été réalisées sur le corpus FongbePhones-FLDataset dont les résultats présentés dans ce chapitre ont révélé de meilleures performances avec la méthode de fusion floue proposée.

4.1 Etat de l’art

Le travail présenté dans ce chapitre traite de deux questions différentes à savoir : la fusion intelligente de décisions dans un contexte de multi-classification et la classification de phonèmes. Dans cette section, nous présentons un bref aperçu des théories et recherches récentes liées à la fusion de décisions et à la classification de phonèmes dans lesquelles nous positionnons l’approche que nous proposons.