• Aucun résultat trouvé

5.4 Situations litigieuses

5.4.3 Robustesse au bruit

La robustesse à un bruit rose sera testée ici. L'utilisation d'un bruit rose est justiée car la majorité de l'énergie d'un signal de parole se situe dans les basses fréquences. Un bruit blanc gaussien étend son énergie sur tout le spectre. Le bruit rose concentre son énergie dans les basses fréquences (fréquence de début de décroissance en -3dB par octave : 50Hz). Un bruit important doit nuire au niveau de la détection des partiels. Le rapport signal sur bruit ou SNR (Signal-to-Noise Ratio en anglais) est de 0dB ce qui signie que le bruit est de même intensité que le signal. Quand le bruit est rose, un tel SNR correspond à un signal assez bruité. La gure 5.36 présente la fonction PSH obtenue parPSHmin dans le graphique (c). Le graphique (a) est la fonction PUI qui est beaucoup plus bruitée que son équivalente sans bruit de la gure 5.22. La fonction MAQ est donnée dans le graphique (b). Les valeurs théoriques

Figure 5.36: Fonctions PUI, MAQ et PSH dePSHmin. Signal de parole réelle bipitch avec bruit rose de même intensité. (a) Fonction PUI. (b) Fonction MAQ. (c) Fonction PSH.

sont 110.6Hz et 289.6Hz. L'estimation par PSH donne 97.9Hz, 127.4Hz, 293.2Hz, 55.2Hz, 113.5 Hz.

Implémentations du principe de PSH

La précision est réduite à 2/5 et il faut attendre la troisième hypothèse pour trouver l'une des deux référencesF0. Si les signaux traités sont bruités, il faut augmenter le nombre d'hypothèses fournies par PSH garder une bonne estimation de F0.

5.5 Conclusions

Ce chapitre a présenté le principe d'un Peigne à Suppression Harmonique et deux implémentations particulières nomméesPSHminetPSHmul. Ces algorithmes trame-à-trame extraient le spectre d'ampli-tude de chaque trame, en construisent une fonction PUI quantiant la force de la structure harmonique de chaque fréquence dans un intervalle de recherche de F0. Les deux implémentations utilisent alors le principe de PSH par la combinaison des fonctions PDN et PDM aux diérents ordres. Les proprié-tés des PUI, PDN et PDM permettent d'atténuer les pics parasites de la fonction PUI. Les résultats obtenus sur des sons synthétiques et réels sont convaincants même dans des situations de mélanges à l'octave. Les limites des AEP fondés sur le principe de PSH sont de l'ordre des intensités des signaux mélangés et de la qualité des structures harmoniques du spectre d'amplitude. Dans le chapitre suivant, l'implémentationPSHmul est évaluée.

148

Chapitre 6

Évaluation de la qualité des AEP

6.1 Introduction

Après l'implémentation du principe de PSH, le souci a été d'évaluer nos AEP et de les comparer à l'existant. Le processus d'évaluation d'AEP a fait l'objet d'une publication [Signol et al., 2008] et l'article est donné en annexe E. Une procédure d'évaluation dépend très largement de l'application que l'on désire en faire. L'évaluation peut être simplement conçue comme un outil de mesure de performance d'un algorithme. Dans ce cas un seul algorithme est évalué à un instant donné. L'évaluation peut aussi être conçue comme un outil de mesure des améliorations apportées à un algorithme. Dans ce cas, l'évaluation devient comparative puisqu'elle compare les performances de diérentes versions d'un même algorithme au cours du temps. Enn, l'évaluation peut être conçue comme un outil de comparaison de diérents algorithmes. C'est le point de vue adopté et présenté dans ce chapitre. Il oblige à être équitable vis à vis de tous les algorithmes comparés. Cette équité impose le contrôle strict de l'ensemble des variabilités qui sont inhérentes au processus d'évaluation, des stimuli jusqu'aux spécicités des AEP. Tous les paramètres qui peuvent inuencer les résultats doivent être identiés et normalisés . Ce chapitre vise davantage à proposer des méthodologies d'évaluation comparative rigoureuses qu'à entrer dans la compétition simpliste décidant d'un meilleur et d'un plus mauvais AEP.

La première étape d'une évaluation concerne les signaux de parole mis en entrée des AEP qui doivent être évidemment les mêmes pour tous les AEP. Le choix des corpus doit être fait en fonction des caractéristiques des AEP. Il est évident que si un AEP n'est pas conçu pour traiter un certain type de signaux et qu'un des corpus en contient, il sera désavantagé. Chacun des corpus peut contenir des natures de parole diérentes. Il est donc nécessaire d'utiliser des corpus homogènes en termes de nature de signaux. Par exemple, fusionner les résultats d'évaluation sur des signaux de parole lue et de parole spontanée paraît déraisonnable. De plus, chaque corpus est enregistré de manière diérente et il est fort probable qu'il y ait des disparités d'intensité sonore. Il est donc nécessaire de procéder à une étape de normalisation d'intensité pour tous les signaux des corpus. Cette étape est d'autant plus importante que les signaux sont mélangés. La procédure de normalisation est détaillée dans le sous-paragraphe 6.5.1.2. La seconde étape concerne l'annotation des références F0 utilisée. Ces références doivent évidemment être les mêmes pour tous les AEP. Elles peuvent être construites manuellement ou bien automatiquement (cf. paragraphe 6.5.2). Ces deux premières étapes normalisent des paramètres

Évaluation de la qualité des AEP

qui sont indépendants du fonctionnement interne des AEP.

La troisième étape concerne les paramètres internes des AEP qu'il convient d'uniformiser au maxi-mum. Les paramètres qui doivent nécessairement être identiques pour tous les AEP sont les instants d'acquisition des hypothèses F0 et l'intervalle de recherche de la F0. Dans la mesure du possible, la durée des trames et les post-traitements utilisés dans certains AEP doivent être maitrisés mais cela n'est pas toujours possible.

La section 6.2 présente les métriques d'évaluation utilisées dans ce manuscrit. Ces métriques ont pour objectif de tester les deux processus inhérents à tout AEP : la décision voisé/non-voisé (ou décision VnV) prise sur chacune des trames et l'estimation deF0. Il est aussi important d'évaluer le processus de décision VnV que celui d'estimation deF0 car le premier aecte les résultats du second. La section 6.3 présente le lien étroit entre la quantication de la force de périodicité (ou force de voisement), la décision VnV et les résultats d'évaluation des AEP, mettant en évidence l'inuence de la décision VnV sur les résultats d'évaluation. Ceci nous amène à proposer plusieurs méthodologies évaluatives dans la section 6.4 valables dans toute situation monopitch et multipitch. La section 6.5 présente en détail la construction de l'annotation des référencesF0 qui ont servi à l'évaluation. Elle est réalisée de manière automatique. La section 6.6 présente les évaluations menées en situation monopitch. La section 6.7 présente les évaluations menées en situation bipitch.