• Aucun résultat trouvé

Le principe de Peigne à Suppression Harmonique (PSH) repose sur l'annulation des pics parasites des fonctions de pitch qui a été présenté dans [Liénard et al., 2008]. Il consiste à traiter isolément l'atténuation de chacun des pics parasites en utilisant les PDN et PDM à diérents ordres. En com-binant les résultats obtenus par chacun des PDN et PDM de tous ordres, il est possible de réduire considérablement l'amplitude des pics parasites. Les quatre points suivants présentent l'essence de PSH.

1. Calcul de la fonction PUI

2. Calcul des fonctions P DN∆à diérents ordres premiers 3. Calcul des fonction P DM∆à diérents ordres premiers

4. Calcul d'une fonction de sélection des pics F0 par combinaisons des fonctions PUI, P DN∆ et P DM∆

Plusieurs implémentations de PSH existent et toutes respectent ces quatre étapes. Une implémentation possible nomméePSHmin et décrite dans le chapitre 5 paragraphe 5.2.2 donne les résultats suivants en situations monopitch et multipitch sur les exemples utilisés dans ce chapitre.

4.6.1 Situation monopitch

En situation monopitch, le graphique (a) de la gure 4.43 présente la fonction PUI avec correc-tion hyperbolique et le graphique (b) présente la fonccorrec-tion PSH obtenue par l'algorithme PSHmin (cf.

chapitre 5 paragraphe 5.2.2) en n'utilisant que les PDN et PDM d'ordre 2 et 3. La fonction PSH est calculée à partir du minimum des fonctions PDN2, PDN3, PDM2 et PDM3. Le résultat, certes obtenu

Figure 4.43: Comparaison des fonctions PUI et de la fonction PSH en situation monopitch. (a) Fonction PUI avec correction hyperbolique. (b) fonction PSH.

sur un spectre idéal, est clair. Le pic enF0 émerge très largement du reste et la fonction PSH est faci-112

Peignes spectraux pour l'estimation conjointe de F0 multiples lement utilisable. Seuls quelques pics parasites de très faibles amplitudes subsistent et principalement dans les basses fréquences. Il convient maintenant d'observer si ce principe est robuste en situation multipitch.

4.6.2 Situation bipitch

Figure 4.44: Comparaison des fonctions PUI et de la fonction PSH en situation bipitch. (a) Fonction PUI avec correction hyperbolique. (b) fonction PSH.

En situation bipitch, le graphique (a) de la gure 4.44 présente la fonction PUI avec correction hy-perbolique et le graphique (b) présente la fonction PSH obtenue par l'algorithmePSHminen n'utilisant que les PDN et PDM d'ordre 2 et 3. Là encore, le résultat est convaincant et les pics de F01 et F02

sont clairement émergent impliquant que la fonction PSH est facilement exploitable. Il faut toutefois être prudent car l'amplitude et le nombre des pics parasites ont augmentés par rapport à la situation monopitch et le spectre étudié est idéal.

4.6.3 Situation 4-pitch

En situation 4-pitch, le graphique (a) de la gure 4.45 présente la fonction PUI avec correction hy-perbolique et le graphique (b) présente la fonction PSH obtenue par l'algorithmePSHminen n'utilisant que les PDN et PDM d'ordre 2 et 3. Le résultat est plus nuancé que les précédents et le pic parasite en 400Hz reste important. Il reste cependant très prometteur puisque l'estimation de F0 est correcte.

Il faut observer la diminution des pics en 200Hz et 240Hz par rapport à leurs originaux du graphique (a). Ce point nuit à l'estimation de F0 et son explication reste une piste à explorer dans l'utilisation des PDN et PDM. Les relations (p, q) entre les F0 mélangées ainsi que le nombre d'harmoniques de chacune des structures harmoniques jouent certainement un rôle important mais ce point n'a pas pu être clairement démontré.

L'utilisation combinée des PDN et PDM aux ordres 2 et 3 permet de donner de bons résultats

Peignes spectraux pour l'estimation conjointe de F0 multiples

Figure 4.45: Comparaison des fonctions PUI et de la fonction PSH en situation 4-pitch. (a) Fonction PUI avec correction hyperbolique. (b) fonction PSH.

d'atténuation des pics parasites quelque soit la situation étudiée. Ces résultats sont certes obtenus sur des spectres idéaux mais le chapitre 6 d'évaluation montre que le principe de PSH est utilisable sur des signaux de parole superposée bipitch réels. Les performances obtenues sur des mélanges réels sont largement à la hauteur de l'état de l'art.

4.7 Conclusions

Le chapitre commence par l'analyse du comportement de l'estimation de F0 multiples par des peignes fréquentiels élémentaires PUI, PUF, PDI et PDF. Lorsque le spectre d'amplitude n'est pas de moyenne nulle, la fonction de pitch obtenue par un de ces peignes possèdent un comportement hyperbolique très gênant pour l'estimation de F0. La correction hyperbolique s'eectue en annulant la moyenne du spectre d'amplitude. Les pics d'une fonction de pitch ne sont pas positionnés de ma-nière aléatoire mais suivent une règle déterminée. L'indexation (p, q) permet d'en donner la position fréquentielle exacte par rapport à la valeur de la F0. Le pic (p, q) est de fréquence (p/q)F0 avec p, q entiers non nuls et premiers entre eux. Deux familles de peignes sont nalement présentées : les peignes à dents négatives (PDN) et les peignes à dents manquantes (PDM). Les PDN permettent, en fonction de leur ordre ∆, de supprimer les pics parasites de type (∆p, q) avec (∆p/q) irréductible. Les PDM permettent, en fonction de leur ordre∆, de supprimer les pics parasites de type(p,∆q) avec (p/∆q) irréductible. Il doit donc être possible, à partir de ces deux familles de peignes et en les utilisant à diérents ordres, de supprimer sélectivement les pics parasites de la fonction de pitch d'un AEP.

Ce chapitre tend à montrer la faisabilité d'un algorithme d'estimation conjointe de F0 multiples par l'utilisation de plusieurs peignes spectraux.

114

Chapitre 5

Implémentations du principe de PSH

5.1 Introduction

Le principe de Peigne à Suppression Harmonique décrit dans le chapitre 4 a été présenté dans [Lié-nard et al., 2008]. Le principe de PSH est de combiner les fonctions PDN et PDM aux diérents ordres an de réduire l'amplitude des pics parasites tout en conservant les pics F0 à estimer. Ce chapitre décrit dans le détail deux implémentations diérentes du principe de PSH. Les deux implémentations prennent en entrée un signal de parole quelconque et un certain nombre de paramètres donnés par l'utilisateur. Les algorithmes analysent le signal par trames successives. La sortie des algorithmes est un chier texte contenant les hypothèses F0 estimées pour chacune des trames du signal. Le chier contient également l'amplitude de chaque hypothèse et la force de périodicité de chacune des trames. La première implémentation est nommée PSHmul et la seconde est nommée PSHmin.PSHmul a été conçu et optimisé pour être le plus performant possible sur des signaux de parole superposée réelle tout en étant le plus rapide possible. PSHmin est une version pédagogique du principe de PSH. C'est à partir de cette version que sont obtenues tous les graphiques de ce manuscrit.PSHmin a été construite à partir de considérations théoriques et n'a pas été optimisée. La section 5.2 détaille le fonctionnement des deux implémentations et en donne les diérences. La section 5.3 présente les résultats obtenus parPSHminetPSHmuldans les situations monopitch, bipitch et 4-pitch sur des trames synthétiques et sur des trames de parole réelle. La section 5.4 présente les situations dans lesquelles nos AEP sont en diculté pour estimer correctement lesF0. Enn, la section 5.5 présente les conclusions de ce chapitre.