• Aucun résultat trouvé

( ) ( )

(z A z S z

E  III.13

Ce qui revient à convoluer les coefficients aka[n] avec le signal s[n] : ]

[ ] [ ]

[n a n s n

e   III.14

Lesignal d’excitation e[n]est la convolution du filtre tous pôles avec le signal s[n]connus.

III.2.6.5 Autocorrélation de e[n] :

On a vu que le signal d’excitation est périodique si le son est voisé et aléatoire dans le cas contraire. Comme le signal est passablement bruité, la recherche de la période est grandement facilitée si onl’effectue sur la fonction d’auto -corrélation de e[n] plutôt que sur le signal lui-même. Le résultat de l’auto -corrélation est un vecteur symétrique de longueur 2N avec un maximum en son milieu. Alors on limite le calcul du maximum dans une seule partie du signal d’auto corrélation (Ex : partie droite) en suite on recherche du premier pic latéral compris entre 0.0020 (1/500hz) sec et 0.0200 sec (1/50hz),d’autres pics distants de la valeur du pitch seront présents. Pour trouver ce dernier, il suffit donc de mesurer cette distance.

III.2.6.6 Estimation de la fréquence fondamentale :

La fréquence fondamentale s’obtient par le maximum de la fonction d’autocorrelation du signal vocal

La valeur du fondamental estimée est alors [12]:

III.15 Où Fs est la fréquence d’échantillonnage

m : l’échantillons qui correspond au maximum.

F0= Fs/m

III.2.6.7 Critère de décision voisé / non voisé :

Le maximum qui correspond au éventuel pitch que l’on vient de trouver n’est pas nécessairement significative d’un son voisé.

Si le son n’est pas voisé, ce maximum est peu marquer. Par contre, dans le cas des sons voisés, le premier pic latéral vaut généralement plus du tiers du maximum central [12]. C’est finalement ce critère qui est utilisé pour déterminer si le son est voisé ou non.

On note que Cette méthode de décision V/NV est applicable seulement avec la méthode d’atocorrélation,mais n’est pas applicable avec toutes les méthodes.

III.2.7 Méthodes de décision (voisé /non voisé) :

La détection de pitch est dépend essentiellement d’un efface décision voisement non voisement (V/NV). On présente quelque méthode à utiliser.

III.2.7.1 Plus du tiers du maximum central :

Cette méthode efficace est utilisée avec la méthode d’autocorrélation. L’inconvénient essentiel,est qu’elle s’applique au bout d’algorithme ce qui résulte un temps de calcul en plus.

III.2.7.2 Le taux de passage par zéros (PPZ) et énergie de signal :

En rappel (voire chapitre I), les sons voisés contrairement aux sons non voisés présentant d’avantage d’énergie vers les basses fréquences, ainsi le taux de passage par zéro pour un segment de signal constitue un deuxième indicateur de V/NV.

III.2.7.3 Méthode SFM (Spectral Flatness Measure):

L’une des méthodes pour détecter les sections voisé / non voisé de la parole est la mesure de l'égalité spectrale (Spectral flatness mesure). Est une méthode efficace de V/NV inspiré de la géométrie de signal. L'égalité spectrale fait usage de la propriété que le spectre du bruit pur est supposé être plat. En d'autres termes, le spectre de section non voisé est plat et le spectre de section voisé est moins plat. La mesure de l'égalité spectrale « SFM » (voire aussi l’équation I.3) est donnée par [13]:

m m

A

SFM  G

III.16

Il est important d’éclairer qu’il y a plusieurs méthode de détectionde pitch ont utilisé cette méthode de décision V/NV, mais toutes ces méthodes s’appuient sur un seuil définit

primitivement. Il y a beaucoup de générations de SFM mais souvent s’appuie sur un seuil définit primitivement (Voir références [17], [18]).

III.2.8 Nouvelle méthode de décision (V /NV) applicable avec toutes les méthodes:

Bien que le taux de passage par zéros pour un son voisé est peut marquer par rapport au son non voisé, par contre contient une énergie grande .Donc le rapport énergie/ZCR est grands par rapport au son non voisé. Alors on peut exploiter cette notion énergie/ZCR pour la détection d’un son voisé ou non. Il est important d’éclairerqui’ il y a des articles qui adoptent cette méthode mais le problème est le seuil (EZR : energy-to-zero crossing rate) [7]:

] [

] ] [

[ 0

m ZCR

m m E

EZRIII.17

Où ZCR [m] présents le taux de passage par zéro pour une trame [m], et E0[m] est l’énergie moyenne de la trame [n, m] (n : échantillon, m : trame). Le paramètre présenté EZR [m] est appliqué comme critère de décision voisé / non voisé. L'EZR [m] sera par conséquent relativement bas dans les régions non voisées du signal de la parole et inversement pour les régions voisées. La Figure III.5qui exprime le spectre d’un signal avec un bruit de fond, ainsi illustre l’énergie de ce signal illustre l’énergie pour un signal.

La décision voisé / non voisé (VUV [m]) pour une trame ‘m’est estimé par comparaison d'EZR [m] avec un seuil v de la base de données de signal concerné [7] :

If EZR [m] >νThen

VUV [m]=1 (son voisé) III.18

Else VUV[m]=0 (son non voié)

Donc la méthode suppose un seuil, si pour une trame le rapport EZR[m] atteint ou dépasse ce seuil alors cette trame est considérée voisé.

Problème :

Quel est le seuil optimal à utiliser ?

Solution : Pour notre travaille on propose une méthode de décision voise/non voisée met au début d’algorithmes avec un seuil adaptatif se change au cours de signal parole sans intervention parl’utilisateur se quisignifie la possibilitéd’implantationen temps réel.

Dans notre nouvelle méthode, le seuil est calculé automatiquement et placé au début d’algorithme de détection de pitch ce qui résulteun temps réduit.

%valeur initiales Rapport_EZR =1;

seuil=1;

(10) Détection V/NVpour la « i »eme trame : Calcul de l’énergie ‘E’

Calcul de ‘ZCR’

Calcul d’EZR SiEZR>seuil

Un son voisé

Estimation de pitch Sinon

Un son non voisé Fin si

% Création des vecteurs de sorties max_rapport=max(rapport_EZR);

min_rapport=min(rapport_EZR);

delta=max_rapport-min_rapport;

seuil=min_rapport+0.2*delta;

rapport_EZR = [EZR];

% Terminaison Aller à (10)

III.2.8.1 Procédure de la méthode : La procédure est comme suit : 1. acquisition du signal

2. extraction dela ‘’i‘’ èmé trame et décision V/NV basée sur un seuil calculé par l’algorithme (on choisit seuil=1, seulement pour la première trame).

3.calcul d’énergie et le passage par zéro et par suite l’EZR 4. si EZR >seuil alors: l’estimation de pitch sinon on passe à l’tape5.

5. calcul de maximum et de minimum d’EZRdes trames.

6. calcul de la différence entre le maximum EZR et le minimum d’EZR, on le nommer « Delta » :

III.19