• Aucun résultat trouvé

Le probl` eme du vibrato

Chapitre 10

Introduction

10.1 Segmentation en caract´eristiques

L’objectif de la segmentation en caract´eristiques est d’indexer des segments de son – ou encore : de poser des ´etiquettes sur des segments de son – dont la taille soit de l’ordre de la seconde, ceci principalement dans le but d’aider `a la segmentation en notes ou en phones (ou, plus g´en´eralement, en zones stables) (voir la partie pr´ec´edente). D’abord, il s’agit de d´eterminer quelles fonctions d’ob-servation sont utilisables pour la segmentation en zones stables. Ensuite, pour certaines cat´egories de sons, il faut calculer certaines fonctions d’observation (l’extraction des fonctions d’observation est la premi`ere ´etape de la segmentation en zones stables) d’une fa¸con diff´erente de la fa¸con utilis´ee pour les sons (( simples )), c’est-`a-dire monophoniques, vois´es harmoniques et non modul´es.

Nous avons consid´er´e les caract´eristiques suivantes :

• Pr´esence ou absence de vibrato. Rappelons que le vibrato correspond `a une modulation de la fr´equence. La d´etection du vibrato est bas´ee soit directement sur l’analyse du signal sonore, soit sur l’analyse du trajet de f0. Si un vibrato est d´etect´e, nous d´eterminons ses param`etres (fr´equence, amplitude, phase). Voir les chapitres 11 `a 16.

• Pr´esence ou absence de tr´emolo. Rappelons que le tr´emolo correspond `a une modulation de l’amplitude. Si un tr´emolo est d´etect´e, nous d´eterminons ses param`etres (fr´equence, ampli-tude, phase). Il s’agit d’une perspective.

• Silence ou pr´esence de son. Il s’agit d’une perspective. Cette d´etection est bas´ee sur l’analyse du trajet de l’´energie. Mais, jugeant cette analyse insuffisante, nous la couplons `a l’analyse du taux de passage par z´ero. L’id´ee vient des consid´erations suivantes :

1. Pendant un silence, l’´energie est tr`es petite : en effet, est toujours pr´esent un bruit ; et, si nous faisons l’hypoth`ese que ce bruit est blanc, le taux de passage par z´ero est tr`es grand.

2. Si nous sommes en pr´esence d’un signal qui n’est pas du bruit et dont l’amplitude est tr`es faible (fin de la chute d’une note par exemple), l’´energie est tr`es petite, mais le taux de passage par z´ero lui aussi est petit.

Dans [MC98], une technique bas´ee seulement sur l’´energie est propos´ee. Dans [JEA99], une sorte d’inventaire ((( survey ))) des m´ethodes de d´etection des silences est donn´ee.

• Son harmonique ou inharmonique : cette d´etection est bas´ee sur l’analyse des indices d’in-harmonicit´e que nous avons d´efinis dans la partie pr´ec´edente.

• Son vois´e ou non vois´e : cette d´etection est bas´ee sur l’analyse des indices de voisement que nous avons d´efinis dans la partie pr´ec´edente.

Ce niveau de segmentation concerne donc l’´etiquetage de segments de sons avec ces caract´eristiques. Cet ´etiquetage a pour base l’extraction de fonctions d’observation. Certaines de ces fonctions d’ob-servation sont utilis´ees pour la segmentation en zones stables.

10.2 Le vibrato

Le cas du vibrato est d´evelopp´e en d´etails dans le reste de cette partie. Dans les chapitres suivants, nous nous attacherons aux probl`emes de la d´etection du vibrato, de l’estimation de ses param`etres, et de sa suppression sur le trajet de f0. L’absence ou la pr´esence de vibrato est l’une des ´etiquettes d´efinies dans la section 10.1. Le vibrato posant de grands probl`emes quand il s’agit de segmenter en zones stables, nous nous sommes particuli`erement int´eress´e `a la r´esolution de ces probl`emes.

10.2.1 Limite entre (( signal avec vibrato )) et (( signal sans vibrato ))

Dans [ZF81], pages 63 – 66, une limite psychoacoustique est donn´ee. Quand la valeur de l’am-plitude Avib de la modulation est plus petite qu’un certain seuil, elle n’est pas entendue. Il s’agit de ce qui est appel´e le seuil diff´erentiel de fr´equence. Ce seuil d´epend de la fr´equence f0 du son pur ((( pur )) veut dire parfaitement sinuso¨ıdal). Au-dessous de 500 Hz, il est `a peu pr`es ind´ependant de la fr´equence et vaut 1,8 Hz. Au-del`a de 500 Hz, il croˆıt `a peu pr`es lin´eairement avec la fr´equence f0 et vaut approximativement 3,5 10−3f0. Mais ce seuil d´epend aussi de la fr´equence de modula-tion fvib: les mesures que nous venons d’indiquer sont valables pour fvib= 4 Hz ; il d´epend aussi du niveau sonore ; et il vaut pour les sons purs, pas pour les sons complexes ((( complexe )) veut dire compos´e d’une somme de sinuso¨ıdes, de partiels harmoniques ou non). Nous n’avons donc pas utilis´e ce crit`ere pour la prise de d´ecision.

10.2.2 Plan de la partie

Nous pr´esentons dans le deuxi`eme chapitre (chapitre 11) de cette partie le probl`eme du vibrato.

Dans le troisi`eme chapitre (chapitre 12) de cette partie, les trois m´ethodes bas´ees sur l’analyse directe des signaux sonores que nous avons impl´ement´ees pour d´etecter le vibrato sont explicit´ees. Certaines d’entre elles nous permettent d’estimer les param`etres du vibrato.

Dans le quatri`eme chapitre (chapitre 13) de cette partie, les trois m´ethodes bas´ees sur l’analyse des trajets de f0 que nous avons impl´ement´ees pour d´etecter le vibrato sont explicit´ees. Certaines d’entre elles nous permettent d’estimer les param`etres du vibrato.

Dans le cinqui`eme chapitre (chapitre 14) de cette partie, nous discutons et comparons les performances de ces m´ethodes sur des signaux r´eels.

Nous pr´esentons dans le sixi`eme chapitre (chapitre 15) de cette partie la m´ethode de sup-pression du vibrato sur le trajet de f0(pour l’aide `a la segmentation en zones stables notamment) que nous avons utilis´ee.

Dans le septi`eme chapitre (chapitre 16) de cette partie les techniques de fusion de donn´ees utilis´ees dans le cas du vibrato sont introduites.

Chapitre 11

Le vibrato : pr´esentation du