• Aucun résultat trouvé

1.2 Techniques et mod`eles de synth`ese

1.2.1 Techniques bas´ees sur des signaux num´eriques

Nous regroupons sous cette cat´egorie, parfois ´egalement qualifi´ee de “domaine tempo-rel” (time-domain models), les techniques de synth`ese s’appuyant sur des signaux num´eriques (variation d’une valeur dans le temps – voir figure 1.2) donn´es initialement.

0 5 10 15 20 25 30 !0.06 !0.04 !0.02 0 0.02 0.04 0.06 Temps (ms)

Figure 1.2: Repr´esentation classique (amplitude / temps) d’une forme d’onde (ou d’un signal sonore).

Traitements num´eriques

Une forme d’onde num´eris´ee (dans un fichier ou sous forme d’un flux d’´echantillons) permet un certain nombre d’op´erations et traitements sur le signal sonore (retards, trai-tements de la dynamique, spatialisation, etc.) Dans la mesure o`u nous nous int´eressons `a la synth`ese de signaux, on pourra consid´erer tout type de traitement num´erique sur un signal sonore comme une forme particuli`ere de synth`ese, dont l’un des param`etres est un signal donn´e initialement.3

2

Afin de limiter le cadre de cette th`ese, et mˆeme si nous en donns ici une br`eve description et l’´evoquerons `

a quelques reprises dans les chapitres suivants, la synth`ese par mod`eles physiques ne sera cependant pas sp´ecifiquement trait´ee dans la suite de nos travaux.

3

Synth`ese par table d’onde

La table d’onde est une zone de m´emoire dans laquelle est stock´e un signal ´echantillonn´e. Celle-ci peut ˆetre tr`es simple (par exemple, les valeurs d’un sinus), ou contenir des signaux complexes (par exemple des valeurs al´eatoires, ou des sons enregistr´es). La lecture de cette table de valeurs, de mani`ere circulaire et avec une vitesse (ou un pas de lecture) variable permet d’obtenir un signal p´eriodique, dont la fr´equence est un rapport entre la dur´ee et la fr´equence d’´echantillonnage du signal contenu dans la table et ce pas de lecture. Cette technique est utilis´ee notamment pour cr´eer des oscillateurs num´eriques (voir figure 1.3).

Figure 1.3: Table d’onde. Cette table contient 24 valeurs permettant d’approximer, en lecture cyclique, un signal sinuso¨ıdal (figure du haut). Le parcours cyclique de la table avec diff´erents “pas de lecture”, ou intervalles entre deux valeurs pr´elev´ees dans le tableau (3, dans le cas repr´esent´e en bas), permet de contrˆoler la p´eriodicit´e du signal produit en sortie.

La figure 1.3 montre que la lecture de la table avec diff´erents pas de lecture permet de g´en´erer des signaux de diff´erentes p´eriodicit´es. Un simple facteur multiplicatif per-met ensuite de contrˆoler l’amplitude de ces signaux : on dispose alors d’un oscillateur num´erique, g´en´erateur de signaux p´eriodiques, contrˆolable par deux param`etres (ampli-tude et fr´equence). L’utilisation simultan´ee de plusieurs oscillateurs permettra de g´en´erer des sons complexes par synth`ese “additive” (voir section 1.2.2).

Sampling

Le sampling, ou ´echantillonnage, repose sur le principe de la table d’onde. Litt´era-lement, ´echantillonner un signal signifie effectuer une discr´etisation de celui-ci avec une p´eriode donn´ee (e.g. prendre un ´echantillon – une valeur – toutes les n microsecondes). On parle d’´echantillonnage comme m´ethode de synth`ese lorsque l’on utilise des tables d’ondes

contenant des sons num´eris´es (il s’agit donc g´en´eralement de tables de taille beaucoup plus importante que dans le cas de la figure 1.3).

Cette technique est notamment utilis´ee dans de nombreux synth´etiseurs du commerce, permettant la reproduction de timbres `a partir de sons pr´e-enregistr´es, et r´epondant g´en´eralement `a un contrˆole de type midi4 (par exemple `a partir d’un clavier). Un son est alors produit par “variation” autour d’un timbre donn´e selon des hauteurs, dur´ees, et nuances d’intensit´es voulues.

Dans ces syst`emes, des sons de r´ef´erence sont donc num´eris´es et stock´es en m´emoire. Ils sont ensuite transpos´es (variation de la vitesse de lecture de la table) et adapt´es en am-plitude pour atteindre les hauteurs et nuances vis´ees. G´en´eralement, les d´eformations pro-duites par des transpositions excessives d´et´eriorent de fa¸con notable la qualit´e du timbre (ou du moins sa ressemblance avec le timbre original). De mˆeme, les instruments tradi-tionnels (acoustiques) pr´esentent souvent des timbres tr`es diff´erents selon l’intensit´e avec laquelle ils sont jou´es. Dans la pratique, on utilise donc pour un mˆeme timbre un cer-tain nombre de sons (correspondant `a diff´erentes plages de hauteurs et de nuances) `a partir desquels un son particulier est calcul´e par interpolation. Les sons sont par ailleurs g´en´eralement segment´es en parties (attaque, partie stable, relˆache). Les parties d’attaque sont caract´eristiques de nombreux timbres instrumentaux, et leur dur´ee est donc main-tenue constante alors que la lecture de la table peut “boucler” sur la partie centrale et stable du son pour atteindre la dur´ee souhait´ee (ou attendre le relˆachement de la touche s’il s’agit d’un clavier).

La synth`ese par ´echantillonnage permet donc de simuler des sons instrumentaux ou de reproduire des sons pr´eexistants en les contrˆolant “note par note”. Elle ne permet donc pas, en principe, d’appr´ehender des notions comme les transitions entre ces notes et la “prosodie” des s´equences et des sons g´en´er´es. Ceci peut ˆetre rem´edi´e partiellement grˆace `

a la synth`ese par “diphones”, qui utilise ´egalement des ´echantillons pour les transitions entre paires de phon`emes (`a l’origine dans les applications pour la parole) ou de notes (dans les extensions aux sons musicaux).

M´ethodes concat´enatives

Egalement bas´ees sur des signaux pr´eexistants, les m´ethodes de synth`ese concat´e-natives utilisent des bases d’´echantillons sonores, stock´ees en m´emoire ou g´en´er´ees `a partir de segmentation de signaux donn´es en entr´ee du processus de synth`ese, pour reconstituer de nouveaux signaux. Ces m´ethodes sont donc g´en´eralement coupl´ees `a des techniques complexes pour la segmentation, l’analyse, la s´election des signaux (voir par exemple [Schwartz, 2004]).

4

Midi (Musical Instrument Digital Interface) est un format standard permettant la communication de donn´ees entre les dispositifs et programmes musicaux. Une description plus d´etaill´ee se trouve dans le chapitre 7, section 7.3.

La m´ethode de synth`ese PSOLA (Pitch Synchronous OverLap-Add ) [Charpentier et Stella, 1986], utilis´ee pour l’analyse et la synth`ese de la parole princi-palement, se base sur des techniques avanc´ees de segmentation de signaux afin d’en re-synth´etiser des nouveaux, par recombinaison, transformations et r´eint´egration des seg-ments.5

Cette m´ethode a ´egalement ´et´e ´etendue et utilis´ee pour les sons musicaux [Peeters, 1998].