Techniques bas´ees sur des signaux num´eriques

1.2 Techniques et mod`eles de synth`ese

1.2.1 Techniques bas´ees sur des signaux num´eriques

Nous regroupons sous cette catégorie, parfois également qualifiée de “domaine tempo-rel” (time-domain models), les techniques de synthèse s’appuyant sur des signaux numériques (variation d’une valeur dans le temps – voir figure 1.2) donnés initialement.

0 5 10 15 20 25 30 !0.06 !0.04 !0.02 0 0.02 0.04 0.06 Temps (ms)

Figure 1.2: Repr´esentation classique (amplitude / temps) d’une forme d’onde (ou d’un signal sonore).

Traitements num´eriques

Une forme d’onde numérisée (dans un fichier ou sous forme d’un flux d’échantillons) permet un certain nombre d’opérations et traitements sur le signal sonore (retards, trai-tements de la dynamique, spatialisation, etc.) Dans la mesure où nous nous intéressons à la synthèse de signaux, on pourra considérer tout type de traitement numérique sur un signal sonore comme une forme particulière de synthèse, dont l’un des paramètres est un signal donné initialement.3

Afin de limiter le cadre de cette thèse, et même si nous en donns ici une brève description et l’évoquerons `

a quelques reprises dans les chapitres suivants, la synthèse par modèles physiques ne sera cependant pas spécifiquement traitée dans la suite de nos travaux.

Synth`ese par table d’onde

La table d’onde est une zone de mémoire dans laquelle est stocké un signal échantillonné. Celle-ci peut être très simple (par exemple, les valeurs d’un sinus), ou contenir des signaux complexes (par exemple des valeurs aléatoires, ou des sons enregistrés). La lecture de cette table de valeurs, de manière circulaire et avec une vitesse (ou un pas de lecture) variable permet d’obtenir un signal périodique, dont la fréquence est un rapport entre la durée et la fréquence d’échantillonnage du signal contenu dans la table et ce pas de lecture. Cette technique est utilisée notamment pour créer des oscillateurs numériques (voir figure 1.3).

Figure 1.3: Table d’onde. Cette table contient 24 valeurs permettant d’approximer, en lecture cyclique, un signal sinuso¨ıdal (figure du haut). Le parcours cyclique de la table avec différents “pas de lecture”, ou intervalles entre deux valeurs prélevées dans le tableau (3, dans le cas représenté en bas), permet de contrôler la périodicité du signal produit en sortie.

La figure 1.3 montre que la lecture de la table avec différents pas de lecture permet de générer des signaux de différentes périodicités. Un simple facteur multiplicatif per-met ensuite de contrôler l’amplitude de ces signaux : on dispose alors d’un oscillateur numérique, générateur de signaux périodiques, contrôlable par deux paramètres (ampli-tude et fréquence). L’utilisation simultanée de plusieurs oscillateurs permettra de générer des sons complexes par synthèse “additive” (voir section 1.2.2).

Sampling

Le sampling, ou échantillonnage, repose sur le principe de la table d’onde. Littéra-lement, échantillonner un signal signifie effectuer une discrétisation de celui-ci avec une période donnée (e.g. prendre un échantillon – une valeur – toutes les n microsecondes). On parle d’échantillonnage comme méthode de synthèse lorsque l’on utilise des tables d’ondes

contenant des sons numérisés (il s’agit donc généralement de tables de taille beaucoup plus importante que dans le cas de la figure 1.3).

Cette technique est notamment utilisée dans de nombreux synthétiseurs du commerce, permettant la reproduction de timbres à partir de sons pré-enregistrés, et répondant généralement à un contrôle de type midi4 (par exemple à partir d’un clavier). Un son est alors produit par “variation” autour d’un timbre donné selon des hauteurs, durées, et nuances d’intensités voulues.

Dans ces systèmes, des sons de référence sont donc numérisés et stockés en mémoire. Ils sont ensuite transposés (variation de la vitesse de lecture de la table) et adaptés en am-plitude pour atteindre les hauteurs et nuances visées. Généralement, les déformations pro-duites par des transpositions excessives détériorent de fa¸con notable la qualité du timbre (ou du moins sa ressemblance avec le timbre original). De même, les instruments tradi-tionnels (acoustiques) présentent souvent des timbres très différents selon l’intensité avec laquelle ils sont joués. Dans la pratique, on utilise donc pour un même timbre un cer-tain nombre de sons (correspondant à différentes plages de hauteurs et de nuances) à partir desquels un son particulier est calculé par interpolation. Les sons sont par ailleurs généralement segmentés en parties (attaque, partie stable, relâche). Les parties d’attaque sont caractéristiques de nombreux timbres instrumentaux, et leur durée est donc main-tenue constante alors que la lecture de la table peut “boucler” sur la partie centrale et stable du son pour atteindre la durée souhaitée (ou attendre le relâchement de la touche s’il s’agit d’un clavier).

La synthèse par échantillonnage permet donc de simuler des sons instrumentaux ou de reproduire des sons préexistants en les contrôlant “note par note”. Elle ne permet donc pas, en principe, d’appréhender des notions comme les transitions entre ces notes et la “prosodie” des séquences et des sons générés. Ceci peut être remédié partiellement grâce `

a la synthèse par “diphones”, qui utilise également des échantillons pour les transitions entre paires de phonèmes (à l’origine dans les applications pour la parole) ou de notes (dans les extensions aux sons musicaux).

M´ethodes concat´enatives

Egalement basées sur des signaux préexistants, les méthodes de synthèse concaté-natives utilisent des bases d’échantillons sonores, stockées en mémoire ou générées à partir de segmentation de signaux donnés en entrée du processus de synthèse, pour reconstituer de nouveaux signaux. Ces méthodes sont donc généralement couplées à des techniques complexes pour la segmentation, l’analyse, la sélection des signaux (voir par exemple [Schwartz, 2004]).

Midi (Musical Instrument Digital Interface) est un format standard permettant la communication de données entre les dispositifs et programmes musicaux. Une description plus détaillée se trouve dans le chapitre 7, section 7.3.

La méthode de synthèse PSOLA (Pitch Synchronous OverLap-Add ) [Charpentier et Stella, 1986], utilisée pour l’analyse et la synthèse de la parole princi-palement, se base sur des techniques avancées de segmentation de signaux afin d’en re-synthétiser des nouveaux, par recombinaison, transformations et réintégration des seg-ments.5

Cette méthode a également été étendue et utilisée pour les sons musicaux [Peeters, 1998].

Dans le document La synthèse sonore en composition musicale assistée par ordinateur : modélisation et écriture du son (Page 35-38)